Typischer Ablauf im Reinforcement Learning für die THT-Bestückung.

Typischer Ablauf im Reinforcement Learning für die THT-Bestückung. (Bild: TU Dortmund)

ABB YuMi Roboter
Demonstrator am IPS. Der ABB YuMi Roboter übernimmt die Handhabung. Die Kameras und die Drucksensoren liefern Beobachtungen für den Algorithmus. (Bild: TU Dortmund)

Leiterplatten sind das Herzstück von elektronischen Geräten. In der heutigen Elektronikfertigung kommen Surface Mount Technology (SMT) und Through Hole Technology (THT) zum Einsatz, um Leiterplatten zu bestücken. Viele aktuelle Anwendungsbereiche stellen hohe Anforderungen hinsichtlich möglicher Lastaufnahmen, Beständigkeit gegenüber Umwelteinflüssen sowie mechanischen Beanspruchungen an die jeweiligen Komponenten. In entsprechenden Produkten können mittels SMT gefertigte Leiterplatten somit nur begrenzt eingesetzt werden. Leiterplatten, die diesen Anforderungen gerecht werden, weisen größere Bauteilabmessungen, festere Verbindungen sowie eine bessere Kühlung auf [1, 2]. Neben der technischen Überlegenheit in hoch beanspruchenden Einsatzbereichen eignet sich eine Montage mittels THT zudem für den Kleinserien- und Prototypenbau [3, 4].

Herausforderung für die THT-Automatisierung

Ein großes Hindernis bei der Automatisierung der THT-Bestückung ist die hohe Formen- und Variantenvielfalt der elektronischen Bauteile. Zum Beispiel sind Teile wie Kondensatoren und Dioden besonders schwierig als Schüttgut automatisch zu fügen, da die Pins unterschiedliche Längen haben und leicht verbiegbar sind. Aus diesem Grund ist weiterhin ein hoher manueller Aufwand erforderlich: Menschliche Fachkräfte besitzen feinmotorische Fähigkeiten und Vorerfahrung über ihren Arbeitsplatz. Mit ausgeprägtem Seh- und Tastvermögen passen sie ihre Kräfte an und besitzen ein Fingerspitzengefühl, mit dem sie solche Bauteile intuitiv fügen können.

Eine automatisierte Bestückung erfordert den Einsatz hochtechnologischer und investitionsintensiver Systemlösungen, um die fehlende Sensorik auszugleichen. THT-Bestückungsautomaten sind für die Kleinserienfertigung zu spezialisiert und teuer. Eine Roboterautomation verspricht neben einer präzisen und ermüdungsfreien Durchführung der Montagetätigkeiten auch eine flexible Anpassung für kleinere Produktionsvolumen. In den letzten Jahren wurden Roboterarme immer erschwinglicher. Allerdings ist die Reife der Robotertechnologie für den Einsatz in manchen Montageszenarien noch nicht ausreichend: Speziell im Bereich der THT-Bestückung sind einzelne Roboterlösungen auf dem Markt bereits vorhanden, überzeugen aber nicht hinsichtlich der Flexibilität, verschiedene Bauteiltypen zu montieren und enge Fügetoleranzen zu bewältigen. Außerdem ist die Verwendung dieser Systeme mit typischen Bauteilen mit langen, biegsamen Pins industriell nicht anwendbar. Neben der im Allgemeinen schwierigen Handhabung biegeschlaffer Bauteile ist die geringe Absolutgenauigkeit der Leichtbauroboter eine Herausforderung.

In der Forschung wird aktuell untersucht, wie Roboter Kleinteile fügen können und welche Steuerungsalgorithmen dafür in Frage kommen. In der robotischen THT-Bestückung wurden bereits einfache heuristische Methoden verwendet. Der Grundgedanke ist dabei, dass der Roboter das Bauteil spiralförmig oder hämmernd über der Fügestelle herabbewegt, bis kein Widerstand detektiert wird. Die Vision intelligenter THT-Bestückung mit Robotern strebt vor allem an, Fügezeiten gering zu halten, auf Leiterplatten ausgeübte Kräfte zu reduzieren und die benachbarten Bauteile nicht zu beschädigen.

Wie ahmt der Roboter den Menschen nach?

Im Forschungsprojekt SmartAssembly am Institut für Produktionssysteme (IPS) der Technischen Universität Dortmund wird in Kooperation mit dem baden-württembergischen Sondermaschinenbauer SFA ein Montagesystem entwickelt, das dieser Vision nachkommen soll. Das Ziel des Projektes ist die Entwicklung eines marktreifen Produktes zur automatisierten THT-Bestückung. Dieses wird aus einem Leichtbauroboter mit zusätzlicher Hardware bestehen, der flexibel Leiterplatten nach Vorgaben des Benutzers bestückt und auf neue Bauteile und PCB-Layouts leicht anpassbar ist. Je nach geforderter Genauigkeit kann anstatt des Bauteils die Leiterplatte durch ein spezielles Positioniersystem bewegt werden.

Pinspitzen werden in Kamerabildern mithilfe der Computer Vision detektiert.
Pinspitzen werden in Kamerabildern mithilfe der Computer Vision detektiert. (Bild: TU Dortmund)

Die Herausforderung in diesem Projekt besteht in der Nachahmung der menschlichen THT-Fügebewegung, bei der der Mensch gleichzeitig fühlt und sieht. Der Einsatz von künstlicher Intelligenz (KI) verspricht, Leichtbauroboter dazu zu befähigen, die menschliche Fügefähigkeit zu erlernen. Diese ist, genau wie der Mensch, auf unterschiedliche Hardware angewiesen: Kameras und Drucksensoren geben Beobachtungen, aus denen der KI-Algorithmus lernt. Im Forschungsprojekt SmartAssembly wird das bestärkende Lernen (engl. Reinforcement Learning, RL) als KI-Ansatz verfolgt. Der Roboter interagiert mit der Umgebung und erhält Rückmeldungen, die Aufschluss geben, wie vorteilhaft eine Bewegung in der beobachteten Situation für die Erfüllung der Aufgabe war. Zur Veranschaulichung der Funktionsweise und Entwicklung der RL-Algorithmen wurde im Rahmen des Forschungsprojektes ein Demonstrator konstruiert. Der Demonstrator ist auf verschiedene Leiterplattengrößen und Bauteile anpassbar.

Bevor der komplexe RL-Algorithmus die Einsteckbewegung ausführen kann, ist es sinnvoll, das Bauteil in die unmittelbare Nähe der Fügestelle zu bringen. Hierdurch wird der Suchraum für den Algorithmus eingegrenzt, um eine möglichst kurze Trainingszeit und schnelles Fügen zu ermöglichen. Dafür wird im Forschungsprojekt eine Methode zur optischen Erkennung der Pinspitzen auf einem dunklen Hintergrund entwickelt und erprobt. Die Methode ist so implementiert, dass die Pinspitzenerkennung auch an THT-Bauteilen funktioniert, die schräg gegriffen wurden oder gebogene Pins haben.

So bestückt der Roboter zum Beispiel einen Kondensator

Am Beispiel eines Kondensators mit zwei langen Pins wird nun das Vorgehen des Roboters beschrieben: Der Roboter bringt zuerst den längsten Pin zur gewünschten Position. Hier beginnt das Einstecken des längeren Pins gesteuert durch den RL-Algorithmus. Sobald der zweite, kürzere Pin auch direkt an der PCB-Oberfläche ankommt, kann auch dieser RL-gesteuert eingesteckt werden. Dieses Vorgehen ist an die typische Fügebewegung des Menschen angelehnt.

Ein wesentlicher Bestandteil von RL, um den Roboter zum Erlernen einer Aufgabe zu befähigen ist das bedarfsgerechte Belohnen oder Bestrafen von erwünschten bzw. unerwünschten Handlungen. Hierzu wird zwischen einmaligen (z.B. +100 Punkte am Ende einer erfolgreichen THT-Bestückung) und kontinuierlichen Belohnungen in jedem Zeitschritt unterschieden. So sind insbesondere auftretende hohe Druckkräfte zu bestrafen, damit die Bauteile nicht beschädigt werden. Zudem wird die Fügezeit berücksichtigt, indem längere Vorgänge bestraft werden, um den Algorithmus schnellere Fügeroutinen entwickeln zu lassen. Auch die Belohnung für steigende Fügetiefe lenkt den Roboter in die richtige Richtung.

Beim Lernen fängt das RL-Modell mit kaum vorhandenem Wissen über die Umgebung, in der es agiert, an. Deswegen sind die anfänglichen Bewegungen des Roboters sehr zufällig. In diesem Stadium ist es besonders wichtig, den Bewegungsfreiraum durch Kollisionsvermeidungsstrategien einzuschränken. Schritt für Schritt wird die Handlungsstrategie mithilfe der Belohnung verbessert. Wichtig dabei ist, dass eine passende Balance zwischen der eher zufälligen Erkundung und Folgen der gelernten Strategie gewählt wird.

Der Sensoraufbau muss von den anfangs zufälligen Bewegungen des Roboters geschützt werden.
Der Sensoraufbau muss von den anfangs zufälligen Bewegungen des Roboters geschützt werden. (Bild: TU Dortmund)

Um auch andere Bauteiltypen bestücken zu können, ist eine Vielzahl von Strategien erforderlich. RL verspricht dafür eine Generalisierung, sodass nicht jede Einzelheit der verschiedenen Strategien vorprogrammiert werden muss, sondern aus Trainingsprozessen automatisch gelernt wird. Ein weiteres Ziel durch den Einsatz von RL ist, dass der Algorithmus der geringen Absolutgenauigkeit der Leichtbauroboter mit geeigneter Interpretation der Sensorwerte und resultierender Bewegungsstrategie entgegenwirkt.

Reinforcement Learning ist ein neues Paradigma in der Automatisierung, das viele Potenziale bietet. Der Anpassungsaufwand der Roboterprogramme für neue Produkte kann durch die Anwendung von selbstlernendem RL deutlich reduziert werden. Die Verwendung von Robotern für die Kleinserienfertigung und das Anlernen von Robotern in Bedingungen von steigender Variantenvielfalt im Umfeld der THT-Montage bietet auch zukünftig ein hohes Potenzial. Daher wird am IPS insbesondere das bedarfsgerechte Einschränken der Bewegungsfreiheit des Roboters erforscht, um den Fügeprozess zu beschleunigen. Zudem wird die Generalisierbarkeit des RL-Modells weiterentwickelt, um verschiedenste Bauteile fügen zu können. Das verfolgte Ziel ist die entwickelten Modelle und Lösungen in die Elektronikfertigung zu bringen.

Förderung

Logo Bundesministerium für Wirtschaft und Klimaschutz
(Bild: BMWK)

Das Projekt SmartAssembly wird vom Bundesministerium für Wirtschaft und Klimaschutz (BMWK) aufgrund eines Beschlusses des Deutschen Bundestages gefördert.

Quellenverzeichnis:

[1] M. Domm, „Kleinserienbestückung von Leiterplatten mit bedrahteten Bauelementen durch Industrieroboter,“ Universität Stuttgart, 1990.

[2] M. Pfeffer und A. Reinhardt, „Auswahlleitfaden für Montagelösungen in der Leistungselektronik: Definition des Anforderungsprofils,“ in Montage in der Leistungselektronik für globale Märkte: Design Konzepte Strategien, Berlin, Heidelberg, Springer, 2009, p. 83–90.

[3] K. Brindley, Newnes electronics assembly handbook, Oxford: Heinemann Newnes, 1990, pp. 6, 14, 52, 56-58, 109-110.

[4] M. Leupold, „Through-Hole Versus SMD Components,“ 22 August 2017. [Online]. Available: https://www.vishay.com/docs/45242/throughholevssmdcomponents.pdf. [Zugriff am 23 Februar 2023].

Mikhail Polikarpov, Daniel Boiar, Lukas Schulte, Univ.-Prof. Dr.-Ing. Jochen Deuse

Institut für Produktionssysteme der TU Dortmund

Sie möchten gerne weiterlesen?