Mit wenigen Beispielbildern Fehler gezielt identifizieren

Intelligente Deep-Learning-Technologien sorgen für hohe Raten bei der Fehlererkennung.

Intelligente Deep-Learning-Technologien sorgen für hohe Raten bei der Fehlererkennung. MVTec Software

KI in der industriellen
Bildverarbeitung

Um den Machine-Vision-Anwendungen (vor allem im Bereich Identifikation) weiter zu verbessern und auf die Bedürfnisse ­flexibler, vernetzter Prozesse im Rahmen von Industrie-4.0-Szenarien abzustimmen, setzt die industrielle Bildverarbeitung immer mehr auf Methoden der Künstlichen Intelligenz (KI). Die Schlagworte hier sind maschinelles Lernen (Machine Learning) als Teil der KI, Deep Learning als die relevanteste Methode innerhalb von Machine Learning und Convolutional Neural Networks (CNNs) als die beliebtesten Deep-Learning-Architekturen. Allen diesen Technologien gemeinsam ist die Fähigkeit, große Datenmengen („Big Data“) umfassend zu analysieren und auszuwerten.

Hier zeigt sich der entscheidende Vorteil von Deep Learning: Die Technologie ist in der Lage, selbstständig spezifische Fehlermerkmale zu lernen und so bestimmte Problemklassen präzise zu definieren. Entsprechend vortrainierte Deep-Learning-Netze erfordern dabei weit weniger Beispielbilder. Es genügen pro Klasse bereits etwa 300 bis 500 Stück, um verschiedene Arten von Fehlern gezielt trainieren und identifizieren zu können. Für diesen Prozess des Nachtrainierens braucht es nur wenige Stunden. Neben dem stark reduzierten Zeitaufwand ist auch die Erkennungsrate häufig wesentlich höher als bei händisch programmierten Defektklassen. Dadurch können sich auch die Fehlerquoten drastisch reduzieren – von bis zu zehn Prozent bei der manuellen Programmierung auf nahezu Null bei selbstlernenden Algorithmen.

Möchten Unternehmen die Vorteile von Deep Learning nutzen, können sie entweder vortrainierte Netze einsetzen oder eigene Netze als Basis für ihre Auswertungen erstellen. Hierfür benötigen sie jedoch mehrere hunderttausend Beispielbilder, um befriedigende Erkennungsraten zu erzielen. Denn für die sichere Identifikation von Objekten sind viele unterschiedliche Parameter wie etwa Farbe, Form, Textur oder Oberflächenstruktur maßgeblich. Die Konfiguration der Netze ist deshalb sehr anspruchsvoll und lässt sich nur von professionellen Entwicklern bewältigen. Zudem gilt es bei der Auswahl der Beispielbilder zu beachten, dass diese häufig lizensiert sind und daher nur eingeschränkt, also mit Erlaubnis des Urhebers, genutzt werden dürfen. Überdies zeigen Bilddatensätze häufig Motive aus einem industriefremden Umfeld. Aus diesen Gründen ist die Erstellung eigener Deep-Learning-Netze für viele Unternehmen nicht praktikabel.

Vortrainierter Netze statt eigenem Aufwand

Beispiel aus der Pharmaindustrie: Der Algorithmus erkennt fehlerhafte ­Tabletten.

Beispiel aus der Pharmaindustrie: Der Algorithmus erkennt fehlerhafte ­Tabletten. MVTec

Um dennoch von den vielen Vorteilen der Technologie zu profitieren, bleibt nur der Einsatz bereits vortrainierter, für industrielle Anwendungen optimierte Netze. MVTec stellt hierfür mit der proprietären Machine-Vision-Standard-Software ­Halcon eine Lösung bereit. Der Anbieter verfügt über einen Fundus von rund drei Millionen selbst erstellten, lizenzfreien Bildern mit industrienahen Motiven. Somit sind Kunden hinsichtlich des Nutzungsrechts des Bildmaterials auf der sicheren Seite. Zudem profitieren Unternehmen von weiteren Vorteilen, wenn sie ein vortrainiertes Netz im Rahmen einer proprietären Standard-Software einsetzen: So verringert sich der Aufwand für die Anwender deutlich. Nach Einschätzung der MVTec-Experten müsste eine Organisation sechs bis zwölf Personenmonate investieren, um ein vergleichbares Netz in eigener Regie von Grund auf neu zu entwickeln. Anbieter von Standard-Software hingegen verfügen meist bereits über die entsprechende Expertise und die erforderlichen Ressourcen. MVTec mit seinem Kompetenzzentrum unterstützt seine Kunden auch beim Training von Deep-Learning-Netzen, die auf spezielle Anwendungen optimiert sind.

Außerdem stellt der Anbieter von Machine-Vision-Standard-Software mit Halcon Funktionen zur Verfügung, mit denen Unternehmen ohne großen Aufwand CNNs selbst trainieren können. Ausgestattet mit zwei vortrainierten Netzen, eines auf Geschwindigkeit, das andere auf hohe Erkennungsraten optimiert, lassen sich mit der Lösung neuronale Netze erstellen, die auf die Bedürfnisse der Kunden zugeschnitten sind. Unternehmen können dadurch neue Bilddaten einfach klassifizieren und so den Aufwand für die Programmierung drastisch verringern sowie Kosten einsparen. Ein weiterer Vorteil: Anwender benötigen keinerlei Know-how hinsichtlich künstlicher Intelligenz und können die Deep-Learning-Netze mit Machine-Vision-Basiswissen trainieren.

Deep Learning für Embedded Vision

Von großer Bedeutung ist es nun, die KI-basierten Technologien rund um Deep Learning und CNNs auch für die Embedded-Welt nutzbar zu machen. Denn kompakte Geräte, auf denen Embedded-Software läuft, sind in der Industrie zunehmend verbreitet. Ob Smart-Kameras, Vision-Sensoren, Tablets oder Handhelds – die mobilen Devices nehmen eine wichtige Funktion in den vernetzten und hochautomatisierten Industrie-4.0-Prozessen ein. MVTec beispielsweise ist ein Vorrreiter, wenn es darum geht, Machine Vision, Deep Learning und Embedded-Systeme unter einen Hut zu bringen: So bietet die Software-Lösung Deep-Learning-Algorithmen, die auch auf Embedded Boards auf Basis der gängigen Nvidia Pascal-Architektur laufen. In diesem Kontext wurde die Deep-Learning-Inferenz von Halcon erfolgreich auf NVIDIA Jetson TX2 Boards getestet. Auf Anfrage gibt es die für die Arm-64-bit-Architektur optimierte Bibliothek. Und mit der Version 18.05 lässt sich die Deep-Learning-Inferenz auch auf Intel-kompatiblen x86-CPUs ausführen.

Automatica: Halle A5, Stand 102

Seite 2 von 212