Suchen

Künstliche Intelligenz

Wie Deep Learning die Bildverarbeitung verändern kann

| Redakteur: Katharina Juschkat

Deep Learning, ein Gebiet der Künstlichen Intelligenz, verändert derzeit industrielle Prozesse. Was genau die Technologie zur klassischen Bildverarbeitung beitragen kann, zeigen wir hier.

Firmen zum Thema

Die Bildverarbeitung ersetzt in vielen Bereichen bereits das menschliche Auge – doch auch sie stößt an ihre Grenzen. Deep Learning kann dann weiterhelfen.
Die Bildverarbeitung ersetzt in vielen Bereichen bereits das menschliche Auge – doch auch sie stößt an ihre Grenzen. Deep Learning kann dann weiterhelfen.
(Bild: gemeinfrei / Pixabay)

Nie zuvor hat sich Technologie so schnell und bahnbrechend verändert wie in den letzten Jahrzehnten. Roboter, 3D-Druck, Bildverarbeitung und mehr haben die Art, wie wir produzieren, wesentlich verändert und verbessert. Heute halten neue Technologien wie die Künstliche Intelligenz (KI) und Deep Learning, ein Unterbereich der KI, Einzug in die Fabriken.

Die Möglichkeiten, die Deep Learning bietet, sind groß – im Folgenden geht es darum, wie die Bildverarbeitung von Deep Learning profitieren kann. In Kombination mit der herkömmlichen, regelbasierten Bildverarbeitung kann Deep Learning zum Beispiel robotergesteuerte Montagelinien dabei unterstützen, richtige Teile zu erkennen und zu ermitteln, ob ein Teil vorhanden ist, fehlt oder falsch auf das Produkt montiert wurde.

Was ist Deep Learning eigentlich?

Zunächst muss man sich die GPU-basierte Hardware anschauen. GPUs (engl. Graphics Processing Units) vereinen tausende relativ einfacher Prozessorkerne auf einem einzigen Chip. Ihre Architektur erinnert an neuronale Netzwerke. Mit ihrer Hilfe können von der Biologie inspirierte, mehrschichtige „tiefe“ neuronale Netzwerke bereitgestellt werden, die das menschliche Gehirn nachahmen.

Wenn eine solche Architektur verwendet wird, können mit Deep Learning spezifische Aufgaben gelöst werden, ohne dass sie vorher explizit programmiert wurden. In klassischen Computeranwendungen programmiert der Mensch eine Software, damit sie bestimmte Aufgaben ausführt. Im Deep Learning hingegen werden Daten wie Bilder, Texte und Zahlen benutzt, um das neuronale Netzwerk zu trainieren. Ausgehend von einer übergeordneten Logik, die beim anfänglichen Training entwickelt wird, optimieren tiefe neuronale Netzwerke ihre Leistung immer weiter, während sie neue Daten empfangen.

Wo Deep Learning heute bereits eingesetzt wird

Zu den typischen alltäglichen Deep-Learning-Anwendungen gehören beispielsweise die Gesichtserkennung, Empfehlungsmaschinen, zum Beispiel beim Streamen von Video- oder Musikdiensten oder beim Einkaufen im Internet, die Spam-Filterung in E-Mails, Krankheitsdiagnostik und die Erkennung von Kreditkartenbetrugsfällen. Deep Learning basiert auf der Erkennung von Unterschieden, denn es sucht in einer Datenreihe permanent nach Änderungen und Unregelmäßigkeiten. Es reagiert auf unvorhersehbare Defekte.

Mit Deep-Learning-Technologien können durch die trainierten Daten sehr genaue Ergebnisse erzielt werden. Sie kommen bei der Vorhersage von Mustern, der Erkennung von Abweichungen und Anomalien sowie beim Fällen von wichtigen Geschäftsentscheidungen zum Einsatz. Diese Technologie verlagert sich nun weiter zu den modernen Herstellungspraktiken bei Qualitätsprüfungen und anderen Anwendungsfällen, die Urteilsvermögen erfordern.

Regelbasierte Bildverarbeitung stößt an ihre Grenzen

Ein Bildverarbeitungssystem wird mit einem digitalen Sensor betrieben, der sich in einer Industriekamera mit spezifischer Optik befindet. Das System empfängt Bilder, die in einen PC eingespeist werden. Ein spezielles Programm verarbeitet, analysiert und misst verschiedene Entscheidungsfindungskriterien. Bildverarbeitungssysteme funktionieren bei einheitlichen Teilen in guter Herstellungsqualität zuverlässig. Sie arbeiten mit sukzessiver Filterung und regelbasierten Algorithmen.

In einer Produktionslinie kann ein regelbasiertes Bildverarbeitungssystem hunderte oder gar tausende von Teilen pro Minute mit hoher Genauigkeit prüfen. Es ist somit kostengünstiger als die menschliche Sichtprüfung. Die Ausgabe der visuellen Daten basiert auf einem programmatischen, regelbasierten Ansatz für die Lösung von Prüfanwendungen.

Auf Werksebene eignet sich ein herkömmliches, regelbasiertes Bildverarbeitungssystem für folgendes:

  • Führen: Positionierung, Ausrichtung
  • Identifizieren: Strichcodes, Datamatrix-Codes, Kennzeichnungen, Zeichenerkennung
  • Messen: Vergleich von Abständen mit spezifizierten Werten
  • Prüfen: Mängel und andere Probleme wie ein fehlendes Sicherheitssiegel, zerbrochene Teile usw.

Die regelbasierte Bildverarbeitung ist bei einer bekannten Reihe von Variablen sehr nützlich und kann zuverlässig die Fragen beantworten: Ist ein Teil vorhanden oder fehlt es? Wie weit ist das Objekt von dem anderen entfernt? Wo muss dieser Roboter das Teil aufheben? In einer Produktionslinie in kontrollierter Umgebung sind solche Aufgaben einfach einzurichten. In weniger eindeutigen Situationen aber versagt sie.

Wie kann Deep Learning in der Bildverarbeitung eingesetzt werden?

Scheitert die klassische Bildverarbeitung an genannten Problemen, kann Deep Learning weiterhelfen. Dabei soll die Technologie die Bildverarbeitung ergänzen und nicht ersetzen. Bei folgenden Anwendungen kommt Deep Learning ins Spiel:

  • Lösen von schwer programmierbaren Bildverarbeitungsanwendungen mit regelbasierten Algorithmen
  • Handhabung von unübersichtlichen Hintergründen und Abweichungen im Erscheinungsbild der Teile
  • Trainieren vorhandener Anwendungen in der Fertigungshalle mit neuen Bilddaten
  • Anpassung an neue Beispiele ohne die Umprogrammierung der Kernnetzwerke

Ein typisches Beispiel aus der Industrie ist die Suche nach Kratzern auf Bildschirmen von Elektrogeräten. Solche Defekte unterscheiden sich in ihrer Größe, ihrem Umfang, ihrer Position oder bei Bildschirmen mit unterschiedlichen Hintergründen voneinander. Mit Deep Learning werden solche Abweichungen berücksichtigt und zwischen korrekten und defekten Teilen unterschieden. Außerdem werden einfach neue Referenzbilder genommen, um ein Netzwerk auf ein neues Ziel hin – beispielsweise eine andere Bildschirmart – zu trainieren.

Wo die klassische Bildverarbeitung scheitert

Was die klassische Bildverarbeitung leisten kann vs. was Deep Learning kann. Beide Technologien ergänzen sich hervorragend.
Was die klassische Bildverarbeitung leisten kann vs. was Deep Learning kann. Beide Technologien ergänzen sich hervorragend.
(Bild: Cognex)

Die Prüfung von visuell ähnlichen Teilen mit einer komplexen Oberflächenstruktur und Abweichungen beim Erscheinungsbild stellt herkömmliche Bildverarbeitungssysteme vor große Herausforderungen. „Funktionelle“ Fehler werden fast immer abgewiesen, aber „kosmetische“ Fehler je nach den Anforderungen und Präferenzen des Herstellers möglicherweise nicht. Dazu kommt, dass die Unterscheidung zwischen solchen Fehlern für ein herkömmliches Bildverarbeitungssystem sehr schwierig ist.

Aufgrund von verschiedenen Variablen, die nur schwer isoliert werden können – etwa Beleuchtung, Farbabweichungen, Biegungen oder Sichtfeld – sind einige Fehlererkennungsfunktionen bekanntermaßen mit einem herkömmlichen Bildverarbeitungssystem schwer zu programmieren und zu lösen. Auch hier bietet Deep Learning einige nützliche Werkzeuge.

Komplexe Situationen erfordern Deep Learning

Kurzum: Herkömmliche Bildverarbeitungssysteme funktionieren bei einheitlichen Teilen in guter Herstellungsqualität zuverlässig. Wenn Ausnahme- und Fehlerbibliotheken jedoch umfangreicher werden, sind die Anwendungen schwieriger zu programmieren. Bei komplexen Situationen, welche menschenähnliche Fähigkeiten mit der Geschwindigkeit und Zuverlässigkeit eines Computers erfordern, stellt Deep Learning sicherlich eine wegweisende Alternative dar.

Regelbasierte Bildverarbeitung und Bildanalysen, die auf Deep Learning basieren, schließen sich nicht gegenseitig aus, sondern ergänzen sich bei der Umstellung auf moderne Werkzeuge der automatisierten Fertigung. Bei manchen Anwendungen wie Messungen ist die regelbasierte Bildverarbeitung nach wie vor die bevorzugte und kostengünstigste Alternative. Bei komplexen Prüfungen mit großen Abweichungen und unvorhersehbaren Defekten in zu großer Anzahl, die mit einem herkömmlichen Bildverarbeitungssystem zu kompliziert zu programmieren sind, stellen Deep-Learning-basierte Tools jedoch eine ausgezeichnete Option dar.

Dieser Beitrag ist ursprünglich auf unserem Partnerportal weAutomateerschienen.

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de (ID: 46193892)