Abbildung 1: Bausteine von MV
Die Bildverarbeitung verwendet Kameras als Augen, die visuelle Informationen aus der Umgebung erfassen. Auflösung und Empfindlichkeit sind zwei wichtige Aspekte eines jeden MS-Systems. Die Auflösung ist für die Unterscheidung zwischen Objekten verantwortlich, während die Empfindlichkeit die Fähigkeit der Maschine ist, Objekte oder schwache Impulse selbst bei gedämpftem Licht oder unsichtbaren Wellenlängen zu erkennen.
Die wesentlichen Bestandteile des Systems umfassen Beleuchtung, Linsen, Bildsensoren, Vision-Verarbeitung und Kommunikationsgeräte. Es verwendet häufig Spezialoptik, um Bilder zu erfassen. Die MV-Technologie ist eine Kombination aus Software und Hardware, welche die Betriebssteuerung von Geräten ermöglicht, welche Funktionen wie die Erfassung und Verarbeitung von Bildern und die Messung verschiedener für die Entscheidungsfindung erforderlicher Merkmale ausführen. Hardware-Bauelemente umfassen mehrere Objekte wie Kameras, Sensoren, Prozessoren, Framegrabber, LED-Beleuchtungen und Optik. Das Software-Angebotssegment gliedert sich in anwendungsspezifische MV-Software- und Deep-Learning-MV-Software-Unterkategorien.
Lieferanten von Bildverarbeitung bieten hauptsächlich zwei Arten von Services an, nämlich Integration und Lösungsmanagement. Integratoren für Bildverarbeitungssysteme werden für Inspektions-, Test-, Montage- und Messanwendungen eingesetzt und helfen Kunden dabei, ihre Produktspezifikationen zu erfüllen. Das Lösungsmanagement wird für einstufige Debugging-Operationen, Inspektionskontrollen (Start und Stopp) sowie zum Öffnen und Speichern von Lösungen verwendet.
Auswahl der richtigen Hardware
Bei der Entscheidung für die Hardware, die Ihre KI-Anwendung mit Bildverarbeitung ausführen soll, gibt es viele Optionen. FPGAs (Field Programmable Gate Arrays), GPUs (Grafikprozessoren) und sogar MCUs (Mikrocontroller) haben jeweils ihre eigenen Vorteile.
FPGAs sind äußerst leistungsstarke Prozessoren, die so konfiguriert werden können, dass sie den Anforderungen nahezu jeder Anwendung gerecht werden. Für die Handhabung spezifischer Anwendungen können maßgeschneiderte FPGA-Architekturen erstellt werden. FPGAs erreichen im Vergleich zu anderen Optionen wie GPUs und CPUs eine viel höhere Leistung, niedrigere Kosten und eine bessere Energieeffizienz. GPUs sind spezielle Prozessoren, die hauptsächlich für die Verarbeitung von Bildern und Videos entwickelt wurden. Im Vergleich zu CPUs basieren sie auf einfacheren Verarbeitungseinheiten, bringen aber eine viel größere Anzahl von Kernen unter. Dadurch eignen sich GPUs hervorragend für Anwendungen, in denen große Datenmengen parallel verarbeitet werden müssen, wie Bildpixel oder Videocodecs. CPUs haben eine begrenzte Anzahl von Kernen, was ihre Fähigkeit einschränkt, die großen Datenmengen, die für KI benötigt werden, schnell zu verarbeiten.
Bildsensor und Beleuchtung
Bei der Entwicklung eines Bildverarbeitungssystems könnte die Auswahl des richtigen Bildsensors eine der wichtigsten Designentscheidungen sein. Das Design erfordert eine hochauflösende Bilderfassung, eine schnelle Datenübertragung mit minimalem Rauschen und eine effiziente Rechenleistung, die Daten verarbeiten und Ausgaben erzeugen kann. Die Weiterentwicklung bei der Frontseiten- (FSI) und Rückseitenbeleuchtung (BSI) in der CMOS-Sensortechnologie ermöglicht Bilder mit höherer Auflösung selbst bei schlechten Lichtverhältnissen.
Eine ordnungsgemäße Beleuchtung ist ebenfalls ein wichtiger Aspekt. Alle Beleuchtungsleistungen basieren auf drei Hauptmerkmalen des Bildsensors: Quanteneffizienz (QE), Dunkelstrom und Sättigungskapazität. Bei der Implementierung in einer Kamera sollte die maximale QE der Kamera aufgrund externer optischer und elektronischer Effekte geringer sein als die des Sensors.
Dunkelstrom und Sättigungskapazität sind ebenfalls wichtige Designüberlegungen in Bildverarbeitungssystemen. Der Dunkelstrom misst die Variation der Anzahl der Elektronen, die innerhalb des CMOS-Imagers thermisch erzeugt werden, und kann zu mehr Rauschen führen. Die Sättigungskapazität bezeichnet die Anzahl von Elektronen, die ein einzelnes Pixel speichern kann. Sie können mit QE-Messungen verwendet werden, um das maximale Signal-Rausch-Verhältnis (S/N), die absolute Empfindlichkeit und den Dynamikbereich einer Anwendung abzuleiten.
Die richtige Beleuchtung trägt dazu bei, die Genauigkeit und Effizienz einer Bildverarbeitungsanwendung zu erhöhen. Andere Faktoren, die bei der Beleuchtung zu berücksichtigen sind, sind Wellenlängen wie Infrarot, Festbeleuchtung und auch die Platzierung der Beleuchtung. Es hat sich gezeigt, dass Lichtquellen und Reflexionen, die direkt in die Kameras von Bildverarbeitungssystemen einstrahlen, die Genauigkeit der Objekterkennung verringern.
Die Wahl der richtigen Kamera für die Bildverarbeitung
Jüngste Fortschritte in der Bildverarbeitungstechnologie ermöglichen es Kameras nun, megapixelstarke Bilder mit äußerst schnellen Frame-Raten zu übertragen. Die Auswahl der besten Schnittstelle erfordert einer Berücksichtigung mehrerer Überlegungen wie die Auswahl eines Sensortyps (CMOS oder CCD), einer Farbkamera oder Monochrom-Kamera, des Kameraausgabeformats (GigE, Camera-Link, CoaXPress, USB3, HD-SDI) und der Frame-Raten. CCDs haben eine höhere Bildqualität, eine größere Lichtempfindlichkeit, eine bessere Rauschleistung und einen idealen globalen Shutter. CMOS-Sensoren sind für ihre hohe Geschwindigkeit, die chipinterne Systemintegration und die niedrigen Herstellungskosten bekannt.
Kamerahersteller nutzen die neuesten Sensorentwicklungen und Verbesserungen im Kameradesign und unterstützen Entwickler und Integratoren von Bildverarbeitungssystemen dabei, schnellere, flexiblere und leistungsfähigere Bildgebungssysteme zu entwickeln. Mit höheren Kameraauflösungen steigt der Bedarf an hochwertigerer, großformatiger Optik, die leicht verfügbar ist, mit Optionen wie eingebetteten Flüssiglinsen für Autofokus-Systeme. Optik für nicht sichtbare Wellenlängen eröffnen neue Wege, um Dinge mit spezieller Bildgebung unter Verwendung von Wellenlängen, die vom UV- bis zum IR-Bereich reichen, zu erfassen.
LED-Beleuchtungsprodukte, die für alle Bildverarbeitungsanwendungen von entscheidender Bedeutung sind, gibt es jetzt in einer Vielzahl von Wellenlängen und Formfaktoren. Sie zeichnen sich durch eine erhöhte Flexibilität aus, mit einstellbaren Winkeln und zusätzlichen Wellenlängen, einer konsistenteren Spektralempfindlichkeit und sogar programmierbaren Quellen mit integrierter Steuerung. Ein wichtiger Wegbereiter ist die Entstehung von Schnittstellen bis zu 100 G sowie der kürzlich aktualisierten CoaXPress 2.0-Schnittstelle und auch PCI-Schnittstellen.
Auswahl einer Bildverarbeitungslinse
Die Entscheidung für die richtige Linse für eine Bildverarbeitungsanwendung erfordert eine Überprüfung der notwendigen Spezifikationen, etwas Mathematik und eine Überlegung darüber, wie die Linse in das Kamera-Setup integriert werden soll. Bei der Auswahl der Linse, die in einer Bildverarbeitungsanwendung eingesetzt wird, muss der verwendete Sensor berücksichtigt werden. Bei der Auswahl sind Sensorgröße und Pixelgröße von größter Bedeutung. Die Linse muss in der Lage sein, den gesamten Sensorbereich ordnungsgemäß zu beleuchten, um Abschattungen und Vignettierungen zu vermeiden.
Ideale Linsen erzeugen Bilder, die perfekt zum erfassten Objekt passen, einschließlich aller Details und Helligkeitsschwankungen. Standardlinsen können etwa ein Megapixel in Festbrennweiten von 4,5-100 mm betragen. Makrolinsen sind für Nahaufnahmen optimiert. Bei der Auswahl der richtigen Linse für eine Anwendung berechnen die Entwickler den erforderlichen Betriebsabstand unter Verwendung von 3 Faktoren: Brennweite, Länge des inspizierten Objekts und Sensorgröße.
Einige Anwendungsfälle/Anwendungsszenarien
MV-Systeme in der Lebensmittel- und Getränkeindustrie werden häufig in Verpackungs- und Abfüllbetrieben eingesetzt. Bildverarbeitungssysteme werden voraussichtlich ein erhebliches Wachstum in den Bereichen Pharmaindustrie und Chemie, Druck und Etikettierung sowie in anderen Branchen verzeichnen, wie z. B. Landwirtschaft, Gummi- und Kunststoffverarbeitung, Solarmodule, Maschinen und Ausrüstung, Sicherheit und Überwachung. Der Markt ist in Qualitätssicherung und Inspektion, Positionierung und Führung, Messung und Identifizierung unterteilt. Insbesondere im Verpackungsbereich kommen die Systeme zum Scannen und Identifizieren von Etiketten, Strichcodes und Texten häufig zum Einsatz. Dies automatisiert die Verpackungsaktivitäten, spart Zeit, vermeidet menschliche Fehler und erhöht die Effizienz.
Bildverarbeitungslösungen sorgen dafür, dass Fertigungsprozesse effizienter und konkurrenzfähiger werden. MV-Kameras funktionieren einwandfrei in einer Vielzahl von Produktionsumgebungen. Ein typischer Anwendungsblock wird in Abbildung 2 unten gezeigt.