Willkommen in der Welt des Machine Vision

Es fühlt sich an, als ob heutzutage überall Machine Vision auftaucht, aber was ist das??

Die Kamera ist ein Computer

Machine Vision ist ein System, das zur Erstellung von Daten eine Kamera verwendet, die mit einem Computer und einer Bildinterpretationssoftware gekoppelt ist. Die Daten werden wiederum verarbeitet und zur Entscheidung über eine Aktion verwendet. Im Wesentlichen ist eine Maschine so programmiert, dass sie nach einer bestimmten Sache sucht und dann eine Aktion ausführt, wenn sie erkennt, wonach sie sucht.

Beispielsweise kann eine Kamera in einer Verpackungslinie einer Fabrik eingerichtet werden, um nach Fehlern in der Verpackung zu suchen. Wenn ein Artikel einen Defekt feststellt, kann die Maschine den Artikel ablehnen. All dies kann viel schneller geschehen, als wenn ein Mensch dasselbe tun würde.

Die Definition von Machine Vision kann auch alle Arten von Maschinen einschließen, die zum Erstellen von Bildern zur Interpretation vorhanden sind, weshalb sie Rollen in der Fertigung, Sicherheit, Überwachung usw. übernehmen. Maschinen mit Kameras werden für eine Vielzahl von Aufgaben eingesetzt, z. B. für Celestial Tea, bei dem Verpackungsinspektionen auf der Förderstrecke durch Kameras durchgeführt werden, oder Tesla, bei dem die Fahrzeuge Geschwindigkeitsschilder lesen und ihre Geschwindigkeit entsprechend anpassen. Ein weiteres Paradebeispiel für Machine Vision ist der Sicherheitsbereich: Wenn Sie am Flughafen den Zollcheck durchgehen, macht eine Kamera Ihr Foto und verwendet Gesichtserkennung, um nach markierten Personen zu suchen.

Bild- und Mustererkennungsfunktion von Google Translate: Direkter Sprachaustausch.

Bildverarbeitung ist hier zu bleiben. Da die Kameras und die Technologie kostengünstiger werden, werden sie an mehr Orten integriert und können schneller und zuverlässiger Aufgaben erledigen als ein Mensch. Als Fotografen haben wir mehr Zugang zu dieser Technologie, um uns bei unserer Arbeit zu unterstützen. Die Technologie wird uns die langwierigeren Aufgaben ersparen, die mit unserer Arbeit verbunden sind, und hilft uns, große Informationsmengen zu verarbeiten und zu katalogisieren.

Die Mechanik der Bildverarbeitung

Machine Vision verwendet sichtbares Licht und eine Kamera, um ein Bild aufzunehmen. Die Pixel in diesem Foto werden dann von einer Software verarbeitet, die Kontrastbereiche oder Pixel mit bestimmten Werten durchsucht. Einige Beispiele für Parameter, nach denen die Software sucht, sind:

  • Kantenerkennung: Sucht Objektkanten
  • Farbvergleich: Sucht nach Farbe innerhalb eines angegebenen RGB-Bereichs
  • Pixelzählung: zählt die Anzahl der hellen oder dunklen Pixel
  • Mustererkennung: Pixel in einer bestimmten Anordnung
  • Tiefenmessung: Verwenden von Bildern zum Modellieren eines dreidimensionalen Raums

Es gibt viele weitere Parameter, nach denen Algorithmen in einem Meer von Pixeln suchen können. Der genaue Prozess hängt von der Anwendung ab. Tatsächlich wird die Entwicklung der Software häufig in Abhängigkeit von ihrer Rolle entwickelt.

Bildverarbeitung bei der Arbeit

Das Gebiet des Machine Vision ist voller faszinierender und aufregender Anwendungsbeispiele, sowohl aktuell als auch nur am Horizont. Ein gutes Beispiel ist eine Kamera, die einer sehbehinderten Person Informationen über ein Objekt, ein Gebäude oder über alles, was sich vor ihnen befindet, geben kann. Sie können bereits mit der Kamera eines Smartphones ein Gemälde in einem Museum erkennen und sich den Namen des Malers nennen lassen. Sie können sogar Ihr Smartphone verwenden, um fremde Texte auf einem Schild zu übersetzen.

Google Translate App mit OCR zum Übersetzen von Text.

Andere Beispiele sind:

Gesichtserkennung

  • Entsperren Sie Ihre Geräte und Computer
  • Überwachung
  • Markieren von Bildern in Adobe Photoshop Lightroom

Optische Zeichenerkennung

  • Lesen der Seriennummer
  • Kennzeichenleser
  • Projekt Gutenberg (Buchdigitalisierung)
  • Autos, die Geschwindigkeitsschilder lesen

Inspektion in einer Produktionslinie

  • Die Verpackung kann auf korrekte Versiegelung geprüft werden
  • Teile können auf Mängel untersucht werden
  • Messen von Flüssigkeitsständen in einer Abfülllinie oder Messen von Teilegrößen
  • Zählen, um sicherzustellen, dass eine Box mit 24 die richtige Menge hat

Landwirtschaft

  • Pflanzenpflege und Bewässerung
  • Ernte
  • Qualitätskontrolle nach der Ernte

Wissenschaft

  • Zellanalyse
  • Kartierung und GIS-Analyse
  • Wettermodellierung

Was bedeutet Bildverarbeitung für Fotografen??

Inzwischen können Sie sich Sorgen machen, dass Maschinen mit Kameras Sie ersetzen werden. Ich versichere Ihnen, dass Ihre Arbeit wahrscheinlich auf absehbare Zeit sicher ist. Menschliche Fotografen machen Fotos, damit Menschen sie interpretieren, teilen und genießen können. Maschinen sind noch nicht in der Lage, alle Nuancen zu verstehen, die auf einem Foto gelesen werden können, weshalb sie noch eine Weile in der industriellen Welt stecken bleiben.

Auf der anderen Seite gibt es einige beunruhigende Entwicklungen auf diesem Gebiet, wenn Sie ein professioneller Retoucher oder Redakteur sind. Die künstliche Intelligenz von Google kann Bilder auf unangenehme Weise automatisch kombinieren und retuschieren sowie Storys erstellen und bearbeiten. Vielleicht erscheint das jetzt wie ein Gag, aber die Fotografie selbst hat es in den frühen Tagen schon gemacht.

Wenn wir jedoch unsere existenzielle Angst für eine Sekunde beiseite stellen, gibt es viele Möglichkeiten, wie Sie die Bildverarbeitung zu Ihrem eigenen Vorteil als Fotograf nutzen können.  

Ein vielversprechender Weg zur Verwendung der Machine Vision-Technologie ist das automatische Tagging, bei dem die Software versucht, den Inhalt eines Bildes zu betrachten und die vorhandenen Dinge aufzulisten. Wenn Sie beispielsweise ein Foto von Erdbeeren analysieren lassen, gibt die Software möglicherweise die Tags zurück: Beeren, Obst, Erdbeeren, frisch. Dieser automatisierte Prozess verspricht, viele Stunden der manuellen Kennzeichnung von Bildern mit Schlüsselwörtern zu vermeiden. Die Foto-Freigabeseite Flickr beispielsweise wird beim Hochladen automatisch mit Tags versehen.

Eine weitere Machine Vision-Technologie, die Fotografen derzeit zur Verfügung steht, ist die Gesichtserkennung im Rahmen von Lightroom 6, Apple Photos und Picasa. Die Gesichtserkennung bewertet Ihre Fotos und sucht nach Gesichtern. Es gruppiert dann ähnliche Gesichter, von denen das Programm der Meinung ist, dass sie zu derselben Person gehören. Sie müssen immer noch einen Namen hinzufügen und falsche Übereinstimmungen aussuchen, aber diese Technologie kann Ihnen dabei helfen, alle Bilder zu finden, die Sie für Kunden aufgenommen haben.

Verwenden der Gesichtserkennung in Adobe Lightroom zum Markieren von Personen.

Möglicherweise müssen Sie bei Ihrer nächsten Fotoaufgabe Bilder erstellen, die zum Sammeln von Daten einer Art von Maschine unterzogen werden. Wenn dies der Fall ist, müssen Sie wissen, wonach das System sucht, um den Prozess zu unterstützen. Wenn die Software beispielsweise nach Kontraständerungen sucht, möchten Sie wissen, wie Sie die Beleuchtung anpassen, um den Kontrast besser zu erkennen.

Der Einstieg in die Bildverarbeitung

Bildverarbeitung ist ein vielversprechender Technologiebereich, der in vielen Branchen und Rollen, einschließlich Fotografen, sehr hilfreich sein kann. Zwar besteht noch keine unmittelbare Gefahr, durch eine Maschine mit einer Kamera ersetzt zu werden, doch besteht die Möglichkeit, die neue Technologie zur Verbesserung Ihres Arbeitsflusses zu nutzen. Die digitale Revolution hat zu einer zunehmenden Verbreitung von Kameras und Bildern geführt. Möglicherweise sind mehr Bilder sinnvoll, als wir können, ohne eine Art Machine Vision zu verwenden, die uns beim Interpretieren hilft.