Computer Vision Anwendungen können vielerlei Zwecken dienen. Ihr Hauptziel ist allerdings die Förderung der Geschäftsentwicklung, dank der Automatisierung von Prozessen und der Verbesserung von Geschäftsentscheidungen, speziell weil sie auf der Analyse von gesammelten Daten basieren.
Objekterkennung
Ihr Zweck ist es Dinge in Bildern zu erkennen und zu identifizieren. Die Software kann das basierend auf einer Bibliothek von bereits eingeordneten Bildern tun, einer Angabe von unterscheidbaren Objekteigenschaften (bei klassischen Computer Vision Algorithmen) oder indem es selbst basierend auf Daten lernt (bei Deep Learning). Außerdem kann es von selbst mit der Zeit immer besser werden. Diese Technologie wird weit verbreitet in Fahrerassistenzsystemen oder bei automatisierten Qualitätskontrollen in der Produktion angewendet, d.h. auf der Suche nach fehlerhaften Artikeln auf Fließbändern.
Gesichtserkennungssoftware
Diese Art von Software kann auf verschiedene Arten funktionieren – Gesichtserfassung (Gesichter auf einem Bild finden), Gesichtserkennung (Identifizierung von bestimmten Personen in Bildern oder Videos) und die Erkennung von Alter, Geschlecht und Emotionen – entscheidende Indikatoren bei Kundenzufriedenheit – um weiter zu analysieren. Apps, die auf Gesichtserkennung basieren, werden oft im Gesundheitswesen, Verkehrsmanagement, Sicherheitswesen angewendet, oder um automatisch zu bestätigen, dass die Person, die ein Bier kauft, nicht minderjährig ist.
Bildklassifizierung
Computer-Algorithmen kategorisieren, gruppieren und bearbeiten Informationen für eine eingehende Analyse und relevante Insights. Bildklassifizierung verarbeitet Bilder auf so eine Weise, dass sie mit einer Bezeichnung versehen werden (einer Klasse). Mit hoher Wahrscheinlichkeit weiß das System welches Bild eine Katze, einen Hund, einen Menschen usw. anzeigt. Der Prozess der Kennzeichnung ist sehr wichtig zum Beispiel bei der Klassifizierung von medizinischen Bildern, wenn man die Anzeichen einer Krankheit identifizieren will.
Semantische Segmentierung
Bildsegmentierung ist der Schlüssel zum tiefen und kompletten Verständnis dessen, was auf einem Bild auf der Pixelebene passiert. Diese Lösung dient nicht nur dazu Objekte zu entdecken, sondern auch ihre exakten Grenzen zu finden. Dies wird weit verbreitet in der Entwicklung von selbstfahrenden Autos, für medizinische Zwecke und für alltägliche Fälle, sowie den Portrait-Modus in unseren Kameras, Bildbearbeitungs-Apps oder virtuellen Umkleidekabinen bei E-Commerce angewendet.
Optische Zeichenerkennung
Die OCR-Technologie (Optical Character Recognition) erlaubt es Dokumente zu scannen, sowohl gedruckte, als auch handgeschriebene – und sie in komplett editierbare Daten für Suchen und Analysen zu umzuwandeln. Das erlaubt es Firmen ihre Ressourcen zu digitalisieren und Kundenbetreuung zu verbessern, indem man Rechnungen, Visitenkarten und andere Arten von Dokumenten scannt – und sogar ihre originale Formatierung reproduziert. Die Genauigkeit von OCR kann durch Bildnachbearbeitung verbessert werden, um jegliche Schreibfehler zu korrigieren. Es ist auch möglich Texte, die in Fotos oder Videos vorkommen, zu erkennen, zum Beispiel für Textanalyse, weitere Übersetzung oder um es Personen mit Sehschwäche vorzulesen.
Image post-processing
The OCR’s accuracy can be increased by image post-processing to correct any spelling mistakes. It is also able to recognize text appearing in photos and videos for e.g. text analytics, further translation, or to read it to people with vision impairment.