{"id":630,"date":"2018-04-12T22:00:00","date_gmt":"2018-04-12T22:00:00","guid":{"rendered":"https:\/\/framos.com\/articles\/wie-entstehen-praezise-3d-daten-fuer-exakte-und-intelligent-automatisierte-interaktion-in-echtzeit\/"},"modified":"2024-04-24T21:20:20","modified_gmt":"2024-04-24T21:20:20","slug":"wie-entstehen-praezise-3d-daten-fuer-exakte-und-intelligent-automatisierte-interaktion-in-echtzeit","status":"publish","type":"articles","link":"https:\/\/framos.com\/de\/fachartikel\/wie-entstehen-praezise-3d-daten-fuer-exakte-und-intelligent-automatisierte-interaktion-in-echtzeit\/","title":{"rendered":"Wie entstehen pr\u00e4zise 3D-Daten f\u00fcr exakte und intelligent automatisierte Interaktion in Echtzeit?"},"content":{"rendered":"<blockquote><p>Die Evolution hat den Menschen mit zwei Augen ausgestattet. Aus gutem Grund: nur so k\u00f6nnen wir r\u00e4umlich sehenund damit nicht nur Formen und Umrisse erkennen, sondern auch Entfernungen einsch\u00e4tzen. Was f\u00fcr uns ganz nat\u00fcrlich ist, ist in der industriellen Bildverarbeitung eine komplexe Aufgabe: Wie entstehen 3D-Bilder genau und welche Technologien helfen bei der Umsetzung, um Maschinen das Sehen und Denken beizubringen?<\/p><\/blockquote>\n<p><img decoding=\"async\" class=\"article-content-image\"  src=\"https:\/\/framos.com\/wp-content\/uploads\/2024\/04\/WTW_B-A-C-H_WTW_13_Hayley_Foster_062-1-scaled.jpg\" alt=\"WTW_B-A-C-H_WTW_13_Hayley_Foster_062\">Babys haben noch kein Gef\u00fchl daf\u00fcr, wie weit ihre Augen auseinanderstehen und k\u00f6nnen ohne diese Erfahrung nicht r\u00e4umlich sehen. Sie k\u00f6nnen noch nicht unterscheiden, ob etwas weit weg oder sehr klein ist, sie sehen nur zweidimensional. Erwachsene Menschen verf\u00fcgen \u00fcber r\u00e4umliches Sehen, was bedeutet, dass sie einsch\u00e4tzen k\u00f6nnen, wie weit ein Objekt entfernt ist. Diese inh\u00e4rente Triangulation basiert auf Erfahrung. Nur die Erfahrung sagt, dass der Mensch am hinteren Rand des Spielfeldes in Abbildung 1 eben keine auf der Hand des M\u00e4dchens stehende Playmobil-Figur ist. Klassische 2D-Vision-Programme wissen dies nicht und m\u00fcssen mit Sch\u00e4tzungen und N\u00e4herungswerten arbeiten, welche sie mithilfe komplizierter Algorithmen erlernen, um die ungef\u00e4hren 3D-Koordinaten und Distanzen eines Objektes zu bestimmen. Verfahren dieser Art sind nicht nur aufw\u00e4ndig, sondern auch ungenau und auf einen bestimmten Abstand limitiert. In der modernen Automatisierung und Mensch-Maschine-Kollaboration sind pr\u00e4zise 3D-Daten unverzichtbar f\u00fcr eine exakte Messung und Interaktion in Echtzeit. Die verschiedenen 3D-Verfahren sind mittlerweile ausgereift und oft als fertig einsetzbare Kameras und Module am Markt verf\u00fcgbar. Der Artikel beleuchtet drei der h\u00e4ufigsten technologischen Vorgehensweisen mit ihren Vorteilen und Nachteilen f\u00fcr die Generierung exakter 3D-Daten.                             <\/p>\n<p><em><br \/>\nAbbildung 1: Optische T\u00e4uschung bei 2D-Aufnahmen<\/em><\/p>\n<h3>Passive Stereo Vision: 2-mal 2D gleich 3D<\/h3>\n<p>Bei modernen Stereo Vision-Verfahren sind zumeist zwei Kameras in einem fixierten Abstand zueinander installiert. Die Distanzbestimmung erfolgt durch Triangulation der jeweils zueinander geh\u00f6renden Referenzpunkte im linken und im rechten Bild, durch Berechnung der Disparit\u00e4t. Die daraus resultierenden \u00e2\u20ac\u017eDense Disparity Maps\u201c enthalten die dritte Dimension mit einer Farbcodierung. Je kleiner die Disparit\u00e4t und je dunkler der jeweilige Punkt dargestellt wird, desto weiter weg befindet er sich von der Kamera.<\/p>\n<p><img decoding=\"async\" src=\"https:\/\/framos.com\/wp-content\/uploads\/2024\/04\/disparity-map_copyright-Frederic-Devernay-1.jpg\" alt=\"\"><\/p>\n<p><em>Abbildung 2: In Disparit\u00e4ts-Karten werden Distanzen durch Farbcodierungen wiedergegeben.<\/em><\/p>\n<p>Heutige Stereo Vision-Kameras sind zumeist auf Boardlevel- \/ Modul-Ebene oder als fertiges Produkt in einem festen Geh\u00e4use erh\u00e4ltlich. Die Kameras sind vorkalibriert, 3D-Bilder und Tiefenkarten entstehen f\u00fcr strukturierte Oberfl\u00e4chen ohne gr\u00f6\u00dferen rechnerischen Aufwand. Die Vorteile von disparit\u00e4tsbasierten Triangulationstechniken liegen darin, dass etwa keine Diskretisierungsstufen f\u00fcr den Abstand bestehen und damit eine sehr hohe Genauigkeit erreicht werden kann. Nachteile ergeben sich nur bei sehr homogenen Texturen, da die gesamte Oberfl\u00e4che gleich wirkt und die Kamera keine Referenzpunkte detektieren kann. F\u00fcr diese Einsatzszenarien eignen sich aktive 3D-Techniken.<\/p>\n<h3>Aktive Stereo-Vision mit Musterprojektion<\/h3>\n<p>\u00c3\u0153ber die Projektion sogenannter Pattern f\u00fcgen aktive Stereo Vision-Verfahren dem Bild mit Hilfe von strukturiertem Licht zus\u00e4tzliche Informationen hinzu, um die nicht vorhandenen Texturen zu simulieren. Eine inverse Kamera sendet dazu Strahlen von einem 2D-Array auf die Oberfl\u00e4che, eine herk\u00f6mmliche 2D-Kamera sucht nach dem projizierten Objekt, etwa einem roten Punkt. Dazu wird die Triangulation und Winkelmessung innerhalb der entstehenden geometrischen Dreiecke genutzt, da die Entfernung zwischen inverser Kamera und normaler Kamera bekannt, kalibriert und fixiert ist. Dimensionen, Entfernungen und Abst\u00e4nde k\u00f6nnen ber\u00fchrungslos, pr\u00e4zise und schnell vermessen werden. Der Nachteil dieser aktiven Stereo Vision-Methode liegt in der m\u00f6glichen Auff\u00e4cherung der Strahlen bei hoher Distanz. Die \u00e2\u20ac\u017eauseinander driftenden\u201c Punkte k\u00f6nnen zu einer schlechteren Aufl\u00f6sung und damit zu einem ungenaueren Ergebnis f\u00fchren. F\u00fcr extrem schnelle Messungen unter geringen Aufl\u00f6sungen kommen daher auch Time of Flight-Kameras in Frage.<\/p>\n<h3>Time of Flight<\/h3>\n<p>Das Messprinzip von Time of Flight-Kameras (TOF) ist radar\u00e4hnlich aufgebaut und beruht auf der Zeit, die ein<img decoding=\"async\" src=\"https:\/\/framos.com\/wp-content\/uploads\/2024\/04\/Disparity-looking-from-two-cameras-copyright-FRAMOS-1.jpg\" alt=\"\">Laser- oder Infrarot-Impuls von der Kamera zum Objekt und zur\u00fcck ben\u00f6tigt. Je l\u00e4nger die gemessene Zeit, desto gr\u00f6\u00dfer der Abstand zwischen Kamera und Objekt. Sender und Empf\u00e4nger-Modul sind in der TOF-Kamera integriert und zueinander synchronisiert, so dass daraus die Entfernung extrahiert und berechnet werden kann. Der in der TOF-Kamera integrierte Sensor misst die zwischen Aussendung und Reflektion des Lichts vergangene Zeit. Da jeder ausgesendete Impuls die Informationen \u00fcber die Zeit und den Winkel bzw. die Richtung enth\u00e4lt, kann daraus die Distanz ermittelt und als Tiefenkarte ausgegeben werden. Die einzelnen Impulse sind dabei codiert, um eine genaue Zuordnung zu gew\u00e4hrleisten und Ungenauigkeiten zwischen Versand und Empfang zu vermeiden. Die Time of Flight-Messung basiert auf der Lichtgeschwindigkeit und f\u00fchrt zu einer Bildverarbeitung in Echtzeit und zu einer hohen lateralen Aufl\u00f6sung in Kombination mit der Tiefeninformation. Im Gegensatz zu Laserscannern, die sich Punkt f\u00fcr Punkt bewegen und messen, messen Time of Flight-Kameras eine komplette Szene pro Impuls mit bis zu 100 Bildern pro Sekunde. TOF-Kameras sind zumeist als VGA-Version erh\u00e4ltlich, es gibt bisher nur wenige verf\u00fcgbare Standard-Kameras im Megapixel-Bereich. Die Time of Flight-L\u00f6sung ist im Vergleich zu anderen Systemen sehr einfach und kompakt. Sie enth\u00e4lt keine beweglichen Teile und ist mit einer integrierten Beleuchtung neben dem Objektiv ausgestattet. Aufgrund der simplen Entfernungsinformation verbrauchen TOF-Kameras nur wenig Leistung f\u00fcr die Verarbeitung <em>Abbildung 3: Disparit\u00e4t und Tiefenaufl\u00f6sung beim Blick von zwei Kameras auf ein Objekt<\/em><br \/>\nund damit wenig Strom. F\u00fcr komplexere Aufgaben, Embedded Vision-Applikationen und h\u00f6here Aufl\u00f6sungen eignen sich integrierbare<br \/>\n3D-Kameras oder -Module, die auf eine Kombination aus passiver und aktiver Stereo Vision setzen.<\/p>\n<h3>Kameramodule und K\u00fcnstliche Intelligenz<\/h3>\n<p>Neuartige 3D-Kameras und Embedded Vision-Module wie beispielsweise die Intel\u00ae RealSense\u2122-Reihe verkn\u00fcpfen aktive und passive Stereo Vision-Verfahren und eignen sich damit f\u00fcr alle Arten von Oberfl\u00e4chen. Der Pattern-Projektor kann bei Bedarf ein- oder ausgeschaltet werden und sorgt auf homogenen Texturen f\u00fcr Referenzpunkte. Unabh\u00e4ngig von aktiver oder passiver Vorgehensweise war die Berechnung der Triangulation und Erstellung der Tiefenkarten bisher sehr rechenaufw\u00e4ndig. Sie wurde zumeist auf separaten Host-PC\u2018s durchgef\u00fchrt. Integrierte 3D-L\u00f6sungen haben f\u00fcr das Processing einen ASIC-Chip direkt hinter dem Bildsensor installiert, der ausschlie\u00dflich 3D-Operationen \u00fcbernimmt und f\u00fcr eine Verarbeitung in Echtzeit sorgt.<\/p>\n<p>Bei der Zuordnung und Korrelation der Bilddaten k\u00f6nnen intelligente Algorithmen helfen, die Qualit\u00e4t der Tiefenbilder zu erh\u00f6hen und die Fehlertoleranz zu minimieren. Das meiste Potenzial erzielt k\u00fcnstliche Intelligenz allerdings, wenn die 3D-Informationen innerhalb einer Anwendung genutzt werden um Prozesse intelligent mit pr\u00e4zisen Bildinformationen in Echtzeit zu automatisieren und zu steuern. Mittels 3D-Technologie und bildbasierter KI k\u00f6nnen Maschinen Umgebungen und Objekte exakt analysieren und eine neue Wahrnehmungsebene generieren. Intelligente Algorithmen k\u00f6nnen mit 3D noch pr\u00e4zisere und schnellere Analysen und valide Entscheidungen treffen. An einem F\u00f6rderband zur Sortierung von Paketen beispielsweise kann ein neuronales Netzwerk alleine lernen, was die Objekte kennzeichnet und sie so zuk\u00fcnftig selbst erkennen und klassifizieren. Machine Learning funktioniert mit 3D deutlich besser, da mehr Informationen vorliegen und keine langwierigen Annahmen und Sch\u00e4tzungen gemacht werden m\u00fcssen. Innovative Anwendungen in Industrie und Alltagsleben profitieren von der Kombination aus 3D Technologie und K\u00fcnstlicher Intelligenz und macht Maschinen zu intelligenten Partnern.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die Evolution hat den Menschen mit zwei Augen ausgestattet. Aus gutem Grund: nur so k\u00f6nnen wir r\u00e4umlich sehen und damit nicht nur Formen und Umrisse erkennen, sondern auch Entfernungen einsch\u00e4tzen. Was f\u00fcr uns ganz nat\u00fcrlich ist, ist in der industriellen Bildverarbeitung eine komplexe Aufgabe: Wie entstehen 3D-Bilder genau und welche Technologien helfen bei der Umsetzung, um Maschinen das Sehen und Denken beizubringen?<\/p>\n","protected":false},"author":1,"featured_media":634,"comment_status":"closed","ping_status":"closed","template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false},"article-category":[],"article-tag":[],"class_list":["post-630","articles","type-articles","status-publish","format-standard","has-post-thumbnail","hentry"],"acf":[],"_links":{"self":[{"href":"https:\/\/framos.com\/de\/wp-json\/wp\/v2\/articles\/630","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/framos.com\/de\/wp-json\/wp\/v2\/articles"}],"about":[{"href":"https:\/\/framos.com\/de\/wp-json\/wp\/v2\/types\/articles"}],"author":[{"embeddable":true,"href":"https:\/\/framos.com\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/framos.com\/de\/wp-json\/wp\/v2\/comments?post=630"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/framos.com\/de\/wp-json\/wp\/v2\/media\/634"}],"wp:attachment":[{"href":"https:\/\/framos.com\/de\/wp-json\/wp\/v2\/media?parent=630"}],"wp:term":[{"taxonomy":"article-category","embeddable":true,"href":"https:\/\/framos.com\/de\/wp-json\/wp\/v2\/article-category?post=630"},{"taxonomy":"article-tag","embeddable":true,"href":"https:\/\/framos.com\/de\/wp-json\/wp\/v2\/article-tag?post=630"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}