Markus Becker
Echtzeitfähiges Stereo-Vision-System mit ML-basierter Objekterkennung für mobile Roboter

Abstract
In dieser Arbeit wird die Entwicklung eines echtzeitfähigen Stereo-Vision-Systems mit maschinellem Lernen (ML) zur Objekterkennung für mobile Roboter beschrieben. Ziel ist die Realisierung eines Systems, das Tiefeninformationen sowie Objektdaten präzise und in Echtzeit erfasst und verarbeitet. Im Zentrum steht YOLO (You Only Look Once), das mit der Stereo-Vision-Technologie kombiniert wird, um Entfernungen und Positionen von Objekten zu bestimmen. Der Hailo-8L-ML-Beschleuniger wird verwendet, um die hohen Rechenanforderungen zu bewältigen und die Echtzeitfähigkeit des Systems sicherzustellen. Dieser wurde aufgrund seiner geringen Leistungsaufnahme ausgewählt, um das System auf mobilen Plattformen wie dem EMAROs einsetzbar zu machen. Tests auf dem EMAROs zeigten vielversprechende Ergebnisse, insbesondere bei der Erkennung statischer Objekte. Die Distanzmessung mittels Stereo-Vision in Kombination mit YOLOv6n wurde auf dem EMAROs bei 22 Messungen pro Sekunde und einer Leistungsaufnahme von 4,7W erreicht. Diese Arbeit trägt zur Weiterentwicklung echtzeitfähiger Systeme für die mobile Robotik bei, insbesondere durch die ML-basierte Objekterkennung mit dem Hailo-8L als Beschleuniger im Kontext der Stereo-Vision.