Markus Becker
Echtzeitfähiges Stereo-Vision-System mit ML-basierter Objekterkennung für mobile Roboter
Abstract
In dieser Arbeit wird die Entwicklung eines echtzeitfähigen Stereo-Vision-Systems
mit maschinellem Lernen (ML) zur Objekterkennung für mobile Roboter beschrieben.
Ziel ist die Realisierung eines Systems, das Tiefeninformationen sowie Objektdaten
präzise und in Echtzeit erfasst und verarbeitet. Im Zentrum steht YOLO (You Only Look
Once), das mit der Stereo-Vision-Technologie kombiniert wird, um Entfernungen und
Positionen von Objekten zu bestimmen. Der Hailo-8L-ML-Beschleuniger wird verwendet,
um die hohen Rechenanforderungen zu bewältigen und die Echtzeitfähigkeit des
Systems sicherzustellen. Dieser wurde aufgrund seiner geringen Leistungsaufnahme
ausgewählt, um das System auf mobilen Plattformen wie dem EMAROs einsetzbar zu
machen. Tests auf dem EMAROs zeigten vielversprechende Ergebnisse, insbesondere
bei der Erkennung statischer Objekte. Die Distanzmessung mittels Stereo-Vision in Kombination
mit YOLOv6n wurde auf dem EMAROs bei 22 Messungen pro Sekunde und
einer Leistungsaufnahme von 4,7W erreicht. Diese Arbeit trägt zur Weiterentwicklung
echtzeitfähiger Systeme für die mobile Robotik bei, insbesondere durch die ML-basierte
Objekterkennung mit dem Hailo-8L als Beschleuniger im Kontext der Stereo-Vision.