Roboter lernen erkennen, was sie tun


Dank eines neuen Algorithmus passt Apollo seine Bewegungen laufend an die aktuellen Erfordernisse an. © Max-Planck-Institut für intelligente Systeme/ N. Ratliff

Die Technologietransfer-Organisation der Max-Planck-Gesellschaft hat mit dem US-amerikanischen Start-up Lula Robotics eine Vereinbarung über die Nutzung einer Technologie für „kontinuierliche Bewegungsoptimierung und -steuerung“ abgeschlossen. Grundlage dieser Übereinkunft ist eine Technik vom Max-Planck-Institut für intelligente Systeme in Tübingen. Lula Robotics entwickelt Roboter, die sich in komplexen Umgebungen unabhängig bewegen können. Ziel ist es dabei, künstliche Helfer zu entwickeln, die Menschen zukünftig im Alltag unterstützen können.

In komplexen und dynamischen Umgebungen eigenständig handeln zu können, ist für Menschen und Tiere selbstverständlich. Intelligente Systeme, die autonom agieren und komplexe Aufgaben erledigen können, stellen Forschung und Entwicklung dagegen immer noch vor große Herausforderungen, denn solche Systeme müssen einen vollständigen Zyklus von Wahrnehmen, Verstehen, Handeln und Lernen absolvieren können. So können selbst moderne lernfähige Maschinen und Roboter immer noch lediglich vorprogrammierte Aufgaben in einfachen Umgebungen ausführen. 

Damit ein Roboter autonom agieren kann, muss er seine eigene Bewegung und seine Umgebung über Sensoren wahrnehmen, die Daten seiner Sensoren verarbeiten und neue Aktionsbefehle errechnen und umsetzen. Das Ergebnis dieser Abläufe wird dann wiederum durch die Sensoren überwacht. Diese kontinuierliche Rückkopplung ermöglicht es dem Roboter beispielsweise, das Gleichgewicht zu halten, zu gehen oder Gegenstände zu handhaben bzw. zu bedienen. 

Konventionelle Techniken für solche Feedbackschleifen basieren oft auf einem sogenannten Proportional-Integral-Differential-Regler. Dabei muss allerdings jede mögliche Störung von außen individuell klassifiziert werden, was die Verwendung des Mechanismus auf mehr oder weniger konstante Umgebungen beschränkt. Deshalb war eine neuartige selbstlernende Steuerung erforderlich, die es den Robotern ermöglicht, sich anzupassen und während des Betriebs aus Erfahrungen zu lernen, um mit komplexen und unbekannten Situationen umgehen zu können.

Stefan Schaal und sein Team von der Abteilung Autonome Motorik des Max-Planck-Instituts in Tübingen haben eine „kontinuierliche Technologie zur Bewegungsoptimierung und -steuerung“ entwickelt, mit der Roboter erkennen, was sie tun. Diese nutzt einen neuen Algorithmus, der die Bewegungen von Robotern laufend optimiert und die „Hand-Auge”-Koordination verbessert. So können Roboter ihr Verhalten an die Umgebung anpassen und auf unvorhergesehene Situationen im Zusammenspiel zwischen Mensch und Roboter reagieren. 

Lula Robotics entwickelt nun die Technologie für den Bau von Hochleistungscomputersystemen und Software weiter, die Roboter mit ihrer Umgebung verbinden. Die Technologie soll zudem voll in bestehende Robotik-Plattformen integrierbar sein. „Unser System optimiert sein Verhalten fast wie ein lebender Organismus kontinuierlich und reagiert ständig auf Veränderungen. Dadurch können Mensch und Maschine besonders eng zusammenarbeiten. Momentan konzentrieren wir uns auf das Zusammenspiel zwischen Mensch und Roboter bei der industriellen Fertigung und Montage. Aber die Technologie könnte in Zukunft ebenso die Grundlage für Roboter bilden, die zuhause oder im Gesundheitswesen eingesetzt werden”, erläutert Nathan Ratliff, Miterfinder und Vorstandsvorsitzender von Lula Robotics. 

„Das Team von Lula Robotics besteht aus Wissenschaftlern, die über viel Erfahrung in der Entwicklung von intelligenten Systemen mit der Fähigkeit verfügen, ihre Struktur und ihre Merkmale so zu optimieren, dass sie in einer komplexen und veränderlichen Welt erfolgreich agieren können. Deshalb ist Lula Robotics ein perfekter Partner für die Technologie des Max-Planck-Instituts für intelligente Systeme”, sagt Bernd Ctortecka, Patent- und Lizenzmanager bei Max-Planck-Innovation.