Drohnenrennen gelten als eine der dynamischsten und anspruchsvollsten Sportarten im Bereich der Robotik und Technik. Besonders das sogenannte First-Person-View-Racing (FPV), bei dem Piloten ihr Fluggerät mit einer Videobrille aus der Perspektive der Drohne steuern, hat in den letzten Jahren stark an Popularität gewonnen. Profis manövrieren kleine Quadrocopter mit atemberaubenden Geschwindigkeiten durch enge 3D-Parcours und zeigen dabei reflexartige Reaktionen und präzise Steuerung. Die Herausforderung für autonome Systeme, in diesem Umfeld mitzuhalten, ist enorm. Die Steuerung erfordert das Fliegen am Limit der physikalischen Eigenschaften der Drohne und eine Echtzeitverarbeitung von Sensorinformationen, ausschließlich durch Bordkameras und andere eingebettete Sensoren.
Traditionelle Methoden kamen dabei schnell an ihre Grenzen, doch eine neue Herangehensweise hat gezeigt, dass künstliche Intelligenz nicht nur mithalten, sondern sogar neue Maßstäbe setzen kann: Deep Reinforcement Learning (Deep RL). Im Jahr 2023 wurde mit dem System „Swift“ ein Durchbruch erzielt, indem ein autonomes Rennsystem gegen menschliche Weltmeister antrat und zahlreiche Rennen gewann. Swift basiert auf dem Training eines kontrollierenden neuronalen Netzwerks in einer detaillierten Simulation, das dann durch eine Anpassung an reale Umgebungsdaten in die physische Welt übertragen wurde. Die Kernkomponenten von Swift sind eine hochentwickelte Wahrnehmungseinheit sowie eine Kontrollstrategie, die das Fluggerät steuert. Die Wahrnehmungseinheit kombiniert visuelle Daten und Messungen eines Inertialsensors, um eine robuste und genaue Positions- und Geschwindigkeitsbestimmung zu liefern.
In Kombination mit einer Kalman-Filter-basierten Fusion von Messdaten ist Swift in der Lage, sich präzise durch die Rennstrecke zu bewegen, ohne auf externe Infrastrukturen wie Motion-Capture-Systeme angewiesen zu sein – ganz wie menschliche Piloten. Insbesondere das Deep-RL gesteuerte Kontrollnetzwerk wurde mittels Proximal Policy Optimization trainiert. Dieses Training erfolgte ausschließlich in Simulation, wobei eine realistische Nachbildung der Dynamik des Quadrocopters und des Rennparcours verwendet wurde. Um jedoch die unvermeidbaren Unterschiede zwischen Simulation und Realität auszugleichen, wurden sogenannte Residualmodelle für Beobachtungsrauschen und Dynamikabweichungen erstellt. Diese Modelle basieren auf real aufgezeichneten Flugdaten und ermöglichen eine adäquate Feinabstimmung der Steuerungsrichtlinien.
Das Resultat sind stabile und effiziente Flugmanöver, die teilweise sogar die Geschwindigkeit und Präzision menschlicher Weltmeister übertreffen. Der Rennparcours mit sieben quadratischen Toren, präzise entworfen von einem FPV-Profi, forderte sowohl Swift als auch menschliche Gegner heraus. Beeindruckend schlug sich Swift in Wettkämpfen gegen drei der renommiertesten Piloten der Szene, darunter Alex Vanover, den amtierenden Weltmeister der Drone Racing League. Swift gewann die Mehrheit der direkten Duelle und erzielte sogar die schnellste je in einem solchen Wettbewerb dokumentierte Zeit. Die Analyse der Rennstrategie von Swift gibt weitere Einblicke in die Besonderheiten des autonomen Verhaltens.
Swift zeichnet sich besonders in engen Kurven und bei Startmanövern aus, wobei es schnellere Reaktionszeiten als Piloten aufweist und teils enger an den Streckengrenzen fliegt. Während menschliche Fahrer ihre Bewegungen oft auf den jeweils nächsten Abschnitt des Kurses planen, optimiert Swift seine Flugbahn über längere Zeithorizonte hinweg. Dies ermöglicht es der KI, mehrere Segmente strategisch zu berücksichtigen und komplexe Manöver wie den sogenannten „Split-S“ effizient umzusetzen. Eine Besonderheit ist hier, dass Swift in manchen Situationen den Sichtkontakt zum nächsten Tor reduziert und stattdessen stärker auf die integrierte Sensorik und visuelle Odometrie zurückgreift. Neben der präzisen Steuerung überzeugt Swift durch eine robuste Verarbeitung sensorischer Daten und eine fehlerolerante Flugführung, auch wenn sie nicht sporadisch für Crash-Korrekturen trainiert wurde.
Die Architektur des Systems bietet zudem eine kürzere Latenz zwischen Wahrnehmung und Steuerbefehlsausgabe als das menschliche Gehirn, was einen spürbaren Vorteil in der Schnelligkeit ermöglicht. Die Hardware ist dabei eng an professionelle Wettkampfmodelle angelehnt. Die Drohne wiegt etwa 870 Gramm, verfügt über 35 Newton maximale Schubkraft und nutzt denselben Formfaktor wie menschgesteuerte Racing-Drohnen. Ein NVIDIA Jetson TX2 übernimmt die rechenintensive Bildauswertung und Steuerungsinferenz, während eine spezielle Kameratechnologie zur Bewegungsverfolgung eine stabile virtuelle Positionsermittlung während des Fluges ermöglicht. FPV-Rennen mit autonomen fliegenden Robotern sind der ultimative Test für die Kombination aus Wahrnehmung, Kontrolle und Planung in Echtzeit und innerhalb physikalischer Beschränkungen.
Während die bisherigen Fortschritte meist auf Simulationen oder von externer Infrastruktur unterstützte Umgebungen beschränkt waren, stellt die Errungenschaft von Swift einen Meilenstein dar, der direkte Wettbewerbe unter gleicher Ausgangssituation zwischen Mensch und Maschine ermöglicht. Ein weiterer spannender Aspekt ist die Übertragbarkeit der entwickelten Methoden auf andere Arten autonomer mobiler Systeme. Die hybride Nutzung von simulativem Deep-RL-Training mit realweltbasierten Anpassungsmodellen kann Prinzipien etablieren, die in verschiedensten Bereichen wie autonomen Fahrzeugen, selbststeuernden Robotern im Haushalt oder unbemannten Flugzeugen Anwendung finden. Trotz der beeindruckenden Leistungen besitzt das System auch Herausforderungen, die es in der Zukunft noch zu meistern gilt. So ist Swift derzeit noch anfällig gegenüber plötzlichen Umgebungsveränderungen oder starken Beleuchtungswechseln, da seine Wahrnehmungsmodelle auf konsistente Trainingsbedingungen angewiesen sind.
Auch das Verhalten nach Kollisionen ist noch nicht autonom regenerativ. Außerdem könnte ein adaptiveres Regellernen hinzugefügt werden, welches das Verhalten an den Gegner oder situative Bedingungen dynamisch anpasst. Die menschlichen Piloten zeigten sich zugleich beeindruckt und fasziniert von der Leistung autonomer Drohnen. Ihre Rückmeldungen unterstrichen die technische Qualität der KI, beschrieben die Begegnung aber auch emotional – von Respekt vor der konstanten Leistungsfähigkeit bis hin zur Herausforderung, ein solch schnelles und präzises Gegenüber zu schlagen. Siehe es als Startschuss für eine neue Ära, in der Maschinen nicht nur im Verborgenen Lernerfolge feiern, sondern im Sport direkt gegen Menschen antreten.