In der sich stetig weiterentwickelnden Welt der Künstlichen Intelligenz prägen neue Ansätze die Art und Weise, wie komplexe Recherchen und datenintensive Aufgaben bearbeitet werden. Anthropic, ein Vorreiter in der Forschung zu großen Sprachmodellen (LLMs), hat mit seinem multi-agentenbasierten Forschungssystem einen bedeutenden Schritt vollzogen, der die Leistungsfähigkeit von KI-gesteuerten Informationsprozessen nachhaltig verändert. Die Überzeugung, dass einzelne, präzise gestaltete Prompts ausreichen, um komplexe Aufgaben zu bewältigen, wurde durch die Forschung von Anthropic hinterfragt und in manchen Szenarien sogar widerlegt. Dieses System eröffnet neue Möglichkeiten, die weit über herkömmliche KI-Anwendungen hinausgehen und verdient eine detaillierte Betrachtung. Die Definition des Begriffes „Agent“ bei Anthropic ist klar auf den Punkt gebracht und fokussiert sich auf das sogenannte „Tools in a loop“-Prinzip.
Dabei handelt es sich um eine Architektur, in der mehrere KI-Agenten gleichzeitig mit verschiedenen Werkzeugen arbeiten und sich fortwährend in einer Schleife aus Planen, Ausführen und Reflektieren befinden. Das zentrale Element dieses Systems ist der Lead-Agent, der basierend auf der Nutzeranfrage eine umfassende Forschungsstrategie entwirft. Gleichzeitig beauftragt dieser Lead-Agent mehrere Subagenten, welche parallel unterschiedliche Aspekte der Anfrage bearbeiten und so für eine breit gefächerte Informationsgewinnung sorgen. Die Kernidee hinter dem Einsatz von Multi-Agenten-Systemen ist die Effizienzsteigerung durch parallele Verarbeitung. Komplexe Rechercheaufgaben, die viele unabhängige Teilschritte erfordern, profitieren davon besonders.
Durch die parallele Nutzung verschiedener Subagenten können Informationseinheiten simultan extrahiert, analysiert und anschließend zu einem umfassenden Ergebnis verdichtet werden. Die erzielte Kompression von Wissen aus umfangreichen Datenkorpora wird dadurch deutlich beschleunigt. Das zeigt sich auch in den internen Evaluierungen von Anthropic, denen zufolge ein Multi-Agenten-System mit dem Claude Opus 4 als Lead-Agent und den Claude Sonnet 4 als Subagenten eine Leistungssteigerung von über 90 Prozent gegenüber einem einzelnen Agenten erzielte. Ein konkretes Beispiel belegt das enorme Potential: Um alle Vorstandsmitglieder von IT-Unternehmen im S&P 500 zu ermitteln, zerlegte das Multi-Agenten-System die Aufgabe in kleinere Teile, die von spezialisierten Subagenten in paralleler Weise bearbeitet wurden. Ein vergleichbarer Einzel-Agent scheiterte hier vermutlich an der langsamen, sequentiellen Bearbeitung und an kontextuellen Engpässen.
Diese bemerkenswerten Fortschritte kommen allerdings nicht ohne Herausforderungen daher. Besonders der hohe Tokenverbrauch wird als ein wesentlicher Nachteil gesehen. Während einzelne Chat-Interaktionen vergleichsweise sparsam mit Tokens umgehen, vervielfacht sich der Verbrauch durch die Nutzung zahlreicher simultaner Agenten auf das bis zu 15-fache. Dies stellt nicht nur technische, sondern auch wirtschaftliche Herausforderungen dar, da der Einsatz des Multi-Agenten-Systems bei geringwertigen Aufgaben schnell unwirtschaftlich wird. Die Lösung liegt darin, das System gezielt für wertvolle, hochkomplexe und parallelisierbare Aufgaben einzusetzen, welche die Mehrkosten durch den Tokenverbrauch rechtfertigen.
Ein weiterer entscheidender Vorteil des Multi-Agenten-Ansatzes liegt im geschickten Umgang mit Kontextfenstern. Durch die Aufteilung komplexer Fragen in Teilschritte, die von separaten Subagenten mit jeweils eigenem Kontext bearbeitet werden, lässt sich das strikte Limit von etwa 200.000 Tokens je Kontextfenster nach heutigen Standards elegant umgehen. Auf diese Weise kann eine deutlich größere Menge an Informationen für die Analyse herangezogen und verarbeitet werden, als es ein einzelner Agent in einer einzigen Kontextualisierung leisten könnte. Das System speichert dabei wichtige Planungsinformationen kontinuierlich in einer „Memory“-Struktur, die als persistenter Kontext fungiert und ein Überschreiten des Token-Limits ausgleicht.
Dies schützt vor dem Verlust von relevanten Informationen und verbessert die Effizienz der Nachverarbeitung. Die Komplexität bei der Steuerung und Koordination der Agenten spiegelt sich in den Anforderungen an das Prompt-Engineering wider, das von Anthropic als einer der wichtigsten Hebel zur Systemoptimierung erkannt wurde. Frühe Versionen des Systems hatten Schwierigkeiten wie das massenhafte Erzeugen von Subagenten bei einfachen Fragen oder die Tendenz, sich durch übermäßige Informationsupdates gegenseitig abzulenken. Durch feinjustierte, klare und zielgerichtete Prompts konnten diese Probleme signifikant reduziert werden. Die Subagenten werden mit präzisen Vorgaben ausgestattet, die ihre Aufgaben, erwarteten Ausgaben, zur Verfügung stehenden Werkzeuge sowie klare Grenzen des Untersuchungsrahmens definieren.
Dadurch kann vermieden werden, dass Ressourcen durch ineffizientes Verhalten verschwendet werden. Ein besonders innovativer Aspekt des Systems ist der Einsatz von spezialisierten Agenten, die das Ziel verfolgen, andere Tools und deren Beschreibungstexte zu testen und zu optimieren. Ein solcher Tool-Testing-Agent führt wiederholt Tests durch, um Fehlerquellen und Schwachstellen zu identifizieren und danach die Beschreibungen der Werkzeuge so anzupassen, dass künftige Agentenfehler minimiert und die Bearbeitungszeiten um beeindruckende 40 Prozent verkürzt werden konnten. Diese iterative Verbesserung trägt maßgeblich zur Leistungssteigerung und Stabilität des Gesamtsystems bei. Parallelität wird innerhalb des Systems auf mehreren Ebenen genutzt, um die Geschwindigkeit und Effizienz weiter zu steigern.
Der Lead-Agent startet mehrere Subagenten gleichzeitig, meist zwischen drei und fünf, um verschiedene Untersuchungsstränge simultan voranzutreiben. Innerhalb ihrer eigenen Aufgabenbereiche verwenden die Subagenten zudem mehrere Werkzeuge parallel, um möglichst schnell diverse Datenquellen abzurufen und auszuwerten. Diese strategische Parallelisierung hat die Bearbeitungszeit bei komplexen Anfragen auf nur wenige Minuten reduziert und damit eine Arbeitsgeschwindigkeit erreicht, die bisher von herkömmlichen Systemen kaum erreichbar war. Ein elementarer Bestandteil des Multi-Agenten-Forschungssystems ist das sogenannte OODA-Loop-Prinzip, das ursprünglich aus dem militärischen Bereich stammt und für „Observe, Orient, Decide, Act“ steht. Die Subagenten nutzen dieses zyklische Vorgehen, um ständig den aktuellen Informationsstand zu überprüfen, sich neu zu orientieren, Entscheidungen zu treffen und anschließend zielgerichtet zu handeln.
Dieser dynamische Prozess ermöglicht eine adaptive und effiziente Steuerung der Recherche, die sich laufend an neue Erkenntnisse anpasst und dadurch die Qualität der Ergebnisse optimiert. Die Evaluierung des Systems erfolgt über eine Kombination aus automatisierten Bewertungen durch KI-basierte Richtermethoden und menschlichen Tests. Besonders zu Beginn setzen die Entwickler auf kleine, handverlesene Testmengen, die schnell Feedback liefern, anstatt sich auf umfangreiche Testkorpora zu verlassen, die zeitintensiv aufzubauen wären. Ein interessanter Befund aus den Erfahrungstests war etwa die Tendenz der Agenten, SEO-optimierte Inhalte höher zu gewichten als wissenschaftlich fundierte, aber weniger prominente Quellen. Durch gezielte Anpassungen in den Prompt-Strategien, welche Qualitätskriterien für Quellen mit einbezogen, wurde dieses Problem erfolgreich adressiert und die inhaltliche Qualität deutlich gesteigert.
Anthropic stellt zudem wichtige praktische Hinweise für Entwickler bereit, wie man solche Multi-Agenten-Systeme effektiv aufbaut und promptet. Die Empfehlung, mehrere unabhängige Tool-Aufrufe stets parallel abzufeuern, ist ein Kernprinzip bei der erfolgreichen Umsetzung. Eine parallel arbeitende Agentenarchitektur führt zu massiven Zeitersparnissen, indem Subagenten nahezu gleichzeitig diverse Datenquellen abklappern, anstatt sie nacheinander zu befragen. Zusammenfassend zeigt die Arbeit von Anthropic, wie Multi-Agenten-Systeme die aktuellen Limitationen von Einzel-Agenten-Lösungen überwinden können. Sie eröffnen ein neues Paradigma für die KI-gestützte Forschung, das durch Parallelität, spezialisierte Subagenten, ausgefeiltes Prompt-Engineering und adaptives Lernen gekennzeichnet ist.
Die Zukunft der KI-basierten Recherche wird von solchen hochgradig kooperativen Agentensystemen geprägt sein, die nicht nur schneller, sondern auch inhaltlich umfassender und zuverlässiger Ergebnisse liefern können. Die Herausforderung, den ökonomischen und technischen Mehraufwand zu begrenzen, bleibt dabei eine wichtige Aufgabe, um diese Innovationen breit nutzbar zu machen. Anthropic liefert mit seiner Forschung wertvolle Einblicke und praktische Ansätze, um diese Balance zu finden und Multi-Agenten-Systeme als Standard für anspruchsvolle KI-Anwendungen zu etablieren.