Stablecoins

Wie wir unser Multi-Agenten-Forschungssystem entwickelt haben – Innovation und Technik bei Anthropic

Stablecoins
How we built our multi-agent research system

Ein umfassender Einblick in die Entwicklung und technischen Herausforderungen eines Multi-Agenten-Forschungssystems. Erfahren Sie, wie Anthropic durch den Einsatz mehrerer KI-Agenten komplexe Forschungsthemen effizienter löst und welche Lehren aus der Architektur, dem Prompt-Engineering und der Systemzuverlässigkeit gezogen wurden.

Die Entwicklung von Multi-Agenten-Systemen stellt einen bedeutenden Schritt in der Weiterentwicklung künstlicher Intelligenz dar. Statt sich auf einen einzelnen KI-Agenten zu verlassen, arbeitet eine Vielzahl spezialisierter Agenten gemeinsam, um komplexe und offene Fragestellungen zu bearbeiten. Anthropic hat mit der Integration mehrerer Claude-Agenten ein Forschungssystem geschaffen, das speziell dafür ausgelegt ist, komplexe Themen effektiver und flexibler zu erforschen. Die Entstehung dieses Systems, von der ersten Prototyp-Stufe bis hin zum produktiven Einsatz, bietet wertvolle Erkenntnisse für Entwickler und Unternehmen, die ähnliche Systeme realisieren möchten. Das Herzstück des Systems ist die Fähigkeit mehrerer Claude-Agenten, koordiniert zusammenzuarbeiten.

Ein Lead-Agent analysiert Nutzeranfragen, entwirft eine Forschungsstrategie und setzt spezialisierte Subagenten ein, die parallel unterschiedliche Aspekte der Fragestellung untersuchen. So können sie simultan Informationen aus verschiedensten Quellen zusammentragen, auswerten und an den zentralen Agenten zurückmelden, der die Ergebnisse konsolidiert und die Forschungslinie bei Bedarf anpasst. Dieses Modell entspricht dem realen Forschungsprozess, bei dem Forscher ihre Herangehensweise anhand der gewonnenen Erkenntnisse laufend neu justieren. Ein wesentlicher Vorteil des Multi-Agenten-Systems liegt in seiner Flexibilität gegenüber der Unvorhersehbarkeit von Forschungsvorhaben. In der Forschung lassen sich Abläufe und notwendige Schritte nicht starr vordefinieren, vor allem nicht bei komplexen, dynamischen Themen.

Der Einsatz individueller Agenten, die autonom, aber koordiniert agieren, ermöglicht eine parallele, unabhängige Exploration verschiedenster Facetten. Dadurch vermindert sich die sogenannte Pfadabhängigkeit, also die Gefahr, bei einem linearen Vorgehen in Sackgassen zu gelangen, erheblich. Besonders beeindruckend ist die Skalierbarkeit dieses Ansatzes. Während ein einzelner Agent bei umfangreichen Themen durch Kontext- und Tokenbegrenzungen limitiert ist, ermöglicht die Aufteilung der Arbeit auf mehrere Subagenten eine Erweiterung des verfügbaren Kontextfensters und eine größere Token-Ausnutzung. Bei Anthropic wurde festgestellt, dass das Multi-Agenten-System mit Claude Opus 4 als Lead-Agent und Claude Sonnet 4 als Subagenten die Leistung eines einzelnen Claude Opus 4 um über 90 % übertrifft.

Die breite Abdeckung durch parallele Suchvorgänge versetzt das System in die Lage, auch sehr umfangreiche Fragen schneller und präziser zu beantworten. Die Architektur basiert auf einem Orchestrator-Worker-Muster, bei dem der Lead-Agent als Koordinator fungiert und die Subagenten gezielt mit klar abgegrenzten Aufgaben betraut. Diese Subagenten agieren weitgehend autonom, verwalten ihre eigenen Suchanfragen, werten Ergebnisse aus und kommunizieren ihr „Forschungsergebnis“ an den Lead-Agenten zurück. Diese Arbeitsaufteilung optimiert das Gesamtsystem, da verschiedene Tools und Informationsquellen gleichzeitig genutzt werden können, was die Effizienz und Geschwindigkeit dramatisch erhöht. Im Gegensatz zu klassischen Retrieval-Methoden, die statisch relevante Dokumentenabschnitte abrufen und daraus Antworten generieren, verfolgt Anthropic einen dynamischen, mehrstufigen Suchansatz.

Dieser erlaubt es dem System, bei neuen Erkenntnissen flexibel die Strategie anzupassen, neue Suchwege einzuschlagen und die gefundenen Daten ständig zu überprüfen und zu interpretieren. Die so entstehenden Ergebnisse werden abschließend einem speziellen Zitationsagenten übergeben, der die Quellen sauber referenziert und die Nachvollziehbarkeit sicherstellt. Prompt-Engineering spielt im Multi-Agenten-System eine Schlüsselrolle. Die Qualität und Effektivität der Agenten wird maßgeblich von den Anweisungen bestimmt, die sie erhalten. Zunächst mussten viele typische Fehler ausgemerzt werden, wie etwa das unnötige Erzeugen zahlreicher Subagenten für einfache Aufgaben oder das ineffiziente Wiederholen identischer Suchvorgänge.

Um solche Probleme zu vermeiden, entwickelte das Team detaillierte Prompt-Strategien, die den Agenten erlauben, ihren eigenen Arbeitsaufwand an die Komplexität der jeweiligen Aufgabe anzupassen. Der Lead-Agent erhält präzise Vorgaben, wie er die Gesamtabfrage in sinnvolle Teilaufgaben unterteilt und jeder Subagent erhält klare Zielsetzungen, Ausgabefomate und Werkzeughinweise. Damit wird sichergestellt, dass Doppelarbeit vermieden wird und jeder Subagent seine Ressourcen auf einen klar abgegrenzten Forschungsbereich konzentriert. Außerdem fördert die Anleitung, breit zu starten und dann sukzessive die Suche zu präzisieren, eine zielführende Vorgehensweise, die der menschlichen Forschung nachempfunden ist. Die Werkzeuge, die den Agenten zur Verfügung stehen, werden gezielt ausgesucht und beschrieben.

Ein falsches Tool oder eine unzureichende Werkzeugbeschreibung kann sonst dazu führen, dass Agenten falsche Pfade verfolgen oder wertvolle Zeit verschwenden. Deshalb wurde der Fokus auf eine klare Zweckbestimmung jedes Tools gelegt und den Agenten beigebracht, zunächst alle verfügbaren Ressourcen einzuschätzen, bevor sie sich auf die sinnvollsten Instrumente konzentrieren. Interessanterweise ermöglicht die Kombination aus Claude 4 Modellen und selbstreflektierendem Prompt-Engineering sogar eine Selbstverbesserung der Agenten. Ein spezieller Testagent prüft Tools auf Fehler und kann deren Beschreibungen bei Bedarf selbstständig neu formulieren, was zu einer messbaren Effizienzsteigerung führt. Eine solche Feedback-Schleife erhöht die Robustheit und Anpassungsfähigkeit des Systems erheblich.

Auch die parallele Nutzung von Tools steigert nicht nur die Geschwindigkeit, sondern auch die Leistungsfähigkeit bei komplexen Recherchen. Frühe Versionen des Systems arbeiteten noch sequenziell und waren entsprechend langsam. Durch die gleichzeitige Aktivierung mehrerer Subagenten und den parallelen Einsatz mehrerer Werkzeuge können Rechercheaufträge heute in einem Bruchteil der ursprünglichen Zeit abgearbeitet werden. Die Bewertung und Qualitätssicherung der Agenten war aufgrund der Komplexität des Systems eine besondere Herausforderung. Klassische Evaluationsmethoden stoßen an Grenzen, weil Multi-Agenten-Architekturen nicht zwangsläufig den identischen Lösungsweg folgen, um zum Ziel zu gelangen.

Stattdessen muss die Bewertung berücksichtigen, ob das gewünschte Ergebnis am Ende erreicht wurde, und ob der Prozess insgesamt logisch und effizient verlief. Anthropic startete früh mit kleinen Testsätzen, um schnelle Verbesserungen unmittelbar sichtbar zu machen. Gleichzeitig wurde der Einsatz von großen Sprachmodellen als unabhängige Richter implementiert, die Forschungsoutputs anhand von Kriterien wie Fakten- und Zitationsgenauigkeit, Vollständigkeit und Werkzeugnutzung bewerten. Diese automatisierte Beurteilung erlaubt eine skalierbare Qualitätssicherung über hunderte Anfragen. Gleichzeitig bewies sich menschliches Testing als unverzichtbar, um subtile Fehler und Biases zu identifizieren, die maschinelle Evaluierungen übersehen.

So zeigte sich beispielsweise eine anfängliche Neigung der Agenten, bevorzugt sehr gut platzierte SEO-Webseiten gegenüber autoritativen wissenschaftlichen Quellen zu verwenden, was durch zielsichere Anpassungen der Prompting-Strategien korrigiert wurde. Die Zuverlässigkeit des Systems in der Produktion erfordert eine sorgfältige technische Umsetzung. Da die Agenten komplexe, lang laufende Prozesse mit hohem Statusaufwand steuern, müssen Fehler robust abgefangen und Zustände persistiert werden, damit die Arbeit nach Unterbrechungen nahtlos fortgesetzt werden kann. Herkömmliche Neustarts sind nicht praktikabel, da sie Zeitverluste und Frustration für Anwender verursachen würden. Zudem erschwert die dynamische, nichtdeterministische Natur der Agenten die Fehlersuche erheblich.

Anthropic entwickelte daher umfangreiche Monitoring- und Tracing-Werkzeuge, die die Agentenentscheidungen und Interaktionsmuster auf hoher Ebene analysieren, ohne den Inhalt der Nutzerkommunikation preiszugeben. So konnten Schwachstellen identifiziert und effizient adressiert werden. Auch die kontinuierliche Bereitstellung von Updates erfordert einen „Rainbow Deployment“-Ansatz, bei dem neue und alte Versionen parallel betrieben werden. Dies sichert ab, dass keine laufenden Arbeitsprozesse durch inkonsistente Softwarestände unterbrochen werden. Bisher erfolgt die Zusammenarbeit der Subagenten synchron, was die Abstimmung vereinfacht, aber auch den Informationsfluss verlangsamt, da der Lead-Agent auf Ergebnisse warten muss, bevor er fortfährt.

Die nächste Generation plant die Einführung asynchroner Abläufe, die paralleles und flexibleres Arbeiten ermöglichen, wenn Herausforderungen wie das Zusammenführen der Ergebnisse und die Fehlerbehandlung technisch gelöst sind. Zusammenfassend lässt sich sagen, dass die Entwicklung eines Multi-Agenten-Systems für Forschung eine umfassende Ingenieursleistung erfordert, die über das reine Modell-Training hinausgeht. Die feine Abstimmung von Architektur, Prompt-Design, Werkzeugintegration, Evaluationsmethoden und Produktionsengineering entscheidet über den Erfolg. Durch diese innovative Herangehensweise hat Anthropic eine Plattform geschaffen, die komplexe Fragestellungen schneller, flexibler und zuverlässiger als je zuvor bearbeiten kann. Die praktischen Anwendungen sind vielfältig: Von der Unterstützung bei der Entwicklung komplexer Softwaresysteme über die Erstellung professioneller und technischer Inhalte bis hin zur Analyse von Geschäftsmöglichkeiten und akademischen Forschungen.

Nutzer berichten von deutlichen Zeiteinsparungen und erheblichen Erkenntnisgewinnen durch die Fähigkeit des Systems, vernetzte Informationen zu entdecken, die sie selbst übersehen hätten. Dieser Fortschritt markiert einen wichtigen Meilenstein in der praktischen KI-Forschung und zeigt, wie verteilte Intelligenz in Form kooperierender Agenten die Art und Weise revolutioniert, wie Wissen generiert und angewandt wird. Die Erfahrungen und Prinzipien, die Anthropic auf diesem Weg gewonnen hat, bilden eine wertvolle Grundlage für die weitere Entwicklung leistungsfähiger, skalierbarer Multi-Agenten-Anwendungen.

Automatischer Handel mit Krypto-Geldbörsen Kaufen Sie Ihre Kryptowährung zum besten Preis

Als Nächstes
Scientists discover 230 new giant viruses that shape ocean life and health
Dienstag, 02. September 2025. Bahnbrechende Entdeckung: 230 neue Riesenviren verändern das Verständnis des Ozeanlebens und der Gesundheit

Forscher entdecken 230 neuartige Riesenviren, die eine entscheidende Rolle in marinen Ökosystemen spielen und neue Wege im Kampf gegen schädliche Algenblüten eröffnen. Die Erkenntnisse erweitern das Wissen über Virenvielfalt, deren Funktionen und ihre Bedeutung für die Gesundheit der Ozeane und des Menschen.

Coinbase Eyes $330B Corporate Bitcoin Wave; Warns of Imminent Systemic Shock
Dienstag, 02. September 2025. Coinbase prognostiziert 330 Milliarden Dollar Corporate Bitcoin Welle und warnt vor systemischen Risiken

Die rasante Zunahme von Unternehmensinvestitionen in Bitcoin verändert die Kryptolandschaft grundlegend. Neue regulatorische Rahmenbedingungen treiben die Adoption von Bitcoin in der Unternehmenswelt voran, während Experten vor möglichen systemischen Risiken warnen.

Crypto Lending Platform Morpho V2 Brings DeFi Closer to Traditional Finance
Dienstag, 02. September 2025. Morpho V2: Revolution im Krypto-Kreditwesen bringt DeFi und traditionelle Finanzwelt näher zusammen

Morpho V2 setzt neue Maßstäbe im Bereich der Kryptowährungs-Kreditvergabe und schafft mit marktgetriebenen, festverzinslichen und anpassbaren Krediten eine Brücke zwischen dezentraler Finanzierung und traditionellen Finanzinstitutionen.

High-speed fluorescence light field tomography of whole freely moving organisms
Dienstag, 02. September 2025. High-Speed Fluoreszenz-Lichtfeld-Tomografie: Neuer Durchbruch in der Bildgebung frei beweglicher Organismen

Die High-Speed Fluoreszenz-Lichtfeld-Tomografie revolutioniert die biologische Bildgebung, indem sie hochauflösende dreidimensionale Aufnahmen von frei beweglichen Organismen in Echtzeit ermöglicht. Diese innovative Technologie eröffnet neue Perspektiven für die Forschung in Biologie und Medizin.

EDAN: Towards Understanding Memory Parallelism and Latency Sensitivity in HPC [pdf]
Dienstag, 02. September 2025. EDAN: Ein neuer Ansatz zur Analyse von Speicherparallelismus und Latenzempfindlichkeit in High Performance Computing

Ein tiefer Einblick in EDAN, ein innovatives Analysewerkzeug, das hilft, Speicherparallelismus und Latenzempfindlichkeit in Hochleistungsrechnern zu verstehen und so die Effizienz großer Rechenanlagen zu verbessern.

High-speed fluorescence light field tomography of whole freely moving organisms
Dienstag, 02. September 2025. Hochgeschwindigkeits-Fluoreszenz Light Field Tomographie: Revolutionäre Einblicke in bewegte lebende Organismen

Ein tiefgehender Überblick über die High-speed Fluoreszenz Light Field Tomographie und wie sie die Untersuchung ganzer, frei beweglicher Organismen ermöglicht. Dieser Beitrag erklärt die zugrundeliegenden Technologien, Anwendungsmöglichkeiten und die Bedeutung dieser innovativen Methode für die biologische Forschung.

Solana Is Down Over 60%—What Solana Holders Need to Know Now
Dienstag, 02. September 2025. Solana im freien Fall: Was Anleger über den Kurssturz von über 60 % wissen müssen

Solana, einst ein vielversprechendes Blockchain-Projekt, hat in den letzten Monaten einen drastischen Kursrückgang erlebt. Die Ursachen, aktuelle Herausforderungen und mögliche Zukunftsperspektiven für Solana-Anleger werden ausführlich beleuchtet.