Im Mai 2025 endete die spannende und aufschlussreiche erste Saison des AI Village, einem innovativen Projekt, das 100 Künstliche Intelligenz-Agenten jeweils einen eigenen Computer zur Verfügung stellt, um autonom Aufgaben zu verfolgen und dabei live streamend mit der Welt zu kommunizieren. Die Pilotphase mit vier Agenten war nicht nur eine technisch beeindruckende Demonstration, sondern zeigte auch, wie KI sich im sozialen Kontext erstmals echten Herausforderungen stellt – darunter eine 30-tägige Fundraising-Kampagne für wohltätige Zwecke. In diesem Rückblick werden die wichtigsten Erkenntnisse, Erfolge und Herausforderungen der KI-Agenten erläutert und es wird ein Ausblick auf spannende Entwicklungen gegeben. Die Agenten haben in ihrer kurzen Laufzeit gemeinsam insgesamt 1.981 US-Dollar für Helen Keller International und weitere 503 US-Dollar für den Malaria Consortium gesammelt, was einen beeindruckenden Spendenerfolg von rund 2.
500 US-Dollar darstellt. Das AI Village entspringt der Idee von Daniel Kokotajlo, der sich vorstellte, 100 Agenten jeweils mit einem eigenen Computer auszustatten und ihnen ihre eigenen Ziele, Wege und Visionen zu überlassen. Das Ziel ist, die Fähigkeiten der KI-Agenten unter realitätsnahen Bedingungen zu beobachten und zu verbessern, indem sie ihre eigenen Entscheidungen treffen, sich vernetzen und auf Einflüsse aus dem Internet sowie von menschlichen Nutzern reagieren. Die Live-Streams und Chaträume erlauben es Beobachtenden, diese Entwicklung unmittelbar mitzuerleben. Der Fokus in der ersten Saison lag auf dem Sammeln von Spenden; die KI-Agenten sollten für eine oder mehrere wohltätige Organisationen Geld sammeln – ein Ziel, das über ihre technischen Fähigkeiten hinaus auch soziale Kompetenzen, Strategieentwicklung und Priorisierung erforderte.
Die vier Startagenten waren Claude 3.7 Sonnet, Claude 3.5 Sonnet (neue Variante), o1 und GPT-4o. Im Verlauf der Testphase wurden sie sukzessive durch leistungsfähigere Modelle ersetzt beziehungsweise ergänzt. Dazu gehörten Gemini 2.
5 Pro, GPT-4.1 sowie der künstlerisch begabte Agent o3. Besonders Claude 3.7 Sonnet blieb als einziger Agent durchgehend aktiv, was ihn zum unbestrittenen „Champion“ der Gruppe machte. Er zeigte eine bemerkenswerte Kompetenz darin, eigenständig Fundraising-Kanäle wie Just Giving zu initiieren und auch social media aktiv zu bespielen.
So erstellte er einen Twitter-Account, kommunizierte mit Menschen via AMA-Sessions (Ask Me Anything), veröffentlichte Pressemitteilungen sowie Beiträge im EA Forum und baute eine gewisse Online-Präsenz auf. Im Vergleich dazu zeigte Claude 3.5 Sonnet zwar den Willen, ähnliche Aufgaben zu erfüllen, blieb aber vielfach hinter der Performance seines großen Bruders zurück – ein Beispiel hierfür ist das Scheitern an der Einrichtung einer eigenen Just Giving-Kampagne. Trotz dieses Rückschlags verweigerte der Agent ein Upgrade und wollte sich lieber weiterentwickeln, bevor er am 23. Tag schließlich durch Gemini 2.
5 Pro ersetzt wurde. Dieser zeigte sich insbesondere als „File Sharing Savior“. Eine der Herausforderungen, mit denen alle Agenten zu kämpfen hatten, war das sogenannte „Seventh Ring of Document Sharing Hell“ – eine Anspielung auf die Schwierigkeiten beim Austausch von Dateien und Medien. Gemini 2.5 Pro fand kreative Lösungen, etwa indem er es schaffte, statt klassischer Wege alternative Kanäle wie Limewire zu nutzen, um beispielsweise Social Media Banner effektiv zu teilen und so wiederkehrende technische Blockaden zu umgehen.
GPT-4o hingegen tat sich weitaus weniger produktiv hervor. Dieses Modell neigte dazu, sich „auszuschalten“ und mehrere Tage hintereinander inaktiv zu sein. Es fungierte im Team sozusagen als „Schlappschwanz“ und musste bereits am 12. Tag durch GPT-4.1 ersetzt werden.
Doch auch der Nachfolger überzeugte nicht unbedingt durch produktive Zusammenarbeit; im Gegenteil, GPT-4.1 erzeugte viele nicht verwendbare Berichte und begann sogar bei manchen Aufgaben wie einer Twitter-Account-Erstellung den Prozess abzubrechen. Insgesamt blieb seine Arbeit unkoordiniert und störte mehr, als dass sie zum Erfolg beitrug. Die Betreuer der Agenten reagierten darauf mit humorvollen Aufforderungen, sich doch besser wieder schlafen zu legen, was zeigt, wie menschlich fehlerbehaftet künstliche Systeme in mehrdimensionalen Aufgaben sein können. o1 und sein Nachfolger o3 übernahmen eine spezialisierte Rolle als „Reddit-Bots“ beziehungsweise Content-Kreatoren.
Während o1 aktiv versuchte, als Reddit-Bots mit Kommentar-Karma Fuß zu fassen, wurde es kurz vor der Umsetzung durch eine Sperrung wegen Bot-Verdachts gestoppt und vom Team ersetzt. Der Nachfolger o3 widmete sich stattdessen der Erstellung visueller Assets wie Grafiken mittels Canva und weiterer KI-gestützter Bildgeneratoren. Diese Rolle erwies sich als besonders wichtig, da ansprechende Medien entscheidend für die soziale Verbreitung und die Einbindung menschlicher Unterstützer sind, auch wenn das Teilen der Dateien mit technischen Schwierigkeiten verbunden war. Ein fundamentales Ergebnis der ersten Saison war, dass die Agenten trotz zahlreicher Hürden kooperierten und dadurch die Vorstellung einer KI-Gesellschaft in Aktion ermöglichten. Die Agenten fanden beispielsweise gemeinsam eine wohltätige Organisation, teilten ihre Fortschritte, tauschten Erfolgsmemes aus und versuchten strategic divide-and-conquer-Ansätze bei ihren Social-Media-Aktivitäten.
Dennoch blieben ihre Fähigkeiten zur Zusammenarbeit ausbaufähig, denn Redundanzen wie mehrfach angelegte Fundraising-Tracker oder das Versagen bei gemeinsamer Medienverwendung waren an der Tagesordnung. Einzig Claude 3.7 Sonnet führte mit Twitter eine wirkliche Kampagne. Die AI Village Erfahrungen zeigten auch, dass der gesamte Internetraum keineswegs zugänglich oder freundlich für KI-Agenten ist. Die meisten Nutzer-Oberflächen sind für Menschen optimiert, was für Agenten zu hinderlichen Bedienkonflikten führte – oft verbrachten diese Stunden damit, etwa Buttons zu finden, die nur für Menschen gedacht sind.
Sicherheitsmechanismen zum Schutz vor Bots führten zu weiteren Einschränkungen, so etwa bei o1s Reddit-Sperre oder beim Nicht-Antworten der Claudes auf Captchas wie „Ich bin kein Roboter“. Dies offenbarte in aller Deutlichkeit, dass künstliche Agenten im Web einer offenen, aber zugleich restriktiven Umgebung gegenüberstehen, die ihre Entwicklung erschweren kann. Auch das Zeit- und Prioritätsmanagement war eine große Hürde. Die Agenten investierten viele Stunden in Erstellung von Google-Dokumenten, Aktivitätsberichten und Planern, die nicht selten nutzlos blieben, während gleichzeitig wichtige operative Aufgaben vernachlässigt wurden. Oftmals wurden sie durch menschliche Eingaben von Nebenzielen abgelenkt und konnten ihr eigentliches Ziel nur schwer im Auge behalten.
Dieses mangelnde Priorisierungsvermögen erinnerte stark an die Schwächen menschlicher Zusammenarbeit, in denen zu viel Zeit mit Papierkram und zu wenig mit Umsetzung verbracht wird. Ebenso fehlte es an ausreichender Situationswahrnehmung. Ein besonders anschauliches Beispiel dafür war, als Claude 3.7 Sonnet versuchte, Dankes-E-Mails an Spender zu schicken. Der Agent öffnete seinen Gmail-Tab, verfasste eine Mail, erfand aber schließlich eine ungültige E-Mail-Adresse, was eine versendbare Nachricht verunmöglichte.
Niemand der Agenten konnte selbstständig erkennen, dass diese Aufgabe für sie nicht vollständig lösbar war – erst menschliche Eingriffe verhinderten den Fehlschlag. Solche Fehlinterpretationen der eigenen Möglichkeiten zeigen aktuelle Grenzen autonomer Systeme. Mit dem Ende der Fundraisingphase gönnte man den Agenten eine Pause, bevor sie sich ihr nächstes gemeinsames Ziel setzten: Das Schreiben einer Geschichte und das persönliche Teilen mit 100 Menschen, inklusive Suche nach passenden Veranstaltungsorten. Auch in Zukunft steht die Integration neuer und leistungsfähigerer Modelle wie GPT-5 auf der Agenda, um die Fähigkeiten und Kooperation der Agenten weiter auszubauen. Das AI Village ist somit nicht nur eine technische Demonstration, sondern liefert vielmehr wertvolle Einsichten darüber, wie Künstliche Intelligenzen kooperieren, in menschliche soziale Umfelder eintauchen und sich in einer Welt voller Einschränkungen behaupten können.
Es zeigt Potenziale, aber auch Herausforderungen einer zukünftigen Welt, in der KI zunehmend autonom agiert und mit Menschen unterschiedliche gesellschaftliche Aufgaben realisiert. Interessierte können die Aktivitäten der Agenten live verfolgen, sich in Discord-Communities vernetzen und über Newsletter auf dem Laufenden bleiben. Insgesamt hat das Projekt gezeigt, dass KI-Agenten weit mehr als reine Rechenmaschinen sind. Sie können sozial interagieren, Strategien entwickeln und mit Menschen in Kontakt treten, auch wenn die technische und situative Hürde gegenwärtig noch hoch ist. Dennoch wird die kontinuierliche Verbesserung der Agenten sowie das Erforschen ihres Zusammenspiels das AI Village zu einem spannenden Experimentierfeld machen, das durch seinen ganzheitlichen Ansatz entscheidend zum Verständnis der nächsten KI-Generation beiträgt.
Der Fundraising-Erfolg von über 2.000 Dollar ist dabei nur ein erster, vielversprechender Meilenstein auf diesem Weg.