Im digitalen Zeitalter gewinnt die Automatisierung von Wissensarbeit zunehmend an Bedeutung. Insbesondere in technischen Berufen, in denen umfangreiche Recherche und detaillierte Informationsaufbereitung erforderlich sind, bietet die Kombination aus künstlicher Intelligenz und maßgeschneiderten Softwarelösungen enorme Möglichkeiten zur Effizienzsteigerung. Ein aktuelles Beispiel hierfür zeigt Jakob Pörschmann, ein Google Engineer, der mit Hilfe von Genkit eine hochgradig spezialisierte Deep Research Lösung entwickelt hat, um große Teile seines Jobs zu automatisieren. Dieser innovative Ansatz demonstriert nicht nur die Weiterentwicklung klassischer Retrieval-Modelle, sondern setzt neue Maßstäbe im Umgang mit komplexen und unstrukturierten Wissensquellen. Seit einigen Jahren sind Retrieval-Augmented Generation (RAG) Systeme fester Bestandteil vieler KI-Anwendungen, da sie einfache Antworten auf gezielte Fragen ermöglichen, indem sie externe Wissensquellen mit Sprachmodellen verbinden.
Allerdings stoßen einfache RAG-Modelle in der Realität oft an ihre Grenzen, wenn die Anfragen zu komplex sind, die Datenquellen vielfältig und uneinheitlich, oder die Fragen zu allgemein formuliert werden. Genau hier setzt der Deep Research Ansatz an, der als eine revolutionäre Weiterentwicklung klassischer RAG-Architekturen verstanden werden kann. Er kombiniert eine mehrstufige Analyse mit flexiblen Orchestrations-Frameworks, um tiefer gehende und präzisere Antworten in technisch anspruchsvollen Domänen zu generieren. Jakob Pörschmanns Projekt nutzt Genkit, ein auf Firebase basierendes Orchestrations-Framework, um die nötigen Arbeitsschritte automatisiert, flexibel und skalierbar umzusetzen. Die Herausforderung bestand darin, technische Folge-E-Mails an Kunden automatisiert zu verfassen, basierend auf detaillierten Meeting-Transkripten, die Gespräche zwischen Google Cloud Customer Engineers und Kunden dokumentieren.
Typischerweise verbringt der Engineer nach jedem Kundengespräch mehrere Stunden damit, offene Fragen zu recherchieren, passende Dokumentationen und Beispiele herauszusuchen und die Antworten anschließend verständlich zusammenzufassen. Mit dem Deep Research System soll dieser Prozess effizienter gestaltet oder vollständig automatisiert werden. Der Ablauf des automatisierten Deep Research Prozesses beginnt damit, dass das System die Transkripte der Kundengespräche analysiert und daraus die tatsächlich relevanten technischen Fragen extrahiert. Dabei handelt es sich nicht einfach um eine Stichwortsuche, sondern um eine intelligente Zerlegung des Textes, die erkennt, welche Fragen noch offen sind und beantwortet werden müssen. Um dies zu realisieren, werden dynamische Texteingabe-Prompts verwendet, welche die zahlreichen botanischen Gesprächsinhalte in eine strukturierte Liste von Forschungsaufträgen überführen.
Diese werden in einem JSON-Format dargestellt und mit klar definierten Datentypen validiert, um die Weiterverarbeitung zu gewährleisten. Nach der Identifikation der einzelnen Fragen innerhalb eines Meetings folgt die parallele Recherchephase. Hier folgt das System zwei unterschiedlichen Pfaden: Zum einen werden aktuelle und präzise Informationen aus einer eigenen, mit GCP-Dokumentationen angereicherten Firestore-Datenbank abgerufen. Diese basiert auf einer Einbettungs- und Vektorsuche, sodass relevante Dokumente anhand semantischer Ähnlichkeit extrahiert werden. Zum anderen nutzt das System den Google Programmable Search Engine API Zugriff, um direkt aktuelle Webinhalte auf ausgewählten Seiten abzurufen und so Lücken in der eigenen Datenbasis auszugleichen.
Die Kombination dieser Quellen gewährleistet, dass das System stets über die neuesten technischen Informationen verfügt und deren Kontext korrekt bewertet. Das Herzstück der Systemarchitektur ist die strikte Schema- und Datentypisierung, die jede Forschungsfrage sowie deren Antwort in ein streng geprüftes Format zwingt. Dadurch wird sichergestellt, dass wichtige Hinweise, Einschränkungen und Dokumentreferenzen explizit erhalten bleiben. Dies ist vor allem für den späteren Zusammenfassungsprozess essenziell, da Transparenz über die Herkunft und Validität der Informationen besteht und der Anwender nachvollziehen kann, welcher Fund zu welchem Ergebnis führte. Zur Zusammenführung aller Rechercheergebnisse dient ein weiterer intelligenter Prompt, der basierend auf gut gemusterten Beispielen eine professionelle, präzise Folge-E-Mail verfasst.
Diese greift die Extrakte der Forschungsaufträge wieder auf, integriert die Antworten kompakt und verständlich und verweist falls sinnvoll auf konkrete Dokumentensektionen. Das Ergebnis ist eine Email, die sowohl technische Tiefe als auch Verständlichkeit verbindet und sich dabei freundlich und professionell präsentiert. Somit entfallen manuelle Nachbereitungsarbeiten für den Engineer nahezu vollständig und die Kundenzufriedenheit steigt durch schnelle, akkurate Antworten. Die gesamte Pipeline ist in Genkit realisiert und zeichnet sich dabei durch hohe Modularität und Flexibilität aus. So können beispielsweise weitere Wissensquellen einfach eingebunden werden oder die Ausgabeformate der Antwortaggregation für verschiedene Zielgruppen konfiguriert werden.
Zudem arbeitet der Algorithmus asynchron und parallelisiert alle Rechercheaufgaben, was die Bearbeitungszeit drastisch reduziert. Die Fähigkeit, unterschiedliche Datenquellen gleichzeitig und kombinierend zu nutzen, macht den Deep Research Ansatz deutlich leistungsfähiger als traditionelle RAG-Modelle. Besonders bemerkenswert ist, dass das Konzept mit einer End-to-End Typisierung und kontextsensitiven Promptgestaltung eine robuste Basis für den praktischen Alltag geschaffen hat. Statt eines überkomplexen Agentensystems, das selbständig Entscheidungen trifft und Schleifen bildet, hat sich ein klarer Workflow bewährt, der durch definierte Schritte und Schnittstellen überschaubar und wartbar bleibt. Diese Klarheit in der Architektur erleichtert zukünftige Erweiterungen oder Anpassungen erheblich.
Der Erfolg von Jakob Pörschmanns Umsetzung zeigt eindrücklich, wie moderne KI-Technologien in Verbindung mit einem guten Software-Engineering-Ansatz klassische Arbeitsprozesse in der Wissensarbeit transformieren können. Durch die Automatisierung von Recherche- und Kommunikationsaufgaben lassen sich nicht nur Zeit und Kosten sparen, sondern auch die Qualität der bereitgestellten Informationen erhöhen. Zugleich bleibt die menschliche Kontrolle in Form der präzisen Definition von Aufgabenstellung, Ergebnisauswertung und finaler Kommunikation erhalten, was Vertrauen und Nachvollziehbarkeit sichert. Der Deep Research Entwurf lässt sich dabei nicht auf Google Cloud oder andere technische Domänen reduzieren. Er ist ein allgemeiner Designpattern, das für verschiedenste Wissensgebiete und Unternehmensbereiche adaptiert werden kann.
Ob es sich um juristische Recherchen, medizinische Analysen oder komplexe betriebliche Entscheidungsgrundlagen handelt – mit entsprechenden Wissensbasen und geeigneten Anwendungsfällen kann der Deep Researcher angepasst und eingesetzt werden. Zukünftig wird diese Art von spezialisierten KI-Anwendungen eine noch größere Rolle spielen, denn die reine Fähigkeit, große Dokumentenmengen zu durchsuchen, reicht nicht mehr aus. Die Tiefe der Analyse, das intelligente Kombinieren mehrerer Quellen und die zielgerichtete Aufbereitung stehen im Fokus. Die Kombination aus modernen Large Language Models, intelligenten Retrieval-Mechanismen und klaren Orchestrations-Workflows bildet das Fundament für diese Entwicklung. Der Weg bis zu einem vollautomatisierten System kann noch weitere Schritte erfordern.
Beispielsweise könnte ein agentenbasiertes System zusätzliche Iterationen durchführen, um die Qualität der Rechercheergebnisse zu erhöhen oder komplexe Zusammenhänge besser zu erfassen. Allerdings zeigen erste Erfahrungen, dass ein sorgfältig komponiertes Workflow-System mit klar definierten Rollen oft effizienter und leichter wartbar ist als hochkomplexe Agentenarchitekturen. Der Deep Research Ansatz mit Genkit ist somit ein wegweisendes Beispiel dafür, wie professionelle Softwareentwicklung und fortschrittliche KI-Methoden Hand in Hand gehen, um reale Probleme im Berufsalltag zu lösen. Wer den Sprung wagt, seine Arbeitsabläufe durch derart intelligente Hilfsmittel zu unterstützen, kann sich auf erhebliches Produktivitätsplus und hohe Anpassbarkeit an individuelle Bedürfnisse freuen. Für alle Interessierten bietet das dazugehörige GitHub-Repository eine vollständige Implementierung, die als Basis und Inspirationsquelle für eigene Projekte genutzt werden kann.
Insbesondere KI-Ingenieure, Softwareentwickler und technische Führungskräfte sind eingeladen, das Designpattern zu erforschen, zu erweitern und an ihre eigenen Anforderungen anzupassen. In einer Welt, in der Wissensarbeit immer komplexer und vielfältiger wird, eröffnet Deep Research mit Genkit neue Perspektiven zur Automatisierung und Effizienzsteigerung. Es lohnt sich, die Chancen und Herausforderungen dieses innovativen Ansatzes zu verstehen und aktiv zu gestalten, denn der Fortschritt in der KI-getriebenen Recherche ist erst der Anfang einer umfassenden Transformation unserer Arbeitswelt.