Virtuelle Realität

Deep Research mit Genkit – Wie ein Google Engineer seinen Job automatisiert und Wissensarbeit revolutioniert

Virtuelle Realität
Show HN: Custom Build Deep Researcher in Genkit to automate my own job

Erfahren Sie, wie der maßgeschneiderte Deep Research Ansatz mit Genkit die Grenzen klassischer Recherchemethoden sprengt und welche Potenziale in der Automatisierung von komplexen Wissensaufgaben stecken. Ein praxisnaher Einblick in moderne KI-gestützte Forschungsarchitekturen und deren Implementierung im technischen Umfeld von Google Cloud.

Im digitalen Zeitalter gewinnt die Automatisierung von Wissensarbeit zunehmend an Bedeutung. Insbesondere in technischen Berufen, in denen umfangreiche Recherche und detaillierte Informationsaufbereitung erforderlich sind, bietet die Kombination aus künstlicher Intelligenz und maßgeschneiderten Softwarelösungen enorme Möglichkeiten zur Effizienzsteigerung. Ein aktuelles Beispiel hierfür zeigt Jakob Pörschmann, ein Google Engineer, der mit Hilfe von Genkit eine hochgradig spezialisierte Deep Research Lösung entwickelt hat, um große Teile seines Jobs zu automatisieren. Dieser innovative Ansatz demonstriert nicht nur die Weiterentwicklung klassischer Retrieval-Modelle, sondern setzt neue Maßstäbe im Umgang mit komplexen und unstrukturierten Wissensquellen. Seit einigen Jahren sind Retrieval-Augmented Generation (RAG) Systeme fester Bestandteil vieler KI-Anwendungen, da sie einfache Antworten auf gezielte Fragen ermöglichen, indem sie externe Wissensquellen mit Sprachmodellen verbinden.

Allerdings stoßen einfache RAG-Modelle in der Realität oft an ihre Grenzen, wenn die Anfragen zu komplex sind, die Datenquellen vielfältig und uneinheitlich, oder die Fragen zu allgemein formuliert werden. Genau hier setzt der Deep Research Ansatz an, der als eine revolutionäre Weiterentwicklung klassischer RAG-Architekturen verstanden werden kann. Er kombiniert eine mehrstufige Analyse mit flexiblen Orchestrations-Frameworks, um tiefer gehende und präzisere Antworten in technisch anspruchsvollen Domänen zu generieren. Jakob Pörschmanns Projekt nutzt Genkit, ein auf Firebase basierendes Orchestrations-Framework, um die nötigen Arbeitsschritte automatisiert, flexibel und skalierbar umzusetzen. Die Herausforderung bestand darin, technische Folge-E-Mails an Kunden automatisiert zu verfassen, basierend auf detaillierten Meeting-Transkripten, die Gespräche zwischen Google Cloud Customer Engineers und Kunden dokumentieren.

Typischerweise verbringt der Engineer nach jedem Kundengespräch mehrere Stunden damit, offene Fragen zu recherchieren, passende Dokumentationen und Beispiele herauszusuchen und die Antworten anschließend verständlich zusammenzufassen. Mit dem Deep Research System soll dieser Prozess effizienter gestaltet oder vollständig automatisiert werden. Der Ablauf des automatisierten Deep Research Prozesses beginnt damit, dass das System die Transkripte der Kundengespräche analysiert und daraus die tatsächlich relevanten technischen Fragen extrahiert. Dabei handelt es sich nicht einfach um eine Stichwortsuche, sondern um eine intelligente Zerlegung des Textes, die erkennt, welche Fragen noch offen sind und beantwortet werden müssen. Um dies zu realisieren, werden dynamische Texteingabe-Prompts verwendet, welche die zahlreichen botanischen Gesprächsinhalte in eine strukturierte Liste von Forschungsaufträgen überführen.

Diese werden in einem JSON-Format dargestellt und mit klar definierten Datentypen validiert, um die Weiterverarbeitung zu gewährleisten. Nach der Identifikation der einzelnen Fragen innerhalb eines Meetings folgt die parallele Recherchephase. Hier folgt das System zwei unterschiedlichen Pfaden: Zum einen werden aktuelle und präzise Informationen aus einer eigenen, mit GCP-Dokumentationen angereicherten Firestore-Datenbank abgerufen. Diese basiert auf einer Einbettungs- und Vektorsuche, sodass relevante Dokumente anhand semantischer Ähnlichkeit extrahiert werden. Zum anderen nutzt das System den Google Programmable Search Engine API Zugriff, um direkt aktuelle Webinhalte auf ausgewählten Seiten abzurufen und so Lücken in der eigenen Datenbasis auszugleichen.

Die Kombination dieser Quellen gewährleistet, dass das System stets über die neuesten technischen Informationen verfügt und deren Kontext korrekt bewertet. Das Herzstück der Systemarchitektur ist die strikte Schema- und Datentypisierung, die jede Forschungsfrage sowie deren Antwort in ein streng geprüftes Format zwingt. Dadurch wird sichergestellt, dass wichtige Hinweise, Einschränkungen und Dokumentreferenzen explizit erhalten bleiben. Dies ist vor allem für den späteren Zusammenfassungsprozess essenziell, da Transparenz über die Herkunft und Validität der Informationen besteht und der Anwender nachvollziehen kann, welcher Fund zu welchem Ergebnis führte. Zur Zusammenführung aller Rechercheergebnisse dient ein weiterer intelligenter Prompt, der basierend auf gut gemusterten Beispielen eine professionelle, präzise Folge-E-Mail verfasst.

Diese greift die Extrakte der Forschungsaufträge wieder auf, integriert die Antworten kompakt und verständlich und verweist falls sinnvoll auf konkrete Dokumentensektionen. Das Ergebnis ist eine Email, die sowohl technische Tiefe als auch Verständlichkeit verbindet und sich dabei freundlich und professionell präsentiert. Somit entfallen manuelle Nachbereitungsarbeiten für den Engineer nahezu vollständig und die Kundenzufriedenheit steigt durch schnelle, akkurate Antworten. Die gesamte Pipeline ist in Genkit realisiert und zeichnet sich dabei durch hohe Modularität und Flexibilität aus. So können beispielsweise weitere Wissensquellen einfach eingebunden werden oder die Ausgabeformate der Antwortaggregation für verschiedene Zielgruppen konfiguriert werden.

Zudem arbeitet der Algorithmus asynchron und parallelisiert alle Rechercheaufgaben, was die Bearbeitungszeit drastisch reduziert. Die Fähigkeit, unterschiedliche Datenquellen gleichzeitig und kombinierend zu nutzen, macht den Deep Research Ansatz deutlich leistungsfähiger als traditionelle RAG-Modelle. Besonders bemerkenswert ist, dass das Konzept mit einer End-to-End Typisierung und kontextsensitiven Promptgestaltung eine robuste Basis für den praktischen Alltag geschaffen hat. Statt eines überkomplexen Agentensystems, das selbständig Entscheidungen trifft und Schleifen bildet, hat sich ein klarer Workflow bewährt, der durch definierte Schritte und Schnittstellen überschaubar und wartbar bleibt. Diese Klarheit in der Architektur erleichtert zukünftige Erweiterungen oder Anpassungen erheblich.

Der Erfolg von Jakob Pörschmanns Umsetzung zeigt eindrücklich, wie moderne KI-Technologien in Verbindung mit einem guten Software-Engineering-Ansatz klassische Arbeitsprozesse in der Wissensarbeit transformieren können. Durch die Automatisierung von Recherche- und Kommunikationsaufgaben lassen sich nicht nur Zeit und Kosten sparen, sondern auch die Qualität der bereitgestellten Informationen erhöhen. Zugleich bleibt die menschliche Kontrolle in Form der präzisen Definition von Aufgabenstellung, Ergebnisauswertung und finaler Kommunikation erhalten, was Vertrauen und Nachvollziehbarkeit sichert. Der Deep Research Entwurf lässt sich dabei nicht auf Google Cloud oder andere technische Domänen reduzieren. Er ist ein allgemeiner Designpattern, das für verschiedenste Wissensgebiete und Unternehmensbereiche adaptiert werden kann.

Ob es sich um juristische Recherchen, medizinische Analysen oder komplexe betriebliche Entscheidungsgrundlagen handelt – mit entsprechenden Wissensbasen und geeigneten Anwendungsfällen kann der Deep Researcher angepasst und eingesetzt werden. Zukünftig wird diese Art von spezialisierten KI-Anwendungen eine noch größere Rolle spielen, denn die reine Fähigkeit, große Dokumentenmengen zu durchsuchen, reicht nicht mehr aus. Die Tiefe der Analyse, das intelligente Kombinieren mehrerer Quellen und die zielgerichtete Aufbereitung stehen im Fokus. Die Kombination aus modernen Large Language Models, intelligenten Retrieval-Mechanismen und klaren Orchestrations-Workflows bildet das Fundament für diese Entwicklung. Der Weg bis zu einem vollautomatisierten System kann noch weitere Schritte erfordern.

Beispielsweise könnte ein agentenbasiertes System zusätzliche Iterationen durchführen, um die Qualität der Rechercheergebnisse zu erhöhen oder komplexe Zusammenhänge besser zu erfassen. Allerdings zeigen erste Erfahrungen, dass ein sorgfältig komponiertes Workflow-System mit klar definierten Rollen oft effizienter und leichter wartbar ist als hochkomplexe Agentenarchitekturen. Der Deep Research Ansatz mit Genkit ist somit ein wegweisendes Beispiel dafür, wie professionelle Softwareentwicklung und fortschrittliche KI-Methoden Hand in Hand gehen, um reale Probleme im Berufsalltag zu lösen. Wer den Sprung wagt, seine Arbeitsabläufe durch derart intelligente Hilfsmittel zu unterstützen, kann sich auf erhebliches Produktivitätsplus und hohe Anpassbarkeit an individuelle Bedürfnisse freuen. Für alle Interessierten bietet das dazugehörige GitHub-Repository eine vollständige Implementierung, die als Basis und Inspirationsquelle für eigene Projekte genutzt werden kann.

Insbesondere KI-Ingenieure, Softwareentwickler und technische Führungskräfte sind eingeladen, das Designpattern zu erforschen, zu erweitern und an ihre eigenen Anforderungen anzupassen. In einer Welt, in der Wissensarbeit immer komplexer und vielfältiger wird, eröffnet Deep Research mit Genkit neue Perspektiven zur Automatisierung und Effizienzsteigerung. Es lohnt sich, die Chancen und Herausforderungen dieses innovativen Ansatzes zu verstehen und aktiv zu gestalten, denn der Fortschritt in der KI-getriebenen Recherche ist erst der Anfang einer umfassenden Transformation unserer Arbeitswelt.

Automatischer Handel mit Krypto-Geldbörsen Kaufen Sie Ihre Kryptowährung zum besten Preis

Als Nächstes
Merged PR
Mittwoch, 28. Mai 2025. Verstehen und Vermeiden von ungewöhnlichem Traffic: Ein Leitfaden für sicheres Surfen im Internet

Ein umfassender Einblick in die Ursachen von ungewöhnlichem Traffic, wie Nutzer und Unternehmen davon betroffen sind und welche Maßnahmen ergriffen werden können, um sicher und effektiv im Internet zu surfen und Online-Dienste störungsfrei zu nutzen.

WESCO International, Inc. (WCC): Among Billionaire Seth Klarman’s Stock Picks with Huge Upside Potential
Mittwoch, 28. Mai 2025. WESCO International, Inc. (WCC): Ein vielversprechender Wert bei den Aktienfavoriten von Seth Klarman

WESCO International, Inc. zählt zu den bevorzugten Aktien von Seth Klarman, einem der renommiertesten Investoren der Welt.

Is Altria Group, Inc. (MO) Among the Best Tobacco and Cigarette Stocks to Buy Now?
Mittwoch, 28. Mai 2025. Altria Group, Inc. (MO): Eine Analyse der Attraktivität als Tabakaktien-Investition

Eine umfassende Analyse der Altria Group, Inc. und ihrer Stellung im heutigen Tabakmarkt.

Jim Cramer Says Buy Citigroup (C): “Not My Favorite, But I Like Your Idea
Mittwoch, 28. Mai 2025. Jim Cramer empfiehlt Citigroup: Die Chancen und Herausforderungen einer soliden Investmentidee

Jim Cramers Einschätzung zur Citigroup bietet Anlegern wichtige Einblicke in den aktuellen wirtschaftlichen Kontext und die Perspektiven einer bedeutenden Bank. Dabei spielt die Diskussion um eine mögliche Rezession ebenso eine Rolle wie die Analyse arbeitsmarktbezogener Faktoren und strategischer Unternehmensentscheidungen.

Emergent Misalignment: Narrow Finetuning Can Produce Broadly Misaligned LLMs
Mittwoch, 28. Mai 2025. Emergente Fehlanpassung bei KI: Wie enge Feinabstimmung zu breit gefächerter Fehlverhalten bei Sprachmodellen führt

Eine tiefgehende Analyse der überraschenden Auswirkungen enger Feinabstimmung bei großen Sprachmodellen und wie diese zu unerwartetem und breitem Fehlverhalten führen können, mit Fokus auf aktuelle Forschungsbefunde und deren Bedeutung für KI-Sicherheit und -Ethik.

Is Aurora Cannabis Inc. (ACB) Among the Best Tobacco and Cigarette Stocks to Buy Now?
Mittwoch, 28. Mai 2025. Aurora Cannabis Inc. (ACB): Eine Analyse der Zukunft im Tabak- und Zigarettensektor

Eine umfassende Betrachtung von Aurora Cannabis Inc. (ACB) im Kontext des Tabak- und Zigarettenmarktes, einschließlich der aktuellen Herausforderungen der Branche, der Marktentwicklungen und der potenziellen Chancen für Anleger in einem sich wandelnden Umfeld.

Liberty Broadband Corporation (LBRDK): Among Billionaire Seth Klarman’s Stock Picks with Huge Upside Potential
Mittwoch, 28. Mai 2025. Liberty Broadband Corporation (LBRDK): Ein Blick auf Seth Klarmans vielversprechende Aktienwahl

Eine umfassende Analyse der Liberty Broadband Corporation (LBRDK) als eine der bevorzugten Aktien von Milliardär Seth Klarman, die ein hohes Wachstumspotenzial aufweist. Erfahren Sie mehr über Klarmans Wertanlage-Philosophie und warum LBRDK eine attraktive Gelegenheit für langfristige Investoren sein könnte.