Die NASA steht als globale Spitzenorganisation im Bereich Raumfahrt und Forschung stets vor der Herausforderung, ihre fachlichen Ressourcen bestmöglich zu organisieren und weiterzuentwickeln. Die Komplexität der Personaldaten, die vielfältigen Fähigkeiten der Mitarbeiter sowie die breite Palette laufender Projekte machen es schwierig, schnell und präzise Experten zu identifizieren oder neue Teams zusammenzustellen. Um diesen Anforderungen gerecht zu werden, setzt die NASA mittlerweile auf eine zukunftsweisende Kombination aus Graphdatenbanken und Large Language Models (LLMs) – sogenannten großen Sprachmodellen. Diese Technologien bilden die Grundlage für den sogenannten People Knowledge Graph, ein intelligentes Netzwerk, das Menschen, Fähigkeiten, Projekte und Organisationseinheiten auf neuartige Weise miteinander verbindet. Die Umsetzung dieses People Knowledge Graph stellt einen Meilenstein in der Personal- und Kompetenzanalyse dar und eröffnet völlig neue Möglichkeiten für effiziente Entscheidungsprozesse und organisatorische Transparenz.
Die bisherigen Ansätze im Umgang mit Personal- und Projektinformationen basierten zum großen Teil auf relationalen Datenbanken, die in Form von Tabellen und rigid definierten Datenfeldern die Speicherung von Informationen ermöglichten. Zwar sind klassische Datenbanken bei einfachen Abfragen gut geeignet, weisen jedoch in großen Organisationen mit komplexen Beziehungsgeflechten erhebliche Nachteile auf. Beispielsweise ist es sehr schwierig, mehrstufige Beziehungen zu durchlaufen oder Ähnlichkeiten zwischen Projekten und Kompetenzen effektiv zu analysieren. Dies führt dazu, dass die Daten häufig versteckt bleiben, nicht ausreichend verknüpft werden können oder aufwendig manuell aufbereitet werden müssen. Die NASA erkannte daher frühzeitig die Notwendigkeit, einen flexibleren, dynamischeren und aussagekräftigeren Datenansatz zu etablieren.
Graphtechnologien bieten hier die perfekte Grundlage. Statt Daten in starren Tabellen zu speichern, ermöglichen sie, Entitäten als Knoten (Nodes) darzustellen und deren Beziehungen als Kanten (Edges) auf intuitive Weise abzubilden. So kann zum Beispiel ein Mitarbeiter nicht nur mit seinen Projekten, sondern auch mit seinen erlernten Fähigkeiten, seinem Bildungsweg, seinen Positionen und sogar den übergeordneten Organisationseinheiten in Beziehung gesetzt werden. Durch diese vielseitigen Verknüpfungen lassen sich komplexe Abfragen realisieren, die über einfache Stützungen hinausgehen. So kann man beispielsweise schnell herausfinden, welche Experten in einem bestimmten Fachbereich mehrere ähnliche Projekte bearbeitet haben oder welche Mitarbeiter über Fächergrenzen hinweg Kompetenzen in verschiedenen Bereichen besitzen.
Die NASA setzt dabei auf Memgraph, eine moderne Graphdatenbank, die in Echtzeit Millionen von Knoten und Kanten verarbeiten kann und umfangreiche Abfragemöglichkeiten per Cypher-Sprache bietet. Um die Qualität und Tiefe des People Knowledge Graph weiter zu verbessern, kombinierten die Verantwortlichen bei NASA Graphdatenbanken mit den neuesten Entwicklungen im Bereich der großen Sprachmodelle. LLMs ermöglichen es, aus unstrukturierte Textdaten wie Lebensläufen, Projektbeschreibungen oder organisatorischen Dokumenten relevante Informationen automatisch zu extrahieren. Dies bedeutet, dass Fähigkeiten, Projektdetails und weitere relevante Attribute ohne manuelles Tagging effizient erfasst, standardisiert und in den Graph integriert werden können. So werden beispielsweise aus den oft freestyle verfassten Lebensläufen der Mitarbeiter gezielt Fachkenntnisse ermittelt, die im Graph als eigene Knoten angelegt und mit den jeweiligen Personen verknüpft werden.
Auch die Ähnlichkeit von Projekten wird mittels Vektor-Embeddings bewertet, welche aus den Beschreibungen generiert und als Relationseigenschaften im Graph hinterlegt werden. Diese semantischen Verknüpfungen erlauben eine wesentlich feinere Erkennung von inhaltlichen Überschneidungen und erleichtern die Suche nach Experten und Teamdynamiken enorm. Eine weitere besondere technische Herausforderung war es, die komplexe Infrastruktur so aufzubauen, dass sie den hohen Sicherheitsanforderungen der NASA entspricht. Die Lösung läuft vollständig innerhalb der internen AWS-Cloud von NASA und nutzt containerisierte Memgraph-Instanzen auf EC2-Servern. Das LLM-System ist als On-Premise-Server (Ollama) ebenfalls in der geschützten Umgebung installiert.
Die Verbindung verschiedener Datenquellen erfolgt über GQLAlchemy, eine leistungsstarke Python-Bibliothek, die den Import von Daten aus AWS S3 Buckets in den Graph erleichtert. Durch Segmentierung der Datenbankinstanzen wird sichergestellt, dass sensible personenbezogene Informationen (PII) zuverlässig isoliert und geschützt bleiben. Das Modell des Knowledge Graph basiert auf einem sogenannten labeled property graph Ansatz. Dabei werden unterschiedliche Knotenklassen modelliert, um Mitarbeiter, Positionstitel, Organisationseinheiten, Projekte, Bildungseinrichtungen und extrahierte Fähigkeiten detailliert abzubilden. Jeder Knoten ist mit mehreren Eigenschaften versehen, etwa einer Beschreibung, Bildungsstatus oder Gradebene, was die Flexibilität bei der Datenanalyse nochmals erhöht.
Besonders interessant ist die Unterstützung von Graph Retrieval-Augmented Generation (GraphRAG). Dabei wird der Graph zur kontextuellen Informationsquelle eines auf LLM basierenden Chatbots, der auf natürliche Spracheingaben reagiert und strukturiertes Wissen aus dem Graph abruft. Nutzer können so über eine intelligente Schnittstelle komplexe Fragen stellen, ohne Cypher-Abfragen erlernen zu müssen. Das Community Call von NASA und Memgraph gab spannende Einblicke in die Praxisanwendung. Demonstriert wurde, wie das System komplexe Fragen wie "Wer sind die führenden Experten für KI-Projekte in mehreren Zentren?" oder "Wo bestehen Qualifikationslücken im Team?" in Echtzeit beantwortet.
Durch den Zugriff auf dynamisch erstellte Beziehungen lassen sich Überschneidungen zwischen Projekten erkennen oder Führungskräfte erhalten übersichtliche Berichte über die gesamte Personalstruktur und deren Entwicklungen. Der Chatbot mit RAG-Ansatz zeigt eindrucksvoll, wie semantisch raffinierte Suchstrategien Fachabfragen auf natürliche Sprache erweitern und gleichzeitig die zugrundeliegenden Datenstrukturen optimal nutzen können. Trotz der beeindruckenden Fortschritte ist das NASA-Projekt noch im Wachstum begriffen. Der aktuelle Graph beinhaltet rund 27.000 Knoten und 230.
000 Kanten, wobei die kontinuierliche Erweiterung auf bis zu einer halben Million Knoten angestrebt wird. Zukünftige Verbesserungen umfassen unter anderem die noch bessere Entwirrung und Normalisierung ähnlicher Datenbegriffe („JS“ und „JavaScript“), automatische Pipelines zur Datenaufnahme und die Integration neuer Datenquellen wie Lernziele und Projektpräferenzen. Auch die Genauigkeit des Chatbot-Systems und die Generierung von Cypher-Abfragen aus natürlichen Spracheingaben werden weiter optimiert. Insgesamt zeigt das People Knowledge Graph Beispiel von NASA eindrucksvoll, wie die Kombination moderner Graphdatenbanken und KI-gestützter Textanalyse zu neuartigen intelligenten Systemen im Bereich Human Capital Management führt. Anstatt in isolierten Datensilos zu denken, entsteht ein lebendiges, vernetztes Wissensnetz, das präzise, skalierbar und bedienerfreundlich verschiedenste Fragestellungen der Personalentwicklung und Projektplanung adressiert.
Die Anwendungen reichen von der Identifikation von High-Potentials über die Erkennung kritischer Kompetenzlücken bis hin zur effizienten Teamzusammenstellung für aktuelle und zukünftige Herausforderungen der Raumfahrt. Dieses Zusammenwirken von Graphtechnologie und LLM-basiertem semantischem Verständnis wird nicht nur die Arbeit bei NASA grundlegend verändern, sondern kann als Vision und Blaupause für viele andere Großunternehmen und Behörden dienen. Organisationen mit komplexen Wissensbeständen und verzweigten Netzwerken unterschiedlicher Akteure profitieren enorm von diesem Paradigmenwechsel. Denn gerade in Zeiten rasanter technologischer und gesellschaftlicher Veränderungen sind flexible, aussagekräftige und adaptive Informationssysteme der Schlüssel für nachhaltigen Erfolg. Die NASA zeigt eindrucksvoll, dass hochmoderne IT-Innovationen als unverzichtbare Werkzeuge zur Förderung von Innovation, Zusammenarbeit und Wissensaustausch dienen – wo immer Mensch und Technik zusammenkommen!.