Die öffentliche Gesundheit steht vor immer komplexeren Herausforderungen, insbesondere angesichts globaler Pandemien und neuer Bedrohungen durch Infektionskrankheiten. In diesem Kontext gewinnen Large Language Models (LLMs) zunehmend an Bedeutung. Diese fortschrittlichen KI-Systeme, die auf der Verarbeitung natürlicher Sprache basieren, bieten bahnbrechende Möglichkeiten, um große Mengen unstrukturierter Daten effizient zu analysieren, zu klassifizieren und daraus wertvolle Erkenntnisse zu gewinnen. Die Anwendung von LLMs im öffentlichen Gesundheitswesen hat das Potenzial, die Art und Weise, wie Gesundheitsdaten erhoben, überwacht und genutzt werden, grundlegend zu verändern. Im Fokus steht dabei nicht nur die Automatisierung repetitiver Tätigkeiten, sondern vor allem die Unterstützung von Expertinnen und Experten bei komplexen Entscheidungen, die das Wohlergehen der Bevölkerung verbessern können.
Ein zentrales Einsatzfeld von LLMs liegt in der Erweiterung der verfügbaren Gesundheitsdatenquellen. Traditionelle Überwachungssysteme sind häufig durch hohe Kosten und den zeitlichen Aufwand bei der Datenerhebung begrenzt. Besonders bei lebensstilbedingten Erkrankungen wie lebensmittelbedingten gastrointestinalen Infektionen wird ein großer Teil der Fälle nicht erfasst, da Betroffene oft keine medizinische Hilfe in Anspruch nehmen. Hier eröffnen LLMs neue Möglichkeiten, indem sie beispielsweise Online-Bewertungen von Restaurants automatisch auswerten. Menschen berichten in Bewertungen häufig von Symptomen wie Übelkeit oder Magenbeschwerden, die auf eine Lebensmittelvergiftung hinweisen könnten.
Durch die Analyse dieser großen Textmengen können LLMs Muster und Hinweise identifizieren, die sonst verborgen bleiben. So lassen sich unentdeckte Krankheitsausbrüche erkennen und die öffentliche Gesundheit wird durch eine breitere Datenbasis besser unterstützt. Die Erfassung solcher Informationen aus frei verfügbaren Texten stellt jedoch hohe Anforderungen an die Genauigkeit und Zuverlässigkeit der Modelle. Um dies zu gewährleisten, erfolgt zunächst eine manuelle Annotation von Datensätzen durch Fachleute, die diese als Trainingsgrundlage für die Algorithmen nutzen. Die besten Modelle erreichen auf spezifischen Klassifikationsaufgaben hohe Leistungswerte, was zeigt, dass LLMs für solche Anwendungsfälle gut geeignet sind.
Neben der Datenerfassung sind LLMs wertvolle Werkzeuge, um bestehende Interventionen während Krankheitsausbrüchen zu skalieren. Bei schnellen, großflächigen Ausbrüchen wie der COVID-19-Pandemie oder dem Mpox-Ausbruch 2022 ist es essentiell, rasch große Mengen an Kontaktpersonen zu klassifizieren und entsprechende Risikoeinschätzungen vorzunehmen. Klassische manuelle Verfahren stoßen hier schnell an Grenzen, während LLMs dank ihrer Fähigkeit, Textdaten automatisiert zu verarbeiten und komplexe Klassifikationen vorzunehmen, helfen können, Ressourcen effektiv einzusetzen. Eine besondere Herausforderung bei solchen Aufgaben liegt darin, dass die Modelle oft spezifische, auf den jeweiligen Ausbruch zugeschnittene Protokolle verstehen und anwenden müssen. Beispielsweise erfordern Kontaktverfolgungen beim Mpox-Ausbruch die Berücksichtigung sensibler Informationen zur sexuellen Aktivität, einem Thema, das bei der KI-Entwicklung häufig nur eingeschränkt berücksichtigt wird.
Um diesen Anforderungen gerecht zu werden, setzen Entwickler auf sogenannte Few-Shot-Lernansätze, bei denen das Modell anhand weniger Beispiele lernt, die speziellen Regeln anzuwenden. Dadurch konnte ein signifikanter Leistungsanstieg erzielt werden, der aufzeigt, dass LLMs in dynamischen und komplexen Szenarien zunehmend verlässlich eingesetzt werden können. Auch außerhalb von Krisensituationen erleichtern LLMs den Alltag im öffentlichen Gesundheitswesen. Prozesse, die bisher viel manuelle Arbeit erforderten, lassen sich automatisieren oder zumindest ergänzen. Ein Beispiel hierfür ist die Entschlüsselung von Freitextfeldern mit Ortsangaben, etwa bei der Tuberkulosetuberkulose-Vorsorge, um das individuelle Risiko durch Herkunftsregionen besser abzuschätzen.
Solche Daten sind oft unvollständig oder uneinheitlich formuliert und erschweren somit eine automatisierte Weiterverarbeitung. Durch den Einsatz von LLMs können diese Einträge systematisch analysiert und Länder korrekt zugeordnet werden, was Experten erheblich entlastet und die Präzision erhöht. Darüber hinaus werden LLMs genutzt, um die Konsistenz und Aktualität von Gesundheitsrichtlinien zu verbessern. In dynamischen Umfeldern mit ständig wechselnden Empfehlungen ist es eine Herausforderung, widersprüchliche oder veraltete Informationen zu identifizieren. KI-Modelle scannen Dokumente auf relevante Passagen und erkennen Inkonsistenzen, was die Qualitätssicherung unterstützt.
Ein eigens entwickeltes Dashboard ermöglicht es den Anwendern, neue Richtlinien mit bestehenden zu vergleichen und potenzielle Konflikte schnell zu erkennen. Die Implementierung von LLMs im öffentlichen Gesundheitssektor bringt nicht nur technologische Vorteile mit sich, sondern erfordert auch einen verantwortungsvollen Umgang. Datenschutz, Fairness und mögliche Verzerrungen in den Daten müssen sorgfältig berücksichtigt werden, um Vertrauen in die Systeme zu schaffen. Die Evaluierung der Modelle im Hinblick auf Bias und soziale Gerechtigkeit ist daher ein fester Bestandteil der Forschungsarbeit. Zusammenfassend lässt sich festhalten, dass Large Language Models das Potenzial besitzen, das öffentliche Gesundheitswesen auf mehreren Ebenen zu transformieren.