Die rasante Entwicklung künstlicher Intelligenz (KI) und generativer KI-Modelle hat die Art und Weise, wie Unternehmen mit Daten umgehen, grundlegend verändert. Forschungen, darunter eine bedeutende Studie von Komprise, verdeutlichen, dass viele technologische Führungskräfte derzeit große Schwierigkeiten haben, den enormen Datenmengen, die für KI-Anwendungen benötigt werden, Herr zu werden – sei es bei der Speicherung oder bei der effektiven Verwaltung dieser Daten. Diese Herausforderungen zeigen wesentliche Schwachpunkte in der Dateninfrastruktur auf und erfordern neue Herangehensweisen für den Umgang mit sensiblen Informationen und unstrukturierten Datensätzen. Gleichzeitig wächst aber auch das Bewusstsein für die Notwendigkeit, maschinell lernende Systeme mit qualitativ hochwertigen und wohlgeordneten Daten zu versorgen, um optimale Ergebnisse zu erzielen. Nur so kann der wahre Wert von KI-Technologien voll ausgeschöpft werden.
Im Zentrum der Problematik steht die Infrastruktur, die maßgeblich darüber entscheidet, wie gut Unternehmen auf die Anforderungen von KI vorbereitet sind. Laut der genannten Studie geben mehr als zwei Drittel der befragten Organisationen an, die Verbesserung der Infrastruktur als oberste Priorität zu betrachten, um KI-Initiativen zu unterstützen. Diese Tendenz zeigt, dass technologische Führungskräfte klar erkannt haben, dass leistungsfähige Speicherlösungen und die Einbindung von GPUs (grafische Prozessoren) nicht nur Luxus, sondern essenzielle Bestandteile zukünftiger IT-Strategien sind. Tatsächlich setzen fast ein Drittel der Unternehmen auf Investitionen in performante Speichertechnologien, die speziell für die Arbeit mit GPUs geeignet sind. Diese Speicherarten bieten die notwendige Geschwindigkeit und Kapazität, um große Mengen an KI-relevanten Daten effizient zu verwalten.
Doch die Herausforderung beschränkt sich nicht nur auf die reine Hardware. Die Studie hebt hervor, dass viele Unternehmen Schwierigkeiten haben, relevante unstrukturierte Daten zu finden und zu verschieben. Über die Hälfte der Befragten nennen genau das als Hauptproblem. Unstrukturierte Daten zeichnen sich durch ihre Vielfalt aus – von E-Mails, Dokumenten, Bildern bis hin zu Audio- und Videodateien – und stellen deshalb eine große Herausforderung dar, da sie nicht ohne weiteres klassifiziert oder durchsucht werden können. Fehlende Transparenz und die Abwesenheit einfacher Werkzeuge zur Klassifizierung und Segmentierung erschweren zudem die Verwaltung erheblich.
Daraus resultieren nicht nur Ineffizienzen, sondern auch Risiken im Bereich Compliance und Datenschutz, insbesondere da immer mehr sensible Informationen in den KI-Prozessen verarbeitet werden. Ein weiterer kritischer Aspekt, der die Forschung hervorhebt, betrifft die internen Uneinigkeit bezüglich Datenmanagementstrategien. Mehr als ein Drittel der Unternehmen berichten von Differenzen im eigenen Haus, wie Datenmanagement und Governance rund um KI implementiert werden sollten. Diese uneinheitlichen Ansätze können wichtige Innovationen verzögern und das Risiko von Datenlecks erhöhen. Gerade angesichts der Tatsache, dass etwa vier Fünftel der Organisationen bereits negative Erfahrungen mit der Nutzung generativer KI durch Mitarbeiter gemacht haben – darunter das versehentliche Offenlegen sensibler Daten oder die Verbreitung falscher Resultate – muss der Fokus stärker auf systematische Governance, Compliance und Mitarbeiterschulungen gelegt werden.
Hier setzen Unternehmen zunehmend auf den Einsatz automatisierter Tools zur Klassifizierung sensibler Daten, die verhindern sollen, dass vertrauliche Informationen unkontrolliert in KI-Modelle eingespeist werden. Die Automatisierung von Workflows zur Sicherstellung einer korrekten Datenverwendung wird als effektive Maßnahme angesehen und erfreulicherweise bereits von fast drei Viertel der Befragten umgesetzt oder geplant. Neben technischen Lösungen gewinnen auch Richtlinien und Trainingsprogramme für Mitarbeiter an Bedeutung, um das Bewusstsein für den verantwortungsvollen Umgang mit Daten im Kontext von KI zu erhöhen. Viele Firmen begrenzen zudem den Zugriff auf öffentliche KI-Tools und setzen verstärkt auf eigene interne KI-Anwendungen, die besser kontrollierbar sind und spezifische Datenschutzanforderungen erfüllen. Ein wesentlicher Trend zeichnet sich zudem ab: Die Mehrheit der Unternehmen plant nicht mehr, eigene KI-Modelle vollständig selbst zu trainieren.
Stattdessen liegt der Fokus darauf, die richtige firmeneigene Datenbasis für vortrainierte Modelle bereitzustellen und diese gezielt einzusetzen, um geschäftsrelevante Erkenntnisse zu gewinnen. Das bedeutet, dass Unternehmen sich verstärkt auf die Datenkuratierung und deren Aufbereitung konzentrieren müssen – besonders auf das Management unstrukturierter Daten, die im Unternehmensumfeld häufig auftreten. Die Verknüpfung eigener Daten mit leistungsfähigen KI-Modellen hat das Potenzial, durch präzise Inferencing-Prozesse wertvolle Wettbewerbsvorteile zu schaffen. Wie die Komprise-Studie verdeutlicht, entwickelt sich das Datenmanagement für KI damit zu einem Kernthema. Es fordert die IT-Verantwortlichen heraus, neue Werkzeuge für die Transparenz zu implementieren, Daten effizient zu klassifizieren und segmentieren sowie reibungslose Automatisierungsprozesse zu schaffen, die das gesamte Datenpotenzial ausschöpfen.