Im Zeitalter der Künstlichen Intelligenz (KI) hat sich die Überzeugung festgesetzt, dass Daten der ultimative Wettbewerbsvorteil sind. Besonders viele Startups preisen ihre Fähigkeit an, einzigartige Datenmengen zu sammeln oder schwer zugängliche Informationen zu erschließen. Diese Daten sollen ihnen angeblich eine uneinnehmbare Stellung im Markt sichern – eine sogenannte „Datenmoat“. Doch wer genauer hinsieht, erkennt, dass diese Erwartung oft nicht der Realität entspricht. Daten allein schaffen keine natürlichen Monopole, die andere Wettbewerber ausschließen.
Vor einigen Jahren war das gängige Narrativ, dass die schiere Menge an Rohdaten das entscheidende Unterscheidungsmerkmal ist, das Unternehmen in eine nahezu uneinholbare Spitzenposition bringt. Die Vorstellung von einem „Gott-Modell“ entstand, einem Supermodell, das basierend auf enormen Datenmengen eine selbstverstärkende Erfolgsspirale in Gang setzt, die nur schwer einholbar ist. Doch bereits in der Praxis wurde diese These durch die Erkenntnisse über abnehmende Erträge bei der Skalierung von Daten widerlegt. Mehr Daten bedeuteten nicht automatisch mehr Nutzen, und die anfänglichen Vorteile schwanden schnell. Mit dem Scheitern dieses Quantitätsnarrativs verlagerte sich der Fokus auf die Qualität der Daten.
Spezialisierte, „weiche“ Daten aus zuvor unerreichbaren Geschäftsprozessen sollten die neue Goldgrube sein. Diese Daten sollten schwer zugänglich und somit wertvoller sein und den Unternehmen erlauben, repetitive Prozesse effizient zu automatisieren und so einen nachhaltigen Vorteil zu erzielen. Die Verheißung war, dass durch das Lesbarmachen solcher komplexen Prozesse mittels KI ein dauerhafter Wettbewerbsvorteil entstehen würde, weil die Nachahmung nicht so einfach möglich sei. Allerdings zeigt die Realität ein anderes Bild. Innovationen wie das „friendly assistant“-Persona-Konzept von ChatGPT oder Suchintegrationen wie bei Perplexity haben zwar bemerkenswerte Durchbrüche im Nutzererlebnis gebracht, sind jedoch inzwischen bei nahezu allen großen KI-Anbietern angekommen und etabliert.
Diese spezialisierten Daten führen nicht mehr zu einem Monopol, sondern sind vielmehr zum Industriestandard geworden. Die Vorteile solcher Datenstrukturen verschwimmen, sobald Wettbewerber diese adaptieren können. Ein wesentlicher Faktor für die schnelle Diffusion spezialisierter Datenvorteile ist das Phänomen der Modell-Distillation. Dabei werden KI-Modelle auf Outputs anderer Modelle trainiert, was bewusst als Strategie eingesetzt wird oder durch die allgemeine Verbreitung von KI-Outputs im Netz passiert. Das hat zur Folge, dass exklusive Erkenntnisse oder Besonderheiten eines Modells schnell ins öffentliche Daten-Ökosystem eindringen und so die Exklusivität der Datenbasis reduzieren.
Daraus folgt eine wichtige Erkenntnis: Daten sind eher eine gemeinsame Ressource als ein exklusives Kapital. Im Gegensatz zu klassischen natürlichen Monopolen hängt der Wert der Daten nicht damit zusammen, dass Konkurrenz abgeschottet oder ausgeschlossen wird, sondern vielmehr davon, wie effektiv Unternehmen Daten sammeln, aufbereiten und in Mehrwert umsetzen. Gleichzeitig steigt für den Marktführer der Aufwand, um noch substanzielle Verbesserungen zu erzielen, während Nachzügler oft mit vergleichsweise geringem Aufwand aufschließen können. Ein weiterer Aspekt, der die Illusion der Datenmoat schwächt, ist die Nachahmbarkeit von Geschäftsprozessdaten. Viele Unternehmen versuchen heute, interne Abläufe durch KI besser sichtbar und automatisierbar zu machen.
Obwohl das einen realen Mehrwert schafft, ist die Implementierung solcher Systeme kein dauerhafter Vorteil für das erste Unternehmen, das sie eingeführt hat. Sobald die Technik und Methodik bekannt sind, lässt sie sich von Konkurrenten kopieren und weiter verbessern. Die angebliche „Undurchsichtigkeit“ oder „Unlesbarkeit“ von Geschäftsprozessen ist somit eher ein Hindernis, das sich überwinden lässt, anstatt ein undurchdringlicher Schutzwall. Das Legitimieren und Schützen von Daten erfordert inzwischen oft juristische Mittel wie exklusive Verträge oder Patente. Doch dies führt in eine völlig andere Dimension von Wettbewerb, die weniger auf technologischer Einzigartigkeit als auf rechtlicher Absicherung beruht.
Während solche Strategien einen gewissen Schutz bieten können, entfernen sie Unternehmen von der natürlichen Marktdynamik, hin zu einer kontrollierten Vormachtstellung durch rechtliche Mechanismen. Daten sind damit nicht die uneinnehmbare Burg, sondern eher das Vorfeld – die äußere Beringung eines potenziellen Schlosses, das erst durch andere Faktoren geschützt wird. Ein nachhaltiger Wettbewerbsvorteil entsteht durch die souveräne Kombination von Daten, technologischer Exzellenz im Modelltraining, Benutzererfahrung sowie der Fähigkeit, Geschäftsprozesse sinnvoll zu orchestrieren. Daten allein sind heute unzureichend, um sich dauerhaft gegen Nachahmer abzugrenzen. Es bleibt die Frage, wie Unternehmen in diesem Umfeld erfolgreich agieren können.
Erstens ist eine kontinuierliche Innovation und Verbesserung von KI-Modellen notwendig, die über die reine Datensammlung hinausgeht. Zweitens kommt der Integration und Anwendung von Daten eine entscheidende Rolle zu – der Nutzen entsteht erst durch die intelligente Verknüpfung von Informationen mit anwenderorientierten Lösungen. Drittens muss die Wettbewerbslandschaft akzeptieren, dass Geschwindigkeit der Anpassung und das Teilen von Wissen oft größerer Wert haben als der Besitz einzelner Datensätze. Der Blick auf die Zukunft der KI-Entwicklung deutet darauf hin, dass Daten zunehmend als Commodities betrachtet werden, die jeder mit passenden Mitteln erschließen kann. Das Besondere entsteht durch die Synthese aus Daten und Algorithmen, durch anwendungsorientierte Innovationen und durch strategische Positionierungen im Umfeld sich ständig verändernder Technologien.