Der Rechtsstreit zwischen der New York Times (NYT) und Microsoft, wie er im Jahr 2025 vor dem Southern District of New York verhandelt wurde, stellt einen der bedeutendsten Fälle in der noch jungen Geschichte der Künstlichen Intelligenz und deren Schnittstelle zum Urheberrecht dar. Obwohl Microsoft der offizielle Angeklagte ist, spielt OpenAI eine zentrale Rolle in dem Verfahren, da ihre generativen KI-Systeme direkt betroffen sind. Diese Auseinandersetzung beleuchtet die komplexen rechtlichen Herausforderungen, die sich durch die Nutzung urheberrechtlich geschützter Inhalte für das Training großer Sprachmodelle (Large Language Models, LLMs) ergeben, und liefert Einsichten, wie sich das US-amerikanische Rechtssystem dieser neuen technologischen Realität anpasst. Im Kern wirft der Fall eine grundlegende Frage auf: Dürfen Unternehmen wie OpenAI und Microsoft öffentlich zugängliche Texte für das maschinelle Lernen verwenden, ohne dabei gegen das Urheberrecht zu verstoßen? Die New York Times argumentiert, dass ihre Werke durch die Trainingsdaten der KIs verletzt werden, insbesondere wenn die KI-Modelle anschließend Passagen wortgetreu oder stark an die Originaltexte angelehnt reproduzieren – ein Vorgang, der im Gerichtsverfahren als "Regurgitation" bezeichnet wird. Es wurde vor Gericht differenziert zwischen zwei Phasen der KI-Nutzung: der Trainingsphase, in der eine Fülle von Texten – einschließlich der Werke der Kläger – zum Lernen und Optimieren der Modelle verwendet wird, sowie der Ausgabestufe, bei der die KI in Reaktion auf Nutzeranfragen Inhalte generiert.
Letzterer Schritt steht besonders im Fokus der Urheberrechtsbehauptungen. Die Klage umfasst verschiedene rechtliche Ansprüche, darunter direkten Urheberrechtsverstoß, mittelbare und mitwissende Urheberrechtsverletzungen sowie Verstöße gegen den Digital Millennium Copyright Act (DMCA). Zusätzlich wurden Vorwürfe wie unlauteren Wettbewerb und Markenverwässerung erhoben, was die umfangreichen und vielseitigen rechtlichen Dimensionen des Falls illustriert. Ein zentrales Element der Verteidigung war der Einwand der Verjährung. Microsoft und OpenAI argumentierten, dass die Verwendung der Werke bereits mehr als drei Jahre vor der Klageeinreichung begann, sodass die Ansprüche nicht mehr geltend gemacht werden könnten.
Die New York Times' Antwort darauf war komplexer, indem sie betonte, dass das Bewusstsein für die spezifischen rechtlichen Verletzungen erst kürzlich ausreichend ausgeprägt war, trotz früherer Berichterstattungen über OpenAI und seine Methoden. Das Gericht ließ diese Frage offen, nahm jedoch eine mögliche verspätete Klageerhebung noch nicht vorweg. Ein besonders interessantes Element des Urteils betraf den Vorwurf der mitwissenden Urheberrechtsverletzung. Nach der Rechtsprechung im Second Circuit muss für eine solche Haftung nachgewiesen werden, dass ein Dritter tatsächlich direkt urheberrechtlich verletzt hat, der Beklagte von dieser Verletzung wusste oder wissen musste und aktiv zu dieser Verletzung beitrug. Die Kläger argumentierten überzeugend, dass Microsoft und OpenAI sich bewusst urheberrechtlich geschützte Inhalte zu eigen machten und diese in das Training der Modelle einfließen ließen.
Die Beklagten verwiesen auf frühere Präzedenzfälle wie Sony und Grokster, welche für Technologien mit erheblichen rechtmäßigen Verwendungen bekannt sind – doch das Gericht entschied, dass es dafür noch zu früh sei, einen abschließenden Beschluss zu fällen. Diese Entscheidung hebt das Prinzip hervor, dass der fortlaufende Einfluss und die aktive Bindung der Beklagten an den Prozess eine andere Haftungssituation schaffen als bei früheren Fällen. Eine weitere kritische Komponente war die Analyse der DMCA-Ansprüche. Der DMCA regelt den Umgang mit sogenannten „Copyright Management Information“ (CMI), also Hinweisen oder Metadaten, die Urheberrechtshinweise enthalten. Die Kläger führten an, dass Microsoft und OpenAI diese Informationen im Rahmen des Trainingsprozesses entfernten oder veränderten – und damit gegen die Schutzvorschriften verstießen.
Das Gericht differenzierte hier zwischen den beteiligten Parteien: Microsoft wurde entlastet, da keine ausreichenden Anhaltspunkte gezeigt wurden, dass Microsoft selbst die CMI entfernte. Bei OpenAI fanden die Forderungen der Kläger mehr Gehör, besonders bei den Klägern wie der Daily News und der Copyright Information Registry, die spezifische Vorwürfe hinsichtlich der Entfernung von Urheberrechtshinweisen detailliert darlegten. Im Gegensatz dazu scheiterten die Klagen gegen beide Beklagten im Bezug auf die Verbreitung von Werken ohne CMI, da die vom Gericht geprüften Ausgaben der KI lediglich Passagen oder Auszüge enthielten und keine vollständigen identischen Kopien waren. Dies stellte eine hohe Hürde für die Kläger dar, da der DMCA hier vorschreibt, dass erst die Verbreitung nahezu unveränderter Kopien zur Haftung führen kann. Neben dem Bundesurheberrecht spielten auch staatliche Gesetze zur Bekämpfung unlauteren Wettbewerbs eine Rolle.
Insbesondere wurden sogenannte „hot news“-Ansprüche vom Gericht aufgrund von Bundesrechtsschutzvorrang, der sogenannten Präemption, zurückgewiesen. Dieses Argument ist wichtig, da es bundesrechtliche Standards für den Umgang mit urheberrechtlich geschützten Inhalten gegenüber verwandten Landesgesetzen abgrenzt – eine weitere Abgrenzung, die die Rechte der Kläger erschwerte. Eine unerwartete Entwicklung war die Einbeziehung von Markenrechtsklagen gegen OpenAI. Die Kläger behaupteten, dass durch die Verwendung ihrer Marken in qualitativ minderwertigem oder fehlerhaften Textmaterial eine Verwässerung und Rufschädigung entstanden sei. Das Gericht ließ diesen Anspruch jedoch vorerst zu, da plausible Argumente dafür vorlagen, dass die Marken als „berühmt“ im Sinne des Gesetzes gelten könnten.
Dennoch äußerte sich die Kommentierung skeptisch gegenüber der Substanz dieser Ansprüche, da wirtschaftliche Auswirkungen keineswegs automatisch eine Markenverwässerung bedeuten. Zusammenfassend zeigt das Urteil, wie schwierig es ist, klare Rechtsstandards zur Nutzung geschützter Inhalte durch KI-Systeme zu formulieren. Die Entscheidung enthält kaum greifbare Leitlinien für Entwickler von KI-Modellen, sondern fokussiert sich vielmehr auf eng abgegrenzte technische Fragen im Urheberrecht, dem DMCA und dem Markenrecht. Gerade der Umstand, dass contributory infringement, also die Haftung für mittelbare Urheberrechtsverletzungen, im Raum bleibt, ist eine wichtige Signalwirkung für die Entwicklerbranche. Zudem wirft die Entscheidung fundamentale Fragen zur Verantwortlichkeit für von KI generierte Inhalte auf: Das Gericht machte deutlich, dass selbst wenn Nutzer als diejenigen gelten, die Ausgaben generieren, die Hersteller der Modelle trotzdem für direkte oder mittelbare Urheberrechtsverstöße haftbar gemacht werden können.
Diese Differenzierung unterstreicht, wie komplex die Haftungsregelungen im Kontext der KI-generierten Inhalte sind. Die Abgrenzung zwischen sogenannten „Regurgitationen“ – wortwörtlichen oder nahezu identischen Wiedergaben geschützter Inhalte – und den viel häufiger auftretenden „Abridgements“, also Zusammenfassungen oder Übersichten, wirkt sich wesentlich auf die juristische Bewertung aus. Nur letztere wurden vom Gericht als in der Regel nicht urheberrechtsverletzend angesehen. Diese Unterscheidung ist von hoher Relevanz, da sie die potenzielle Haftung auf wesentliche und konkret nachweisbare Fälle beschränkt. Hinsichtlich der Ansprüche nach dem DMCA ist festzuhalten, dass deren Erfolg stark von der Darstellung der Abläufe bei der Verarbeitung und Entfernung von Urheberrechtshinweisen abhängt.
Die klare Entscheidung zu Lasten nicht ausreichend detaillierter Darstellungen zeigt, dass Kläger hier sehr präzise und fundierte Angaben vorlegen müssen, um vor Gericht bestehen zu können. Im Ergebnis bleibt das Urteil ein Meilenstein, der die Richtung vorgibt, in die sich die kommende Rechtsprechung bewegen wird. Es sendet Signale an die KI-Industrie, dass die Nutzung urheberrechtlich geschützter Werke für Trainingszwecke keineswegs risikolos bleibt. Gleichzeitig verdeutlicht es, wie schwer es ist, klare und praktikable Regeln zu definieren, die sowohl den Schutz von geistigem Eigentum als auch die Förderung technologischer Innovationen gewährleisten. Die juristische Landschaft rund um KI und Urheberrecht wird in den kommenden Jahren sicherlich weiter dynamisch bleiben.
Dieses erstinstanzliche Urteil wird dabei häufig als Referenzpunkt dienen, auch wenn es offenkundig noch viele Fragen offenlässt. Für Entwickler, Medienunternehmen und Juristen gilt es deshalb, wachsam die nächsten Schritte der Rechtsprechung zu verfolgen und gegebenenfalls das eigene Vorgehen anzupassen. Die komplexen Zusammenhänge zwischen Urheberrecht, DMCA, Markenrecht und KI-Technologien erfordern eine enge Zusammenarbeit von Fachleuten aus Recht, Technik und Wirtschaft, um nachhaltige Lösungen zu erarbeiten. Eines ist jedoch klar geworden: Der Schutz geistigen Eigentums wird auch in der Ära der Künstlichen Intelligenz eine zentrale Rolle spielen und muss mit den Erfordernissen moderner Technologieentwicklung in Einklang gebracht werden.