Stablecoins

Konsistent inkonsistent: Fünf Monate der nicht-deterministischen Filmempfehlungen von KI

Stablecoins
Consistently inconsistent: 5-month of AI's non-deterministic movie tips

Eine umfassende Analyse der Schwankungen und Herausforderungen von KI-generierten Filmempfehlungen über fünf Monate hinweg, mit Fokus auf die Auswirkungen für Marken und Marketingstrategien im KI-Zeitalter.

In den letzten Jahren hat die Verwendung von Künstlicher Intelligenz (KI) für Empfehlungen massiv zugenommen. Verbraucher verlassen sich immer mehr auf KI-Systeme wie ChatGPT, Google Gemini oder Perplexity, um fundierte Entscheidungen bei der Auswahl von Filmen, Produkten oder Dienstleistungen zu treffen. Doch während diese Systeme beeindruckende Fähigkeiten zeigen, offenbart sich eine fundamentale Eigenschaft der meisten großen Sprachmodelle (LLMs): ihre inhärente Nicht-Determinismus, also die Tatsache, dass sie bei identischen Eingaben nicht immer dieselbe Antwort liefern. Die Folge sind schwankende Empfehlungen, die erhebliche Auswirkungen auf Unternehmen und Marken haben können, die auf Sichtbarkeit in diesen KI-Antworten angewiesen sind. Ein besonderer Fokus liegt hierbei auf Filmempfehlungen, da der Filmsektor gut dokumentiert ist und aufgrund seiner kulturellen Bedeutung einen interessanten Einblick in das Verhalten von KI-Systemen erlaubt.

Ein spannendes Experiment wurde von Trackerly durchgeführt, bei dem über einen Zeitraum von fünf Monaten täglich dieselbe Frage an verschiedene KI-Plattformen gestellt wurde: "Welche Filme gelten als Allzeit-Klassiker?" Diese einfache, aber aussagekräftige Fragestellung diente dazu, die Stabilität und Variabilität der empfohlenen Filme zu messen. Die Ergebnisse zeigen eine überraschende Mischung aus Mustererkennung, Schwankungen und systembedingten Eigenheiten der verschiedenen KI-Anbieter. Die Ergebnisse des Experiments zeigten, dass trotz der großen Menge an Trainingsdaten (von Wikipedia, IMDb, Reddit und zahlreichen Filmseiten) keine zwei Antworten von ChatGPT identisch waren, obwohl viele der häufig genannten Filme einem stabilen Kern entsprachen. Filme wie "Citizen Kane", "Der Pate" und "Casablanca" gehörten regelmäßig zu den Top-Empfehlungen, doch die exakte Reihenfolge und die Position innerhalb der Liste schwankten mit jeder Abfrage. Selbst die Platzierung von Filmen wie "Pulp Fiction" variierte erheblich, was verdeutlicht, wie dynamisch die Antworten trotz offensichtlicher Konsistenz des Themenbereichs sind.

Um diese Schwankungen besser analysieren zu können, wurde die Metrik "Relative Position of First Mention" (RPOFM) eingeführt. Dieser Wert beschreibt die Stelle, an der ein Film in der KI-Antwort erstmals genannt wird, berechnet als Verhältnis zwischen der Position des ersten Auftretens und der Gesamtlänge der Antwort. Diese Normalisierung ermöglicht es, die relative Bedeutung, die einem Film in der Antwort eingeräumt wird, zu untersuchen und Schwankungen im Zeitverlauf transparent zu machen. Im Vergleich zu ChatGPT zeigte Googles Gemini eine bemerkenswerte Stabilität in den Empfehlungen. Zwar verzögerte Gemini seine eigentlichen Vorschläge oft durch eine längere Einleitung und zusätzliche Erklärungen, doch die Filmempfehlungen selbst blieben konstant, mit einer wiederkehrenden Fixierung auf "Citizen Kane", "Casablanca" und "Der Pate".

Auffällig war im Februar 2025 eine Änderung im Verhalten von Gemini, als es begann, ausführliche erklärende Texte am Ende jeder Antwort hinzuzufügen. Dies führte zwar zu längeren Antworten, veränderte aber auch die relative Sichtbarkeit der empfohlenen Filme innerhalb des Textes. Anthropics Claude, ein weitere Mitspieler in diesem Feld, zeigte ebenfalls eine feste Filmkern-Empfehlung, variierte aber öfter in der Darstellungsform. Mal wurden die Filme einfach aufgelistet, mal nach Genres sortiert. Dennoch blieb die Kernauswahl der Filme zumeist stabil, wodurch Claude sich in Sachen Konsistenz zwischen Gemini und ChatGPT positionieren kann.

Das überraschendste Verhalten wurde jedoch beim KI-System Perplexity beobachtet. Obwohl Perplexity für jede Antwort sorgfältige Quellenangaben macht und somit in der Theorie eine höhere Zuverlässigkeit bieten sollte, wies es die stärkste Variabilität in den Empfehlungen auf. In einigen Antworten interpretiert Perplexity die Frage in Richtung KI-bezogener Filme und empfiehlt Klassiker wie "Blade Runner" oder "2001: Odyssee im Weltraum". In anderen Fällen hingegen listet es eher traditionelle Klassiker wie "Der Pate" oder "Citizen Kane". Dieses inkonsistente Verständnis der identischen Abfrage führt zu starken Schwankungen, die kaum vorhersagbar sind.

DeepSeek, eine weitere Plattform, die ab Mitte Februar 2025 ins Tracking aufgenommen wurde, erwies sich trotz technischer Probleme (Verbindungsfehler) als eine der stabilsten Quellen für konsistente Filmempfehlungen. Die Plattform stellte regelmäßig Filme wie "Der Pate", "Casablanca", "Citizen Kane", "Vom Winde verweht" und "Schindlers Liste" in den Vordergrund und veränderte deren Reihenfolge kaum. Die Ergebnisse dieses Vergleichs unterstreichen eine Reihe von wichtigen Erkenntnissen, die insbesondere für Marken und Marketingspezialisten von Bedeutung sind. Die inhärente Nicht-Deterministik von großen Sprachmodellen bringt eine erhebliche Unsicherheit mit sich. Selbst bei Themen mit extrem hoher Bekanntheit und umfangreicher Trainingsdatengrundlage ist die genaue Reihung von Empfehlungen nicht stabil.

Das bedeutet, dass Sichtbarkeit auf KI-Plattformen einer ständigen Veränderung unterliegt und nicht als einmaliges Erreichen eines Spitzenplatzes missverstanden werden darf. Diese Volatilität variiert stark zwischen den Plattformen. Während Gemini und DeepSeek eine vergleichsweise hohe Konsistenz aufweisen, sind ChatGPT und Perplexity deutlich schwankender. Interessanterweise garantiert auch eine starke Quellenangabe nicht automatisch Stabilität, wie das Beispiel von Perplexity zeigt. Änderungen seitens der Plattformanbieter, etwa die Einführung umfangreicher erklärender Texte in Gemini, können zudem die Wahrnehmung und Gewichtung der Empfehlungen abrupt verändern.

Dies ist eine wichtige Beobachtung für Unternehmen, die auf Kontinuität in der KI-basierenden Sichtbarkeit angewiesen sind. Die Studie macht außerdem deutlich, dass die Menge und Qualität der Trainingsdaten eine Schlüsselrolle spielen. Während mathematische Fakten wie "2 + 2 = 4" stets dieselbe Antwort ergeben, ist das Bild bei subjektiven oder vielschichtigen Themen erheblich komplexer. Eine Marke oder ein Thema, das weniger häufig und weniger eindeutig in den Daten repräsentiert ist, ist deutlich stärker von den zufälligen Schwankungen betroffen. Für Marken bedeutet dies, dass eine kontinuierliche Beobachtung und Anpassung ihrer AI-Sichtbarkeit unbedingt notwendig ist.

Es reicht nicht aus, einmal auf einer Empfehlungsseite berücksichtigt zu werden. Vielmehr müssen Strategien entwickelt werden, um eine möglichst stabile Präsenz zu erzielen. Trackerly-Nutzer haben hier erste positive Erfolge durch gezielte Ansätze erzielt, etwa durch eine verbesserte Vernetzung, Inhalte mit höherer Autorität und eine verstärkte Präsenz auf relevanten Plattformen, die in Trainingsdaten häufig vorkommen. Der Weg zum langfristigen Erfolg in der KI-Reputation erfordert daher eine ganzheitliche Sichtweise, welche die nicht-deterministische Grundstruktur der KI-Systeme berücksichtigt und entsprechende Strategien zur Mitgestaltung und Kontrolle der Sichtbarkeit entfaltet. Die Möglichkeiten der Analyse mit Metriken wie RPOFM und die Auswahl stabilerer Plattformen erhöht die Wahrscheinlichkeit, Sichtbarkeit zu erhalten und zu optimieren.

Insgesamt zeigt diese Untersuchung, dass die KI-generierten Empfehlungen trotz aller Fortschritte und vorhandener Datenbasis nicht als fix betrachtet werden können. Die Schwankungen sind Teil des Systems und werden auch in Zukunft eine Rolle spielen. Für Unternehmen und Marken ist es daher entscheidend, diese Dynamik zu verstehen, flexibel zu sein und die eigenen Maßnahmen permanent zu überprüfen und anzupassen. Nur so lässt sich im wachsenden Umfeld KI-getriebener Empfehlungen die höchstmögliche Sichtbarkeit nachhaltig sichern. Das Thema Künstliche Intelligenz im Empfehlungsbereich entwickelt sich kontinuierlich weiter.

Plattformen werden ihre Modelle optimieren, Trainingdaten erweitern und Strategien zur besseren Kontrolle der Relevanz einführen. Doch solange der Kernalgorithmus nicht deterministisch gestaltet ist, wird Variabilität bleiben. Die Zukunft gehört daher jenen Akteuren, die nicht nur die Technik verstehen, sondern auch auf die unvermeidbare Inkonsistenz reagieren können, um erfolgreich in der neuen digitalen Empfehlungslandschaft zu bestehen.

Automatischer Handel mit Krypto-Geldbörsen Kaufen Sie Ihre Kryptowährung zum besten Preis

Als Nächstes
Apple wants to take control of the chips used in your iPhone: the roadmap
Mittwoch, 04. Juni 2025. Apple übernimmt die Kontrolle über iPhone-Chips: Ein Blick auf die Zukunft der Mobilfunktechnologie

Apple verfolgt eine ehrgeizige Strategie, um die Kontrolle über die Chips in iPhones und weiteren Apple-Geräten zu übernehmen. Ein umfassender Fahrplan zeigt, wie das Unternehmen Qualcomm und Broadcom ablösen und mit eigenen Innovationen die Mobilfunk- und Netzwerktechnologie revolutionieren will.

Analyzing em dash usage across tech-focused subreddits
Mittwoch, 04. Juni 2025. Die Bedeutung des Gedankenstrichs in Tech-Subreddits: Eine Analyse der Em-Dash-Nutzung

Eine detaillierte Untersuchung der Verwendung des Gedankenstrichs (Em Dash) in technologieorientierten Subreddits, die aufzeigt, wie diese stilistische Marker Aufschluss über Trends in der KI-generierten Schreibweise geben können.

Typed Lisp, a Primer
Mittwoch, 04. Juni 2025. Typed Lisp verstehen: Ein umfassender Leitfaden zur Typisierung in Lisp

Eine ausführliche Einführung in das Typensystem von Lisp mit Vergleichen zu Haskell, praktischen Beispielen und Einblicken in dynamische und statische Typisierung.

Binance Signs Strategic MoU with Kyrgyzstan to Launch Binance Pay and Academy, CEO Changpeng Zhao Advises on Blockchain Regulation
Mittwoch, 04. Juni 2025. Binance und Kirgisistan: Eine strategische Partnerschaft für die Zukunft der Blockchain-Technologie

Binance stärkt mit einer strategischen Vereinbarung das digitale Ökosystem in Kirgisistan durch die Einführung von Binance Pay und die Gründung der Binance Academy. CEO Changpeng Zhao gibt zudem wertvolle Einblicke in die Entwicklung der Blockchain-Regulierung in der Region.

Bybit to Launch Direct Trading of US Stocks Including Apple, Microsoft, 500x Leverage, Gold Popular by End of Q2
Mittwoch, 04. Juni 2025. Bybit revolutioniert den Handel: Direkter US-Aktienhandel mit Apple, Microsoft und 500-fachem Hebel ab Ende Q2

Bybit plant, den direkten Handel mit US-Aktien wie Apple und Microsoft sowie Gold mit bis zu 500-fachem Hebel anzubieten. Diese Neuerung könnte den Markt verändern und Anlegern neue Chancen eröffnen.

Ethereum Layer 2 Activity Surges Amid Growing Institutional Interest
Mittwoch, 04. Juni 2025. Explosive Zunahme der Ethereum Layer 2 Aktivität: Wie institutionelles Interesse die Blockchain-Revolution vorantreibt

Die Ethereum Layer 2 Netzwerke verzeichnen ein beispielloses Wachstum, angetrieben durch steigendes institutionelles Interesse und technologische Innovationen. Diese Entwicklung markiert einen entscheidenden Schritt in der Skalierung von Ethereum und zeigt, wie Layer 2 Lösungen die Blockchain-Nutzung auf ein neues Niveau heben.

Krypto-Schock: ProShares XRP-ETF löst Chaos aus
Mittwoch, 04. Juni 2025. Krypto-Schock durch ProShares XRP-ETF: Was steckt hinter dem Chaos?

Die Einführung des ProShares XRP-ETF hat die Kryptomärkte erschüttert und für erhebliche Unruhe gesorgt. Ein tiefer Einblick in die Ursachen, Auswirkungen und die Perspektiven für Anleger und die gesamte Krypto-Branche.