Die Finanzmärkte sind seit jeher von Unsicherheiten und volatilen Schwankungen geprägt. Insbesondere bei Kryptowährungen, deren Preise extrem volatil sind, gestaltet sich die Prognose zukünftiger Bewegungen oft als äußerst komplex. Aktienmärkte hingegen zeigen meist eine stabilere Entwicklung, sind jedoch ebenfalls von zahlreichen Einflussfaktoren abhängig. In den letzten Jahren hat die Künstliche Intelligenz (KI) eine immer bedeutendere Rolle bei der Analyse und Vorhersage von Finanzdaten eingenommen. Ein bedeutender Fortschritt in diesem Bereich stellt der Einsatz von Large Language Models (LLMs) dar – hochentwickelte KI-Modelle, die ursprünglich für die Sprachverarbeitung entwickelt wurden, sich jedoch zunehmend als vielversprechend für die Analyse von Finanzzeitreihen herausstellen.
Open-Source-Large-Language-Models wie GPT-2, FinBERT oder LLaMA bieten dank ihrer Trainingsstrategien und Kapazitäten die Möglichkeit, vielfältige Arten von Daten zu verarbeiten. Dies umfasst nicht nur textbasierte Informationen, sondern auch numerische oder sequenzielle Daten, wie etwa historische Preisverläufe. Gerade im Bereich der Preisvorhersage von Kryptowährungen und Aktien stellt sich die Frage, wie gut diese Modelle mit den spezifischen Herausforderungen umgehen können: von der hohen Volatilität der Kryptowährungen bis hin zu den oftmals sentimentgetriebenen Bewegungen an den Aktienmärkten.Das Ziel der Forschungsinitiative, die sich mit dem Thema Leistungsbewertung von open-source LLMs im Kontext der Preisprognose beschäftigt, liegt darin, die besten Modelle für diese komplexe Aufgabe zu identifizieren und zu optimieren. Dabei werden unterschiedliche Ansätze verfolgt, um das Potenzial der KI bestmöglich auszuschöpfen.
Kern dieser Arbeit ist die Feinabstimmung der Modelle auf Finanzzeitreihen, wobei historisch aufgezeichnete Daten in Form von OHLCV-Datensätzen (Open, High, Low, Close, Volume) als Grundlage dienen. Dies ermöglicht den LLMs, Muster im Zeitverlauf zu erkennen und zukünftige Preisbewegungen vorherzusagen.Besonders interessant ist der hybride Ansatz, bei dem LLMs mit dem klassischen Long Short-Term Memory (LSTM) kombiniert werden. LSTM ist ein spezieller Typ von rekurrentem neuronalen Netzwerk, der sehr gut geeignet ist, langfristige Abhängigkeiten in sequenziellen Daten zu erfassen. Durch die Integration von LSTM mit FinBERT, einem auf Finanzspezifika zugeschnittenen Sprachmodell, entsteht ein leistungsfähiges System, das nicht nur quantitative Daten analysiert, sondern auch stimmungsbasierte Informationen aus Finanznachrichten und Social-Media-Feeds verarbeitet.
Gerade bei Kryptowährungen, die stark von Anlegerstimmung und Marktpsychologie beeinflusst sind, zeigt diese Methode klare Vorteile.Für die Datensammlung werden renommierte Quellen genutzt. Kryptowährungsdaten werden über die ccxt-Library direkt von großen Börsen wie Kraken bezogen, was aktualisierte und präzise Marktdaten ermöglicht. Aktienkurse hingegen stammen aus dem weltweit bekannten yfinance-Service, der zuverlässige historische Daten für bekannte Unternehmen wie Apple (AAPL) und Tesla (TSLA) bereitstellt. Dies gewährleistet eine fundierte Datenbasis für die darauf aufbauende Modellierung und Analyse.
Vor der Modellierung ist die Datenvorverarbeitung von zentraler Bedeutung. Rohdaten werden zunächst bereinigt, fehlende Werte mit klugen Methoden aufgefüllt und anschließend durch Normalisierung und Skalierung aufbereitet. Diese Schritte stellen sicher, dass die Modelle stabile und aussagekräftige Trainingsdaten erhalten. Zusätzlich kommen Feature-Engineering-Techniken wie die Berechnung von gleitenden Durchschnitten oder Volatilitätsmaßen zum Einsatz, um wichtige Marktsignale hervorzuheben und den Modellen eine noch detailliertere Sicht auf die Marktdynamiken zu ermöglichen.Die Bewertungen der Modelle erfolgen anhand von standardisierten Metriken wie dem Mean Squared Error (MSE), Root Mean Squared Error (RMSE) und der Directional Accuracy (DA).
Diese Messwerte geben Auskunft darüber, wie genau die Preisvorhersagen im Vergleich zu den tatsächlichen Marktentwicklungen sind. Während der MSE zum Beispiel die durchschnittliche quadratische Abweichung der Vorhersagen beschreibt, wertet die DA aus, wie oft das Modell die Richtung der Kursbewegung richtig erkannt hat. Gerade letztere Metrik ist für Anleger und Händler essenziell, weil sie den praktischen Nutzen der Modellprognosen im Handel reflektiert.Die Ergebnisse der experimentellen Vergleiche zeigen, dass hybride Modelle, etwa die Kombination aus LSTM und FinBERT, deutlich bessere Vorhersagen bei Kryptowährungen erzielen können. Dies hängt damit zusammen, dass sentimentbasierte Informationen, die mit FinBERT extrahiert werden, einen erheblichen Einfluss auf die Preisentwicklung der volatilen Kryptomärkte haben können.
LLaMA, ein weiteres modernes Transformer-Modell, überzeugt ebenfalls durch eine hohe Genauigkeit sowohl in volatilen als auch in eher stabilen Märkten. Die Leistungsfähigkeit dieser Modelle beruht auf ihrer komplexen Architektur und der Fähigkeit, umfangreiche Zusammenhänge aus den Daten zu erfassen.Die Arbeit zeigt außerdem, dass es trotz der Fortschritte noch Herausforderungen gibt. Die hohe Volatilität von Kryptowährungen stellt die Modelle vor Probleme, insbesondere wenn plötzliche und unerwartete Ereignisse den Markt beeinflussen. Auch die Qualität und Verfügbarkeit von sentimentbezogenen Daten variieren stark, sodass die Modelle hier mit Unsicherheiten konfrontiert sind.
Dennoch liefert die Kombination aus traditioneller Zeitreihenanalyse und moderner KI-gestützter Sprachverarbeitung einen vielversprechenden Weg, um die Prognosegenauigkeit zu verbessern.Finanziell tätige Akteure, von institutionellen Investoren bis zu Privatanlegern, profitieren von diesen Innovationen durch genauere und schnellere Informationen, die in Entscheidungsprozesse einfließen können. Langfristig könnten solche KI-basierten Systeme die Markttransparenz erhöhen und möglicherweise auch zur Stabilisierung beitragen, indem sie frühzeitig Hinweise auf kommende Trends oder Marktrisiken liefern.Zusammenfassend lässt sich sagen, dass die Evaluation von open-source LLMs für die Preisvorhersage im Bereich Kryptowährungen und Aktien einen bedeutenden Beitrag zum Fortschritt auf dem Gebiet der Finanzanalyse leistet. Die Verbindung von Sprachmodellen und klassischen Zeitreihenverfahren eröffnet neue Chancen, die Komplexität der Märkte besser zu verstehen und zu nutzen.
Da die Technologie stetig voranschreitet und immer mehr hochwertige Daten verfügbar werden, ist zu erwarten, dass LLMs eine immer zentralere Rolle in der nächsten Generation von Handelssystemen und Analysesoftware spielen werden.Durch die Kombination technologischer Innovation, fundierter Datenanalyse und spezialisierten Modellen wird die Zukunft der Preisprognose im Finanzmarkt zunehmend intelligenter – und damit wertvoller für alle Marktteilnehmer, die von präzisen Vorhersagen und frühzeitiger Risikoerkennung profitieren möchten. Diese Entwicklung steht exemplarisch für die fortwährende Verschmelzung von KI und Wirtschaft, die heute bereits viele Branchen revolutioniert und auch weiterhin für bahnbrechende Veränderungen sorgt.