Der Kryptowährungsmarkt erlebt seit Jahren ein enormes Wachstum, doch mit dem Aufstieg dieser digitalen Währungen sind auch neue Formen der Marktmanipulation entstanden. Eine dieser, besonders im Bereich der kleineren Coins weit verbreiteten, Methoden ist das sogenannte Pump and Dump. Die Praxis, deren Ziel es ist, den Preis eines Coins künstlich in die Höhe zu treiben, um ihn anschließend gewinnbringend zu verkaufen, stellt sowohl für Investoren als auch für die Integrität der Märkte eine ernsthafte Gefahr dar. In diesem Kontext gewinnt der sogenannte Pump and Dump-Datensatz besonders an Bedeutung, da er nicht nur die Analyse solcher Manipulationen ermöglicht, sondern auch die Grundlage für die Entwicklung von Erkennungs- und Schutzmechanismen bildet. Pump and Dump als Phänomen ist kein neues Konzept und stammt ursprünglich aus dem klassischen Aktienhandel, hat sich aber mit der Einführung digitaler Währungen neu manifestiert.
Im Kern handelt es sich um eine organisierte Gruppe, oft über Plattformen wie Telegram, die eine Vielzahl von Investoren, sogenannte „Pumper“, dazu bringen, einen Coin innerhalb kürzester Zeit massiv zu kaufen. Durch diesen Anstieg des Handelsvolumens und der Nachfrage steigt der Preis rapide an – das sogenannte „Pump“. Nachdem der Kurs je nach Erfolg des Pumps ein bestimmtes Niveau erreicht hat, beginnen die Organisatoren, aber auch viele Teilnehmer, ihre Coins zu verkaufen, was zu einem dramatischen Kursverfall, dem „Dump“, führt. Für Anleger, die den Einstieg zu spät oder gar nach dem Höhepunkt wählen, entstehen oft empfindliche Verluste. Die Frage, wie solche Manipulationen zuverlässig entdeckt werden können, ist für Forscher, Regulierungsbehörden und auch für Anleger enorm wichtig.
Genau an dieser Stelle kommt der Pump and Dump-Datensatz ins Spiel. Dieser Datensatz ist eine erweiterte Sammlung von dokumentierten Pump-und-Dump-Ereignissen, die anhand von Telegram-Gruppen organisiert wurden, einer der wichtigsten Plattformen für die Verbreitung der Pumpe-Signale. Die Daten umfassen detaillierte Informationen zu den jeweiligen Trading-Paaren, Zeitpunkten, beteiligten Gruppen und den Transaktionen auf der Binance-Börse, einer der größten Handelsplattformen weltweit. Der Pump and Dump-Datensatz stellt sämtliche Pump-Events in der Datei „pump_telegram.csv“ zur Verfügung.
Jedes Ereignis wird durch grundlegende Parameter beschrieben, wie den Symbolnamen des Coins, den Gruppencode des Signalgebers, Datum und Uhrzeit des Ereignisses sowie die betroffene Handelsplattform. Besonders interessant ist, dass alle Pump-and-Dump-Aktionen auf den Handelspaaren mit Bitcoin (SYM/BTC) stattfinden, was einen einheitlichen Bezugsrahmen schafft. Ergänzend dazu existiert eine Gruppendatei namens „group.csv“, die nähere Beschreibungen zu den beteiligten Telegram-Communities liefert, inklusive ihrer Links, Last-Check-Zeitpunkten und Gruppennamen. Die Aussagekraft des Datensatzes wird durch den Zugriff auf die Rohdaten der Transaktionen auf der Binance-Börse erhöht.
Über ein bereitgestelltes Skript können alle Transaktionen rund um die Zeitpunkte der Pump-Events heruntergeladen und analysiert werden. Diese Daten liefern Einblicke in das Handelsverhalten der Teilnehmer, wie etwa Zeitstempel, Handelstyp (Kauf oder Verkauf), Preis und das gehandelte Volumen in Bitcoin. Die granularen Handelsdaten liefern damit die Grundlage für die Entwicklung von Algorithmen zur Erkennung der Manipulationen in Echtzeit. Die Aufbereitung der Daten für maschinelles Lernen ist ein weiterer zentraler Punkt bei der Nutzung des Pump and Dump-Datensatzes. Das Projekt umfasst spezielle Python-Skripte, die unterschiedliche Merkmale innerhalb bestimmter Zeitfenster (Chunks) berechnen: Standardabweichungen und Mittelwerte von Handelsvolumen, Handelsanzahl und Preisen sowie die Bewegung der Höchst- und Tiefstpreise.
Diese analytischen Features erlauben es, typische Muster des Pump-and-Dump-Verhaltens zu identifizieren. Bemerkenswert ist, dass die Forscher in ihrem Ansatz auch berücksichtigt haben, dass die eigentliche Manipulation oft vor der offiziellen Bekanntgabe auf Telegram startet. Deshalb werden besondere Zeitfenster, sogenannte „gelabelte Chunks“, auch schon bis zu zwei Minuten vor der öffentlichen Signalisierung annotiert, um das tatsächliche Startzeitfenster genau abzubilden. Die Bedeutung des Pump and Dump-Datensatzes reicht jedoch weit über die technische Analyse hinaus. Für den Marktschutz und die staatliche Regulierung ist das Verständnis solcher Manipulationsnetzwerke essenziell.
Nur durch fundierte Daten und transparente Studien lassen sich mutmaßliche Marktverzerrungen klar identifizieren und verfolgen. Dabei bietet der Datensatz sowohl frei zugängliche Rohdaten als auch ausgeklügelte Feature-Analysen, die für akademische Studien und industrielle Anwendungen gleichermaßen wertvoll sind. Gleichzeitig zeigt die Offenlegung und Aktualisierung des Datensatzes, wie wichtig die gemeinschaftliche Arbeit in der Open-Source-Szene ist. Forscher und Entwickler können ihre eigenen Erkenntnisse und Ergänzungen einbringen, um das Modell weiterzuentwickeln und auf zeitgemäße Herausforderungen zu reagieren. Die einfache Installation ermöglicht es auch weniger erfahrenen Anwendern, die Daten und Tools zu nutzen und damit neue Erkenntnisse oder sogar Frühwarnsysteme zu entwickeln.
Im Kern steht damit die Bestrebung, Transparenz und Fairness im Kryptohandel zu fördern. Indem wiederholte und systematische Manipulationsmuster sichtbar gemacht werden, unterstützt der Pump and Dump-Datensatz Investoren darin, bessere Handelsentscheidungen zu treffen und Risiken zu minimieren. Gleichzeitig bietet das Dataset wertvolle Anhaltspunkte für die Regulierung und Überwachung der Märkte. Trotz aller technologischen Fortschritte bleiben Herausforderungen bestehen. Die hohen Volatilitäten auf Kryptowährungsmärkten erzeugen natürliche Schwankungen, die von Manipulationen nur schwer zu unterscheiden sind.
Darüber hinaus entwickeln sich die Methoden der Organisatoren ständig weiter, was eine kontinuierliche Aktualisierung und Anpassung der Datensätze und Erkennungssysteme erfordert. Abschließend zeigt der Pump and Dump-Datensatz, wie datengetriebene Forschung helfen kann, die teilweise undurchsichtigen Märkte der Kryptowährungen transparenter zu machen und illegitime Praktiken aufzudecken. Die enge Verbindung zwischen realen Handelsdaten, sozialen Medien und maschinellen Lernverfahren schafft ein wirkungsvolles Instrument, um die Dynamik von Pump-and-Dump-Events besser zu verstehen und damit den Schutz der Handelsgemeinschaft zu verbessern. Für alle, die sich mit Kryptowährungen beschäftigen – sei es als Händler, Forscher oder Regulator – stellt der Pump and Dump-Datensatz deshalb eine unverzichtbare Ressource dar, die den Kampf gegen Marktmanipulationen entscheidend vorantreibt.