Im digital vernetzten Zeitalter ist die Sammlung und Auswertung personenbezogener Daten im Bereich der Werbetechnologie (AdTech) ein wesentlicher Faktor für die zielgerichtete Ansprache von Nutzern und den wirtschaftlichen Erfolg von Werbebotschaften. Mit zunehmender Sensibilisierung für Datenschutz und der Einführung strenger gesetzlicher Regelungen wie der Datenschutz-Grundverordnung (DSGVO) in Europa, dem California Consumer Privacy Act (CCPA) in den USA oder dem brasilianischen LGPD, gewinnt die handhabbare und rechtskonforme Löschung persönlicher Daten an Bedeutung. Doch gerade im Bereich von AdTech-Datensystemen gestaltet sich die praktische Umsetzung solcher Löschanfragen aufgrund der Datenmenge und der technischen Infrastruktur als komplex und kostenintensiv. Im Vergleich zu anderen Branchen, in denen persönliche Daten wie Zahlungsinformationen oder Gesundheitsdaten maximal schutzwürdig sind, wird im AdTech meist das Nutzerverhalten im Web verfolgt. Dabei gelangen technische Identifikatoren wie User-IDs, IP-Adressen oder User-Agent-Strings in die Erfassung.
Diese Informationen ermöglichen es, Nutzerpräferenzen zu verstehen und Anzeigen gezielt auszuspielen. Das Problem entsteht jedoch, wenn ein Nutzer die Löschung seiner Daten verlangt. Hier gilt es, nicht nur lokal gespeicherte Cookies im Browser zu entfernen, sondern vor allem auch die gigantischen Mengen an Daten, die über Monate oder gar Jahre verteilt in großen Cloud-Speichern wie Amazon S3 in komprimierten Formaten vorgehalten werden, zu bearbeiten. Die klassische Datenbankabfrage, bei der mittels eines einfachen Löschbefehls Daten zu einer bestimmten User-ID entfernt werden, ist in diesem Kontext nicht direkt übertragbar. AdTech-Daten liegen oft als Petabyte großer Datensätze in Analytics-optimierten Formaten wie Parquet vor.
Ein Löschvorgang würde dadurch eine extrem zeit- und ressourcenaufwändige Operation nach sich ziehen, bei der riesige Datenmengen in den Speicher geladen, gefiltert und erneut geschrieben werden müssen. Dadurch können Löschanfragen enorme Kosten verursachen, was für viele Unternehmen betriebswirtschaftlich problematisch ist. In der Praxis existieren verschiedene Handlungsansätze, um der Herausforderung der Datenlöschung in AdTech-Umgebungen zu begegnen. Eine Strategie besteht darin, persönliche Daten gar nicht erst zu speichern. Das hat den Vorteil, dass keine Löschpflicht entsteht und damit Kosten und rechtliche Risiken drastisch reduziert werden.
Gleichzeitig ist dies jedoch mit dem Verzicht auf wertvolle Analysen verbunden, die ohne diese Daten nicht mehr möglich sind. Für Unternehmen bedeutet das eine Abwägung zwischen Datenschutz und datengetriebener Innovationsfähigkeit. Ein moderaterer Ansatz sieht vor, persönliche Daten nur für einen begrenzten Zeitraum zu speichern. Nach Ablauf dieser Frist erfolgt automatisch eine Löschung, sodass nur ein überschaubarer Datenbestand aktiv verwaltet werden muss. Diese Vorgehensweise reduziert zwar die Belastung durch manuelle Löschanfragen, schränkt aber die Langzeit-Analysen ein und erfordert klare Retentionsrichtlinien, die rechtssicher implementiert werden müssen.
Ergänzend kann die Speicherung von personenbezogenen Daten und nicht-personenbezogenen Informationen in separaten Datenströmen erfolgen. So ist lediglich der kleinere Datensatz mit privaten Informationen regelmäßig zu löschen, während Anonymdaten zur strategischen Auswertung erhalten bleiben. Eine weitere technische Lösung nutzt die Pseudonymisierung von Daten durch Hashing der persönlichen Identifikatoren. Dabei werden original gespeicherte Werte wie User-IDs durch kryptographisch erzeugte Hash-Werte ersetzt, die keinen direkten Rückschluss auf den Nutzer erlauben. Wird das Browser-Cookie gelöscht, ist die Verknüpfung mit der gespeicherten Datenstruktur unterbrochen, sodass eine aktive Löschung der Serverdaten häufig nicht mehr notwendig ist.
Allerdings leidet darunter die Möglichkeit, detaillierte Nutzerprofile zu erstellen oder einzelne Nutzer gezielt zu adressieren, da die Datenbasis in ihrer Eindeutigkeit eingeschränkt ist. Eine besonders vielversprechende Alternative ist die Verwendung einer sogenannten Mapping-Tabelle. Hierbei wird für jeden Nutzer ein zufällig generierter Identifikator erzeugt und als Schlüssel in einer separaten, leicht zugänglichen Datenbank hinterlegt. Die eigentlichen Nutzerdaten werden dann unter dieser Zufalls-ID in langen Datenspeichern abgelegt. Bei Löschanfragen genügt es, den Eintrag in der Mapping-Tabelle zu entfernen.
Dadurch ist die Verknüpfung zwischen Nutzer und Daten unwiederbringlich verloren und das System kann die verbleibenden anonymisierten Daten mit regulären Retentionsfristen abrechnen. Diese Methode erlaubt detaillierte Analysen und die Erstellung zielgruppenorientierter Audiences bei reduzierten Datenschutzrisiken. Gleichzeitig stellt sie eine höhere betriebliche Komplexität dar und erzeugt Mehrkosten für das Management der Mapping-Datenbanken. Neben diesen Kernstrategien zählt auch eine sorgfältige Anonymisierung von Datenfeldern dazu, die nicht für Analysezwecke im Detail benötigt werden. Beispielsweise kann die genaue IP-Adresse durch das Abschneiden des letzten Oktetts verallgemeinert werden, oder der User-Agent-String nur in Form einer generischen Browserversion gespeichert werden.
Diese Datenreduktion minimiert den Umgang mit sensiblen Informationen und erleichtert die Einhaltung von Datenschutzvorgaben. Herausforderungen entstehen auch durch unterschiedliche gesetzliche Anforderungen in den diversen Märkten. Während einige Gesetze wie die DSGVO eine explizite Löschung auf Anfrage verlangen, fokussieren andere eher auf Informationspflichten oder die Option auf Widerspruch gegen eine Verarbeitung. Dies führt zu weiteren Komplexitäten bei multinationalen AdTech-Unternehmen, die unterschiedliche Prozesse und technische Umsetzungen für den jeweils gültigen Rechtsraum entwickeln müssen. Der Spagat zwischen Datenwirtschaftlichkeit und Datenschutz-Compliance bleibt ein zentraler Balanceakt für Unternehmen in der Werbetechnologie.
Produkt- und Data-Science-Teams möchten die größtmögliche Datengrundlage zur Innovation bleiben, während die Rechtsabteilungen einen maximalen Schutz der Privatsphäre einfordern. Die Dateningenieure wiederum sollen durch effiziente technische Lösungen die Einhaltung gewährleisten und gleichzeitig die operativen Kosten niedrig halten. Im Kern geht es daher darum, passende organisatorische und technische Strategien zu entwickeln, mit denen Löschanfragen auf Basis eines rechtlich abgesteckten Rahmens effizient umgesetzt werden können. Dataengagement muss deswegen nicht von vornherein als Widerspruch zu Datenschutz verstanden werden, sondern als Chance, datenverantwortliches Handeln in den Prozess und die Infrastruktur zu integrieren. Zusammengefasst liegt die Zukunft in der Etablierung flexibler Systemarchitekturen, die sich um Trennung von sensiblen vom anonymisierten Datenbestand bemühen, die Überprüfung und Anpassung von Datenaufbewahrungsfristen ermöglichen und den Einsatz von Pseudonymisierung und Mapping-Technologien fördern.
Durch solche Maßnahmen lassen sich Löschvorgänge deutlich vereinfachen, die Kosten und Risiken reduzieren und zugleich wertvolles Datenschatzwissen bewahren. So gelingt ein verantwortungsvoller Umgang mit personenbezogenen Daten in der komplexen Welt der AdTech-Datensysteme.