Die rasante Entwicklung der Künstlichen Intelligenz (KI) hat nicht nur in der Technologiebranche, sondern auch im Finanzsektor tiefgreifende Veränderungen bewirkt. Insbesondere die Einführung von sogenannten Foundation Models, einer neuen Generation großer, generalisierbarer KI-Modelle, eröffnet Banken einzigartige Möglichkeiten, ihre Geschäftsprozesse zu optimieren und die Kundenerfahrung grundlegend zu verbessern. Nubank, eine der weltweit führenden digitalen Banken, zeigt beispielhaft, wie diese Modelle in die bestehenden AI-Plattformen integriert werden können, um die Zukunft des Bankwesens neu zu gestalten. Foundation Models basieren auf großen neuronalen Netzwerken, die in der Lage sind, umfangreiche Datenmengen in Form von Sequenzen zu verarbeiten und daraus komplexe Verhaltensmuster zu erkennen. Anders als traditionelle Methoden, die häufig auf linearen Modellen oder gradientenbasierten Entscheidungsbäumen beruhen, erfassen diese Modelle feine Nuancen und Abhängigkeiten in den Daten, welche herkömmliche Verfahren nicht abbilden können.
Für Banken bedeutet dies, Kundendaten deutlich präziser zu analysieren und so personalisierte Finanzprodukte oder risikobasierte Entscheidungen auf einem qualitativ neuen Niveau zu treffen. Nubank hat diesen Weg mit der Übernahme des KI-Startups Hyperplane im Juli 2024 beschleunigt. Das Know-how dieses Teams in der Entwicklung großer Modelle zur Analyse finanziellen Verhaltens wurde in die langjährige Erfahrung von Nubank hinsichtlich der Produktionstechnologie und regulatorischen Compliance integriert. So entstand eine ausgeklügelte Infrastruktur, die groß angelegte transformerbasierte Modelle effizient trainiert und in den produktiven Einsatz bringt – eine Meisterleistung im hochkomplexen, regulierten Umfeld des Finanzwesens. Bei der Umsetzung achtete Nubank darauf, die bewährten Komponenten der bestehenden Plattform nicht zu beeinträchtigen.
Vielmehr wurde ein modularer Ansatz gewählt, bei dem nur die minimal notwendigen Bausteine für die Foundation Models entwickelt und neu gestaltet wurden. Darunter fallen die Verarbeitung sequentieller Daten, die Nutzung leistungsfähiger GPU-Cluster für das Training der Modelle sowie die Implementierung der zugrundeliegenden Transformer-Architekturen. Diese klaren Schnittstellen erlauben einen reibungslosen Betrieb neben den bisherigen tabellarischen maschinellen Lernverfahren. Die Verarbeitung sequenzieller Daten stellt eine besondere Herausforderung dar. Banken verfügen über gigantische Mengen an Transaktionsdaten, die sowohl strukturiert als auch unstrukturiert vorliegen.
Für den Einstieg konzentrierte sich Nubank darauf, bereits existierende, validierte Rohdaten in Sequenzdaten umzuwandeln, die dann den neuen Modellen zugeführt werden konnten. Dadurch ließ sich der Einfluss der Foundation Models isoliert messen und mit vorhandenen Basismodellen vergleichen. Dabei gelang es, eine deutliche Steigerung der Vorhersagegenauigkeit zu erreichen – ein Erfolg, der in der Branche als bahnbrechend gilt. Die Trainingsprozesse bei Nubank sind hoch skalierbar ausgelegt. Das Unternehmen nutzt eine Vielzahl heterogener Cluster, die auf verteiltem Computing basieren.
Mit Hilfe von innovativen Frameworks wie Ray können Milliarden von Parametern auf Modellen verarbeitet werden, die Transaktionsdaten von mehr als hundert Millionen Kunden umfassen. Solche technischen Kapazitäten ermöglichen es, täglich billionenfachen Input während des Trainings zu verarbeiten und die Modelle kontinuierlich zu verbessern. Neben der Architektur kommt der Entwicklung unterstützender interner Tools große Bedeutung zu. Um den Überblick über die Vielzahl der Modelle und Experimente zu behalten, hat Nubank ein umfassendes System zur Modellkatalogisierung und Ergebnisberichterstattung aufgebaut. Hier können Teams Modelle prüfen, deren Eingabedaten analysieren und Performancekennzahlen vergleichen.
Diese Transparenz ist essenziell, um den komplexen Entwicklungsprozess zu steuern und einen hohen Qualitätsstandard zu gewährleisten. Wesentlich ist auch, dass die Foundation Models nicht isoliert betrachtet werden, sondern fest in die Produktentwicklung eingebunden sind. Die Abläufe orientieren sich an bewährten Experimentierzyklen, bei denen challengermodelle Schritt für Schritt gegen etablierte tabellarische Baselines getestet werden. Durch das Beachten derselben Datengrundlage und rigide Metrikvergleiche stellen die Teams sicher, dass Leistungsverbesserungen tatsächlich dem neuen Modell zuzuschreiben sind. Nach erfolgreicher Validierung erfolgt die schrittweise Integration in produktive Entscheidungssysteme, die für Kreditvergabe, Betrugserkennung oder personalisierte Kundeninteraktionen genutzt werden.
Die ersten acht Monate dieser Transformation zeigen beeindruckende Fortschritte. Nicht nur konnten weitere Quellen unstrukturierter Daten erfolgreich eingebunden und deren Qualität validiert werden, auch die Modellarchitekturen selbst wurden sukzessive verfeinert. Das führte zu einer durchschnittlichen Steigerung der Klassifikationsgenauigkeit (AUC) von mehr als einem Prozentpunkt über mehrere Schlüsselaufgaben hinweg, was in reifen maschinellen Lernsystemen als deutlicher Leistungssprung gilt. Darüber hinaus erweitern die Teams kontinuierlich die Einsatzgebiete der Foundation Models. Während zunächst vorwiegend Transaktionsdaten verarbeitet wurden, sollen bald auch Nutzersignale aus App-Interaktionen und Produktverwendung integriert werden.
Dieses Vorhaben verspricht noch differenziertere Kundenprofile und bessere Erkenntnisse darüber, wie Menschen mit Finanzdienstleistungen umgehen. Die Bedeutung dieser Entwicklungen geht weit über Nubank hinaus. Banken, die es schaffen, Foundation Models in ihre Systeme und Unternehmenskultur zu integrieren, werden in der Lage sein, agiler auf Marktveränderungen zu reagieren und ihren Kunden maßgeschneiderte Lösungen anzubieten. Die Erhöhung der Automatisierung und die tiefere Verstehbarkeit des Kundenverhaltens tragen dazu bei, Kosten zu senken und zugleich Wettbewerbsvorteile herauszuarbeiten. Zudem unterstreicht Nubank die Rolle von verantwortungsbewusster KI-Anwendung in einem streng regulierten Umfeld.