In der heutigen Zeit, in der Online-Lebensmitteleinkäufe zu einem festen Bestandteil unseres Alltags geworden sind, erwarten Kunden nicht nur eine einfache Bestellung, sondern auch ein komfortables und zuverlässiges Einkaufserlebnis. Instacart, als einer der führenden Anbieter für Online-Lebensmittellieferungen, steht vor der besonderen Herausforderung, Produktverfügbarkeiten in Echtzeit zu gewährleisten. Denn nichts ist für Kunden frustrierender, als wenn ein ausgewählter Artikel plötzlich nicht vorrätig ist. Doch hier setzt Instacart auf fortschrittliche maschinelle Lernmodelle, die intelligent Ersatzprodukte vorschlagen, um genau dieses Problem effizient zu lösen. Die Komplexität hinter der automatisierten Ersatzempfehlungen ist enorm.
Ohne aktuelle Lagerbestandsdaten in Echtzeit muss das System eine Vorhersage treffen, welche Ersatzprodukte am besten zu den Absichten und Präferenzen des Kunden passen. Es gilt, ein Gleichgewicht zu finden zwischen ähnlich aussehenden oder benannten Produkten und solchen, die auch geschmacklich, markentechnisch oder diätetisch kompatibel sind. Dabei spielt es eine entscheidende Rolle, ob das Produkt häufig gekauft wird oder ob es sich um ein selten bestelltes Nischenprodukt handelt. Für letztere liegt kaum historische Datenbasis vor, womit der sogenannte Cold-Start-Effekt ins Spiel kommt. Instacart begegnet dieser Herausforderung mit einem mehrstufigen, auf maschinellem Lernen basierenden Empfehlungssystem.
Das Modell beginnt mit einer Heuristik-basierten Filterung, bei der potenzielle Ersatzkandidaten anhand von Produktkategorien, regalfachbezogenen Zuordnungen (Aisle), semantischer Ähnlichkeit und historischen Austauschdaten ausgewählt werden. So wird eine überschaubare, aber dennoch relevante Menge von Ersatzprodukten identifiziert, die anschließend durch das maschinelle Lernmodell bewertet und gerankt werden. Ein zentrales Element des Modells ist die Einbindung von Benutzerbewertungen und Auswahlhistorien, die als positives Signal gewichtet werden, während Produkte, die häufig abgelehnt wurden, negative Labels erhalten. Dadurch lernt das System kontinuierlich, welche Ersatzvorschläge tatsächlich akzeptiert werden. Ergänzend kommt ein speziell entwickeltes Deep-Learning-Modell mit “Siamese Network” Architektur zum Einsatz.
Dieses verarbeitet gleichzeitig die Eigenschaften des ursprünglichen und des Ersatzprodukts, um eine numerische Wahrscheinlichkeit für die Kundenzufriedenheit mit dem Ersatz zu erstellen. Die verwendeten Features erstrecken sich dabei über verschiedene Ebenen. Textinformationen wie Produktnamen werden mithilfe moderner BERT-basierter Einbettungen analysiert, während Kategorien wie Marke, Größe und Abteilung als lernbare, hochdimensionale Vektorrepräsentationen in das Modell einfließen. Ebenfalls spielen binäre Merkmale wie koscher, vegan oder fettfrei eine Rolle, um Ernährungsanforderungen abzubilden. Produkt-Embeddings, bereitgestellt vom hauseigenen Suchteam, liefern noch zusätzliche semantische Tiefe.
Das Modell wird sowohl offline mit Validierungs- und Testdaten umfassend evaluiert, als auch live durch A/B-Tests, bei denen repräsentative Kundenstichproben beobachten, ob die Ersatzvorschläge tatsächlich angenommen werden. Die Resultate zeigen, dass durch diese abgestimmte Kombination die Akzeptanzraten deutlich gesteigert werden und Kunden seltener unzufrieden sind mit Ersatzprodukten. Ein weiteres Problem, das Instacart erfolgreich adressiert, ist das unterschiedliche Einkaufsverhalten und Produktverfügbarkeiten bei verschiedenen Einzelhändlern. Ein einheitliches Empfehlungssystem ohne weitere Kontextinformation erzeugt häufig einen Bias zugunsten universell erhältlicher Markenprodukte, obwohl lokal verfügbare Store-Brands für Kunden oft bessere und kostengünstigere Alternativen darstellen. Um diese Diskrepanz zu beheben, wurde das Ersatzmodellschema so angepasst, dass Empfehlungen künftig retailer-spezifisch erfolgen.
Durch Berücksichtigung von Händler-ID, Quellprodukt und Ersatzprodukt wird die Empfehlungsgenauigkeit erheblich verbessert. So erhalten Kunden mehr passende Ersatzprodukte, und zugleich reduziert sich die Anzahl von Beschwerden über Preisunterschiede oder ungeeignete Ersatzartikel. Die Kombination aus Engagement-Modell und Deep-Learning-Modell wird mittels eines Gewichtungsmechanismus zusammengeführt. Während das Engagement-Modell auf Basis von langjähriger Kundenaustauschhistorie agiert und vor allem für weit verbreitete Produkte (Head-Produkte) exzellente Empfehlungen ermöglicht, unterstützt das neuronale Modell insbesondere seltenere oder neue Artikel (Tail-Produkte) durch seine Generalisierungsfähigkeit. Dieses Ensemble-Modell erzielt die beste Balance zwischen Qualität und Breite der Empfehlungen.
Aus technischer Perspektive ermöglicht die Verwendung von sogenannten Two-Tower-Architekturen in Form des Siamese-Netzwerks einen effizienten Vergleich von Produktpaaren. Die Kombination von klassischen Feature-Engineering-Ansätzen mit modernen Deep-Learning-Techniken optimiert nicht nur die Vorhersagen, sondern erlaubt zudem schnelle Anpassungen an sich verändernde Produktkataloge und Kundenpräferenzen. Automatisierte Datenpipelines erneuern regelmäßig die Trainingsdaten und somit die Modelle, um aktuelle Trends und Sortimentserweiterungen abzubilden. Neben der rein technologischen Perspektive ist für Instacart auch die Nutzererfahrung enorm wichtig. Das Modell ist in die App- und Web-Oberfläche so integriert, dass Ersatzprodukte klar repräsentiert werden und Kunden voreingestellte Auswahlmöglichkeiten erhalten, die transparent die Ähnlichkeit zum ursprünglichen Produkt kommunizieren.
Auch für die Shopper, die die Einkäufe im Laden ausführen, gibt es visuelle Hinweise zu den „am ähnlichsten verfügbaren Optionen“, um spontane, dennoch passende Entscheidungen zu fördern. Blickt man in die Zukunft, plant Instacart, die Retrieval-Phase noch weiter zu verbessern, indem neben textbasierten Attributen auch bildbasierte Signale aus umfangreichen Produktkatalogdaten einfließen. Darüber hinaus sollen personalisierte Modelle stärker zum Einsatz kommen, welche Nutzervorlieben und den Warenkorb-Kontext berücksichtigen. Session-basierte Signale und langfristige Präferenzen werden dabei helfen, das Erlebnis weiter zu optimieren und Ersatzvorschläge noch individueller zu gestalten. Die fortschrittliche Nutzung von maschinellem Lernen bei Instacart zeigt exemplarisch, wie moderne Algorithmen echten Mehrwert in die Online-Lebensmittelversorgung bringen können.
Indem Unsicherheiten bei Lagerbeständen intelligent ausgeglichen und Kundenwünsche durch personalisierte Vorschläge besser erfüllt werden, gewinnt die Plattform zunehmend Vertrauen und Zufriedenheit ihrer Nutzer. In Kombination mit weiteren Technologieinnovationen steht so ein nahtloses, kundenfreundliches Einkaufserlebnis im Fokus, das die Zukunft des digitalen Einzelhandels maßgeblich prägen wird.