Die landläufige Meinung, dass Geschwindigkeit in der Softwareentwicklung immer oberste Priorität haben sollte, wird durch neue Erkenntnisse aus der Welt der Künstlichen Intelligenz zunehmend in Frage gestellt. Besonders im Bereich der KI-Agenten im Kundenservice hat sich herausgestellt, dass eine absichtliche Verlangsamung der Antwortzeiten, also eine erhöhte Latenz, paradoxerweise dazu beitragen kann, dass Nutzer den Agenten als klüger und engagierter wahrnehmen. Diese Beobachtung widerspricht zunächst den konventionellen Erwartungen und wirft ein neues Licht auf den Umgang mit KI-basierten Systemen. Die Bedeutung von Geschwindigkeit im digitalen Zeitalter ist allgegenwärtig. Studien großer Unternehmen wie Google, Amazon und Walmart stellen unmissverständlich dar, dass selbst minimale Verzögerungen beim Laden von Webseiten Umsatzrückgänge und Verlust von Nutzerzufriedenheit nach sich ziehen können.
In der Ära der Künstlichen Intelligenz, in der komplexe Berechnungen und Verarbeitung natürlicher Sprache notwendig sind, ist die Latenz unvermeidlich. Daher stellt sich die Frage, wie sich diese vermeintliche Schwäche auf die Nutzerzufriedenheit auswirkt – und ob längere Wartezeiten tatsächlich nur als Ärgernis wahrgenommen werden. Im Rahmen umfangreicher Experimente bei Intercom wurden innovative Ansätze verfolgt, um den Einfluss der Latenz bei KI-Agenten zu untersuchen. Statt wie üblich nur zu versuchen, die Reaktionszeiten zu minimieren, wurden gezielt Verzögerungen in verschiedenen Ausprägungen eingeführt und analysiert. Dabei lag der Fokus darauf, die Nutzererfahrung nicht aktiv zu verschlechtern oder Beschwerden hervorzurufen, sondern die Effekte unauffällig zu erfassen.
Das Experiment erstreckte sich über mehrere Monate, wobei Gespräche mit KI-Agenten in unterschiedliche Gruppen eingeteilt wurden, die von keiner Verzögerung bis hin zu maximalen 20 Sekunden Wartezeit reichten. Die Ergebnisse stellten viele Annahmen auf den Kopf. Zwar stieg erwartungsgemäß die Zahl der sogenannten „Abbrüche“ oder Deflections, bei denen Nutzer die Interaktion vorzeitig beendeten, mit zunehmender Latenz. Überrascht waren die Forscher jedoch von der Erkenntnis, dass die positive Bewertung der KI-Antworten – gemessen an explizitem positiven Feedback – trotz längerer Wartezeiten nicht sank, sondern sogar leicht anstieg. Ebenso blieb die negative Rückmeldung konstant oder nahm tendenziell ab, und auch die allgemeine Kundenzufriedenheit zeigte keine Verschlechterung, sondern in manchen Fällen einen höheren Rücklauf.
Ein zentraler Aspekt zur Erklärung dieses paradoxen Phänomens liegt in der menschlichen Psychologie. Nutzer interpretieren längere Wartezeiten offenbar als Zeichen für eine sorgfältige, durchdachte Antwort. Die Verzögerung erzeugt ein Gefühl, dass die KI „nachdenkt“, was wiederum ihre wahrgenommene Kompetenz erhöht. Dieses Phänomen ist eng verwandt mit dem sogenannten Laborillusionseffekt (Labor Illusion) aus der Verhaltensökonomie, der besagt, dass Menschen Dienstleistungen umso mehr wertschätzen, je mehr Anstrengung sie glauben, dass in deren Erbringung investiert wird. Weitere unterstützende Hinweise kommen aus verwandten Experimenten, bei denen die Transparenz über den Denkprozess der KI den positiven Effekt teils sogar reduzierte.
Nutzer bevorzugen also nicht zwangsläufig maximale Offenheit, sondern schätzen es, wenn die KI etwas Zeit aufwendet, bevor sie antwortet. Darüber hinaus zeigten Feedback aus E-Mail-Kommunikationen mit KI, dass Nutzer sogar skeptisch reagieren können, wenn Antworten zu schnell eintreffen, da dies unauthentisch oder maschinell wirken kann. Diese Erkenntnisse haben nicht nur theoretische Bedeutung, sondern auch praktische Implikationen für den Einsatz von KI-Systemen im Kundenservice. Sie legen nahe, dass ein zu hastiges Antworten der KI – obwohl effizient – die Nutzererfahrung und die wahrgenommene Qualität beeinträchtigen kann. Dementsprechend sind Designentscheidungen gefragt, die gezielt kleine Verzögerungen einbauen, etwa über vorgetäuschte „Denken“-Statusmeldungen oder andere interaktive Elemente, die das Gefühl von menschlichem Engagement simulieren.
Gleichzeitig zeigen die Studien, wie wichtig es ist, bei der Durchführung von A/B-Tests die Latenz als einen entscheidenden Einflussfaktor zu berücksichtigen. Eine Veränderung in der Antwortgeschwindigkeit kann maßgeblich die Ergebnisse beeinflussen und somit zu verzerrten Einschätzungen führen, wenn sie nicht richtig kontrolliert wird. Daher empfehlen die Forscher die Einführung zusätzlicher Kontrollgruppen, um den Effekt der Latenz separat auszuwerten und daraus belastbare Rückschlüsse für Produktentscheidungen zu ziehen. Trotz des überraschenden positiven Zusammenhangs zwischen gesteigerter Latenz und Nutzerzufriedenheit verfolgt Intercom auch weiterhin das Ziel, die Antwortzeiten des KI-Agenten Fin zu reduzieren. Denn unter Geschäftsaspekten bleibt eine möglichst schnelle Bearbeitung unabdingbar, um die Effizienz und Skalierbarkeit für die Kundenunternehmen sicherzustellen.
Ferner sollte die Latenz nicht zu einer echten Belastung werden oder das Risiko von Nutzerfrustration erhöhen, sondern gezielt als positives Gestaltungselement eingebunden werden. Die Entwicklung beim Fin-Agenten zeigt eindrucksvoll, wie komplex das Zusammenspiel zwischen Technik, Psychologie und Nutzererfahrung ist. Die Reduktion der mittleren Zeit bis zum ersten Antworttoken von einst bis zu 20 Sekunden auf nunmehr etwa 7 Sekunden trotz solcher Befunde verdeutlicht den Balanceakt, schnell und dennoch menschlich zu wirken. In der sich rasant wandelnden KI-Landschaft eröffnen solche Untersuchungen wertvolle Erkenntnisse. Nicht nur die reine Leistungsfähigkeit von Algorithmen, sondern auch die Nuancen in der Interaktion bestimmen den Erfolg von KI-Anwendungen.
Die bewusste Verzögerung kann dabei als Gestaltungsmittel ein bisher unterschätztes Potenzial entfalten. Abschließend bleiben mehrere spannende Fragen offen, etwa wie sich diese Erkenntnisse in anderen Anwendungsbereichen außerhalb des Kundenservices übertragen lassen, wie verschiedene Nutzergruppen auf Verzögerungen reagieren oder welche technischen und ethischen Rahmenbedingungen für gezielte Verzögerungen gelten sollten. Die Zukunft der KI steht damit nicht nur im Zeichen der technischen Beschleunigung, sondern auch unter dem Aspekt einer bewussten Entschleunigung – um Vertrauen aufzubauen, Qualität sichtbar zu machen und ein menschlicheres Erlebnis zu schaffen. Ein breiteres Bewusstsein für die Rolle der Latenz kann Entwickler und Unternehmen dabei unterstützen, KI-Systeme noch smarter und gleichzeitig angenehmer für den Menschen zu gestalten.