Google Lens hat sich im Laufe der Jahre von einem einfachen Tool zur Bilderkennung zu einer der fortschrittlichsten visuellen Suchtechnologien weltweit entwickelt. Mit der Einführung neuer Parameter wie dem sogenannten lns_mode wird deutlich, wie komplex und vielseitig Suchanfragen über Google Lens mittlerweile geworden sind. Die visuelle Suche ermöglicht es Nutzern, Informationen sofort über ein Bild zu erhalten, wobei die Suchanfragen nicht nur auf Text basieren, sondern auch auf Bilderkennung und der Kombination beider Modalitäten – den sogenannten multimodalen Suchanfragen. Diese Entwicklung bringt nicht nur eine neue Dimension des Suchens mit sich, sondern auch tiefgreifende technische Innovationen, die Google hinter den Kulissen eingeführt hat. Der Begriff lns_mode bezeichnet einen Parameter, der bei jeder Google Lens-Abfrage im Hintergrund hinzugefügt wird und angibt, welche Art von visueller Suche ausgeführt wird.
Die drei Hauptwerte, die dieser Parameter annehmen kann, sind text, un und mu. Der Wert text steht dabei für eine rein textbasierte Suche, bei der zum Beispiel mit der OCR-Technologie (Optical Character Recognition) erkannter Text aus einem Bild extrahiert und als Suchanfrage genutzt wird. Das kann beispielsweise das Abfotografieren eines Textabschnitts aus einem Buch oder einer Rezeptkarte sein. Der Wert un steht für unimodale Suche, bei der nur ein Bild als Grundlage für die Suche genutzt wird, ohne dass zusätzlicher Text eingelesen wird. Dies ist typisch, wenn Nutzer ein Bild eines Objekts machen und eine Suche starten, um mehr über dessen Herkunft, Art oder Eigenschaften zu erfahren.
Schließlich bezeichnet mu die multimodale Suche, bei der sowohl Bild- als auch Textinformationen in einer kombinierten Suchanfrage verarbeitet werden. Diese Kombination erlaubt es, wesentlich präzisere und kontextreichere Suchergebnisse zu erhalten, da das System sowohl visuelle als auch textuelle Hinweise auswertet. Die Implementierung von lns_mode stellt einen wichtigen Schritt dar, um die steigende Komplexität der Google Lens-Anfragen zu bewältigen. Die unterschiedliche Behandlung von Suchanfragen je nach Modi sorgt dafür, dass die Suchergebnisse auf Nutzerbedürfnisse besser zugeschnitten und die Benutzeroberfläche entsprechend angepasst wird. Besonders interessant ist dies im Hinblick auf die Integration von Google Lens in den sogenannten AI Mode, welcher im April 2025 vorgestellt wurde.
Hierbei werden multimodale Suchanfragen mithilfe der KI-Plattform Gemini verarbeitet, die in der Lage ist, Bild- und Textinformationen gleichzeitig zu interpretieren und somit ein deutlich smarteres und schnelleres Sucherlebnis zu bieten. Die Unterstützung des lns_mode=mu Parameters ermöglicht erst diese leistungsfähige neue Funktionalität. Die technische Umsetzung des lns_mode Parameters erfolgt innerhalb des Chromium-Browser-Systems, das die URLs für Lens-Suchen dynamisch konfiguriert. Je nachdem, ob ein Nutzer beispielsweise nur Text in einem Bild auswählt, ein gesamtes Bild hochlädt oder beides kombiniert, wählt das System automatisch den passenden Modus aus. Im Hintergrund werden verschiedene weitere Parameter übermittelt, die zusammen eine sehr genaue und kontextsensitive Suche ermöglichen.
Dazu gehören etwa die eigentliche Suchanfrage q, die den erkannten Text oder vom Nutzer eingegebenen Suchbegriff enthält, sowie der Parameter gsc, der anzeigt, dass es sich um eine Lens-Suchanfrage handelt. Auch masfc signalisiert, dass die Anfrage aus einem Ambient- oder Kontext-Modus stammt, was die Relevanz der Antwort verbessern kann. Der Parameter hl gibt die bevorzugte Sprache und das Gebiet des Nutzers an, um lokal angepasste Ergebnisse liefern zu können. Darüber hinaus enthält die Such-URL eine Reihe weiterer technischer Metadaten, darunter etwa mactx, der in Base64 kodierte Informationen über die aktuelle Webseite oder den Suchkontext trägt, sowie gsessonid und vsrid, die für die Sitzungsverwaltung und die eindeutige Identifizierung der Suchanfrage sorgen. Diese Parameter erleichtern es Google, mehrere zusammenhängende Anfragen zu gruppieren und die Backend-Systeme effizient zu steuern.
Die Vielzahl dieser Parameter verdeutlicht, wie komplex moderne visuelle Suchsysteme arbeiten und welche hohen Anforderungen dabei an Datenschutz, Schnelligkeit und Genauigkeit gestellt werden. Für Nutzer bietet die Verwendung verschiedener Google Lens Modi einen enormen Mehrwert. Ein Textmodus ist besonders praktisch im Alltag, wenn man schnell etwas abschreiben möchte oder Informationen aus einem gedruckten Dokument digital verfügbar machen will. Der unimodale Image-Modus eignet sich ideal, um Gegenstände, Pflanzen, Kunstwerke oder Marken zu identifizieren, ohne dass vorher ein passender Suchbegriff eingegeben werden muss. Besonders spannend ist jedoch die multimodale Suche, die zunehmend im Alltag genutzt wird und beispielsweise bei Einkaufsentscheidungen oder komplexeren Informationsrecherchen zur Anwendung kommt.
Hier lässt sich etwa ein Produkt fotografieren, gleichzeitig kann man relevante Fragen dazu stellen, und die KI kombiniert Bild- und Textdaten, um umfassende und genau auf die Nutzerfrage zugeschnittene Antworten zu liefern. Google verfolgt mit der Erweiterung und Differenzierung der Lens Modi das Ziel, die visuelle Suche zu einem integralen Bestandteil seines KI-unterstützten Such-Ökosystems zu machen. Durch die intelligente Klassifikation und Verarbeitung von Suchanfragen nach Modi kann das Unternehmen die Nutzererfahrung nicht nur verbessern, sondern auch besser auf individuelle Bedürfnisse und Situationen eingehen. Auch für Website-Betreiber, Online-Shops und SEO-Experten ergeben sich daraus neue Perspektiven. Die zunehmende Bedeutung von visuellen und multimodalen Suchanfragen bedeutet, dass Inhalte auf Webseiten nicht nur textlich, sondern auch visuell sinnvoll strukturiert und optimiert werden sollten, um über Google Lens sichtbar und auffindbar zu sein.
Zusammenfassend lässt sich sagen, dass Google Lens mit der Einführung und Nutzung der verschiedenen Modi text, un und mu einen entscheidenden Schritt in Richtung noch intelligentere und vielseitigere visuelle Suche unternommen hat. Die Integration in Googles KI-Plattform Gemini erlaubt es, multimodale Suchanfragen tiefgreifend zu verstehen und in Echtzeit mit qualitativ hochwertigen Informationen zu beantworten. Diese Entwicklung eröffnet neue Möglichkeiten für Nutzer im Alltag, Unternehmen im Online-Marketing und für das gesamte Feld der Suchmaschinenoptimierung. Google Lens steht damit exemplarisch für die nächste Generation der Suchtechnologie, die weit über die reine Texteingabe hinausgeht und den Weg in eine umfassend vernetzte und intelligente Informationswelt weist.