Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit	Krypto-Events Krypto-Startups und Risikokapital Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit	Krypto-Events Krypto-Startups und Risikokapital Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst	Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit Krypto-Events Krypto-Startups und Risikokapital	Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen	Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Kategorien
Altcoins Analyse des Kryptomarkts Bitcoin Blockchain-Technologie Dezentrale Finanzen Digitale NFT-Kunst	Institutionelle Akzeptanz Interviews mit Branchenführern Investmentstrategie Krypto-Betrug und Sicherheit Krypto-Events Krypto-Startups und Risikokapital	Krypto-Wallets Mining und Staking Nachrichten zu Krypto-Börsen Rechtliche Nachrichten Stablecoins Steuern und Kryptowährungen	Token-Verkäufe (ICO) Virtuelle Realität

Seiten
Start Über uns Begriffe	Suchen

Folge uns

Montag, 01. September 2025.

Wenn Google niest, friert die ganze digitale Welt ein: Die weitreichenden Folgen des Google Cloud IAM-Ausfalls

Digitale NFT-Kunst Stablecoins

Das Geld, dasgeld.co

When Google Sneezes, the Whole World Catches a Cold

Ein umfassender Einblick in den globalen Ausfall des Google Cloud Identity and Access Management-Dienstes und wie seine Störung massive Auswirkungen auf zahlreiche Cloud-Dienste, darunter Cloudflare und Anthropic, hatte. Analyse der Ursachen, Auswirkungen und Lehren für die Zukunft von Cloud-Architekturen und Ausfallsicherheit.

Am 12. Juni 2025 wurde die digitale Welt Zeuge einer beeindruckenden Kettenreaktion, ausgelöst durch einen Fehler bei einem zentralen Google Cloud-Dienst. Was zunächst wie ein gewöhnliches technisches Problem bei Google Cloud erschien, entpuppte sich schnell als weitreichende Störung, die zahlreiche Dienste und Milliarden von Nutzern rund um den Globus betraf. Die Störung, die das Identity and Access Management (IAM) von Google Cloud betraf, legte praktisch viele der wichtigsten GCP-Produkte lahm und wirkte sich drastisch auf Cloudflare und den KI-Startup Anthropic aus. Dieser Vorfall zeigt auf drastische Weise, wie eng unsere moderne digitale Infrastruktur verknüpft und damit auch anfällig für Kaskadeneffekte ist – wenn Google niest, friert die ganze digitale Welt ein.

Das Herzstück der Störung war der Google Cloud IAM-Dienst, der für die Authentifizierung und Autorisierung aller API-Anfragen in der Google Cloud verantwortlich ist. IAM fungiert als digitale Schlüsselstelle, die sicherstellt, dass nur autorisierte Nutzer und Systeme Zugriff auf Ressourcen erhalten. Sobald diese Schlüsselstelle versagt, bricht das gesamte System zusammen, da keine Dienste mehr korrekt authentifiziert werden können. Genau dies geschah am Morgen des 12. Juni 2025 gegen 10:50 Uhr Pazifischer Zeit, als eine fehlerhafte Softwareeinspielung zu massiven 5xx-Fehlern in den IAM-Endpunkten führte.

Innerhalb Minuten, nachdem die internen Alarme bei Google Cloud ausschlugen, berichteten Nutzer über Ausfälle und Fehlermeldungen in einer Vielzahl von Google-Diensten, darunter Gmail, Google Drive und Meet. Die Störung breitete sich rasch aus und traf nicht nur Google-eigene Angebote, sondern auch Drittanbieter, die auf Google Cloud-Infrastrukturen aufbauen. Besonders deutlich wurde die Verwundbarkeit dieser Infrastruktur durch die Auswirkungen auf Cloudflare, einen der größten Anbieter von Web-Infrastruktur- und Sicherheitsdiensten weltweit. Cloudflare betreibt Workers KV, ein key-value Speicher-System, das Milliarden von Einträgen global über mehr als 270 Edge-Standorte repliziert. Obwohl der sogenannte Hot Path des Speichers in den Rechenzentren von Cloudflare selbst liegt, nutzte Cloudflare eine persistente Backend-Datenbank, die auf Google Cloud gehostet wurde.

Als durch den IAM-Ausfall keine gültigen Token mehr ausgestellt wurden, kam es zu massiven Zeitüberschreitungen bei Lese- und Schreiboperationen in diesem Backend. Dies führte dazu, dass essenzielle Cloudflare-Dienste wie Access, WARP und Zero Trust Features nicht mehr funktionierten. Nutzer erlebten Login-Schleifen, Verbindungsabbrüche und funktionale Einschränkungen. Noch stärker tangiert wurde der KI-Startup Anthropic, der auf Google Cloud als Hostingplattform für seine KI Claude setzt. Insbesondere Uploads von Dateien und Bildern, welche die Cloud Storage Dienste beanspruchen, waren betroffen.

Zwar blieben einfache Textabfragen durch zwischengespeicherte Token teilweise möglich, doch erhöhte Fehlerquoten und eingeschränkte Funktionalität führten dazu, dass Anthropic Uploads vorsorglich deaktivieren musste, um die Belastung zu reduzieren. Nach mehreren Stunden konnten die Dienste jedoch sukzessive wieder vollständig hergestellt werden. Die Wiederherstellung gestaltete sich komplex und zeitintensiv. Google musste die problematische Softwareeinspielung zurückrollen, fehlerhafte Konfigurationen beseitigen und eine globale Token-Cache-Aktualisierung durchführen. Besonders die Region us-central1, in der wichtige Quorum-Shards für IAM-Metadaten gehostet werden, zeigte sich als schwerfällig bei der Erholung.

Während die meisten anderen Regionen innerhalb weniger Stunden wieder stabil liefen, zog sich die vollständige Wiederherstellung in us-central1 und bei Spezialdiensten wie Dataflow und Vertex AI bis in den späten Nachmittag. Dieser Vorfall macht einmal mehr deutlich, wie kritisch das Management von Abhängigkeiten in der Cloud-Welt ist. Cloudflare arbeitet zwar als Multi-Cloud-Anbieter, dennoch war eine einzelne, tief verankerte Google Cloud-Komponente der Flaschenhals und damit der Ursprung eines globalen Ausfalls. Dies unterstreicht die Notwendigkeit, verborgene Abhängigkeiten systematisch zu identifizieren und in Notfallplänen zu berücksichtigen. Für Entwickler, Architekten und Betreiber von Cloud-Diensten liefert der Vorfall weitere wichtige Erkenntnisse.

Kontrollplane, die für Authentifizierung, Autorisierung und Steuerung zuständig sind, besitzen eine herausragende Bedeutung. Selbst wenn Daten in mehreren Zonen redundant gespeichert sind, nutzt diese Redundanz wenig, wenn die Authentifizierung ausfällt und Anfragen nicht autorisiert werden können. Außerdem wird klar, dass Statusseiten und Kommunikationskanäle in Krisenzeiten mehr als nur eine Formalität sind – sie müssen schnell, transparent und zuverlässig informieren, um Kunden und Partner nicht im Dunkeln tappen zu lassen. Darüber hinaus regt diese Ereigniskette dazu an, Notfallmechanismen wie Authentifizierungsausweichrouten oder temporäre Bypass-Strategien zu entwickeln. Wenn Authentifizierungsdienste selbst ausfallen, ist es entscheidend, zumindest eingeschränkte Funktionalität gewährleisten zu können, um katastrophale Totalausfälle zu vermeiden.

Auch die Bedeutung regelmäßiger Chaos-Tests und Ausfallsimulationen wird durch diese Ereignisse gestärkt. Solche Übungen helfen, seltene, jedoch gravierende Multi-Anbieter-Ausfälle zu antizipieren und das Reaktionsverhalten zu verbessern. In einer hochvernetzten Cloud-Welt sind Kettenreaktionen möglich und entfalten sich schnell. Nur wer vorbereitet ist, kann die entstehende Komplexität beherrschen. Google hat angekündigt, einen ausführlichen Postmortem-Bericht zu veröffentlichen, der detaillierte Erkenntnisse zum fehlerhaften Rollout, der Ausbreitung und den zukünftigen Schutzmaßnahmen enthalten soll.

Auch Cloudflare plant eine Veröffentlichung, die tief in die Architektur von Workers KV eintauchen und neue Redundanzmaßnahmen vorstellen wird. Im Rückblick zeigt sich, dass der IAM-Ausfall nicht nur eine technische Störung darstellte, sondern ein Spiegelbild der heutigen Cloud-Infrastruktur. Fehlkonfigurationen, die zu solch massiven Problemen führen, können jederzeit passieren – oft zur ungünstigsten Zeit, wie ein Dienstagmorgen. Die eng verflochtenen Dependencies innerhalb und zwischen Cloud-Anbietern führen zu einem fragilen Ökosystem, das große Ausfälle wahrscheinlicher macht. Diese Episode sollte Unternehmen und Technikverantwortliche motivieren, ihre eigenen Abhängigkeiten kritisch zu prüfen, robuste Notfallpläne zu erstellen und ihre Systeme resilienter zu gestalten.

Denn in der immer stärker vernetzen, digitalen Welt kann der Ausfall eines einzigen Services schnell die ganze Kette ins Wanken bringen. Die Botschaft ist klar: Wer in der Cloud arbeitet, muss die Komplexität meistern, Risiken verstehen und aktiv gegen Ausfälle vorsorgen. Nur so kann die digitale Welt stabil, zuverlässig und sicher bleiben – auch wenn Google mal niest.

Als Nächstes

HiMoR: Monocular Deformable Gaussians with Hierarchical Motion Representation

Montag, 01. September 2025. HiMoR: Revolutionäre 3D-Rekonstruktion aus Monokularvideos mit Hierarchischer Bewegungsdarstellung

HiMoR stellt eine bahnbrechende Methode zur dynamischen 3D-Rekonstruktion aus einzelnen Videos vor, die durch eine innovative hierarchische Bewegungsrepräsentation beeindruckende Qualität und neue Möglichkeiten der Ansichtssynthese bietet.

Mochi is a small, statically typed programming language

Montag, 01. September 2025. Mochi: Die vielseitige, statisch typisierte Programmiersprache für moderne Softwareentwicklung

Entdecken Sie die Programmiersprache Mochi, die durch klare Syntax, Sicherheit und Funktionalität besticht und sich ideal für die Entwicklung von Tools, Datenverarbeitung und intelligenten Agenten eignet.

Montag, 01. September 2025. Meta investiert 14,3 Milliarden Dollar für 49 % an Scale AI: Eine neue Ära der Künstlichen Intelligenz beginnt

Meta stärkt seine Position im KI-Markt durch den Erwerb einer Minderheitsbeteiligung an Scale AI, einem führenden Unternehmen für KI-Datenlösungen. Dieser Schritt verspricht innovative Entwicklungen und eine beschleunigte Integration von KI-Technologien für Unternehmen und Regierungen weltweit.

Bone music: the Soviet bootleg records pressed on x-rays (2015)

Montag, 01. September 2025. Knochenmusik: Wie verbotene westliche Klänge auf Röntgenbildern in der Sowjetunion weiterlebten

Die faszinierende Geschichte der sogenannten Knochenmusik, bei der verbotene westliche Musik in der Sowjetunion auf Röntgenbildern gepresst wurde, um Zensur zu umgehen und Jugendkultur geheim zu bewahren.

Multiverse Raises $215M to Scale Technology that Compresses LLMs by up to 95%

Montag, 01. September 2025. Multiverse Computing revolutioniert KI: Kompression von LLMs um bis zu 95% ermöglicht schnellere, günstigere und effizientere KI-Anwendungen

Multiverse Computing sichert sich 215 Millionen US-Dollar, um seine bahnbrechende Technologie CompactifAI weiter auszubauen, die große Sprachmodelle (LLMs) um bis zu 95 % komprimiert und dabei die Leistung bewahrt. Diese Innovation führt zu erheblich schnelleren Verarbeitungszeiten, drastisch reduzierten Kosten und erweitert die Einsatzmöglichkeiten von KI auf unterschiedlichste Geräte – vom Smartphone bis hin zum Raspberry Pi.

How to Send and Receive RCS Suggested Replies with Node.js

Montag, 01. September 2025. RCS Suggested Replies mit Node.js senden und empfangen: Der umfassende Leitfaden für moderne Kommunikation

Entdecken Sie, wie Sie mit Node. js und der Vonage Messages API Rich Communication Services (RCS) Suggested Replies einfach senden und empfangen können.

I made an AI Agent take an old Data Engineering test – it scored 92%

Montag, 01. September 2025. Wie ein KI-Agent einen alten Data Engineering Test mit 92% Bestehensquote meisterte

Ein tiefgehender Einblick in die beeindruckende Leistungsfähigkeit von KI-Agenten im Bereich Data Engineering am Beispiel eines alten Assessments, das in Rekordzeit und nahezu fehlerfrei gelöst wurde. Erfahren Sie, wie moderne KI mit Hilfe von Model Context Protocol (MCP) Servern komplexe Aufgaben bewältigt, welche Herausforderungen auftreten und welche Zukunftsperspektiven sich daraus ergeben.