Rechtliche Nachrichten Mining und Staking

11 Millionen IOPS und 66 GiB/s Durchsatz: Höchstleistung mit einer einzelnen AMD ThreadRipper Workstation

Rechtliche Nachrichten Mining und Staking
Achieving 11M IOPS and 66 GiB/s IO on a Single Threadripper Workstation (2021)

Eine tiefgehende Analyse, wie moderne Hardware, insbesondere eine AMD ThreadRipper Pro Workstation mit PCIe 4. 0 SSDs, beeindruckende IO-Leistungen von 11 Millionen IOPS und 66 GiB/s Datendurchsatz erreicht und welche Schlüsselkomponenten und Softwareeinstellungen dafür entscheidend sind.

In der heutigen Ära leistungsstarker Hardware verlagert sich das klassische Nadelöhr der Computerleistung zunehmend von der Festplatte hin zur CPU und dem Arbeitsspeicher. Die immer schneller werdenden NVMe SSDs, insbesondere mit PCIe 4.0 Schnittstellen, ermöglichen enorme Datenübertragungsraten. Ein herausragendes Beispiel zur Demonstration dieser neuen Leistungsfähigkeit bietet die AMD Ryzen ThreadRipper PRO Workstation, bereits in ihrer 16-Kern-Variante ein Top-Modell auf Basis der Zen 2 Architektur, die trotz der Möglichkeit 64 Kerne zu nutzen, für den Einsatz optimal konfiguriert wurde. Das Zusammenspiel zahlreicher schneller NVMe SSDs und der ebenso leistungsfähigen PCIe 4.

0 Infrastruktur bildet dabei das Fundament für neuartige IO-Maßstäbe. Im Folgenden wird aufgezeigt, wie es gelingt, auf nur einer Maschine erstaunliche 11 Millionen IOPS bei 4KB Zufallszugriffen sowie einen Datendurchsatz von 66 GiB/s bei größeren Blockgrößen zu erzielen. Die Herausforderungen, die dabei auf der Hardware- und Softwareseite überwunden wurden, geben aufschlussreiche Einblicke in die Architektur moderner Workstations und Betriebssysteme. Am Anfang steht die Hardware. Eine Lenovo ThinkStation P620, ausgestattet mit dem AMD Ryzen ThreadRipper PRO 3955WX, bringt 16 physische Kerne mit jeweils bis zu 4,3 GHz Boost-Takt mit sich.

Die CPU besitzt acht Speicherkanäle, die mit schnellstem DDR4 ECC RAM bestückt sind, und vor allem steht eine großzügige Anzahl von PCIe 4.0 Lanes zur Verfügung. Mit 128 PCIe 4.0 Lanes kann theoretisch fast eine Viertel Terabyte pro Sekunde an Datenverkehr in jede Richtung gehandhabt werden. Wichtig ist, dass diese PCIe-Lanes direkt mit der CPU verbunden sind, ohne denselben Engpass wie ältere Architekturen mit Southbridge oder Front-Side-Bus.

Beim Speicher kommen Samsung 980 Pro NVMe SSDs zum Einsatz, wahre PCIe 4.0 Geräte, die sequentielle Lesegeschwindigkeiten von bis zu 7.000 MB/s erreichen. Durch den Einsatz von zehn SSDs, davon acht mit 1 TB Kapazität und zwei mit 500 GB für System- und Boot-Volumes, kombiniert auf zwei ASUS PCIe 4.0 Quad-M.

2 Adapterkarten, wird eine immense parallele Bandbreite geschaffen. Die Herausforderung besteht darin, sowohl Hardware als auch Betriebssystem für diese Bandbreite optimal auszulegen. Ein einfaches Zusammenstecken führt nicht zu bestmöglichen Ergebnissen, wie der praxisnahe Test zeigt. Wichtige BIOS-Einstellungen wie PCIe Port Bifurcation mussten von „Auto“ auf „x4x4x4x4“ geändert werden, um alle Slots des Quad-Adapters als eigenständige PCIe x4 Verbindungen zu erkennen. Ebenso war eine manuelle Umstellung der Linkgeschwindigkeit auf PCIe Gen 4 notwendig, da ansonsten durch automatische Voreinstellungen die Bandbreite auf PCIe 3.

0 beschränkt blieb. Durch sorgfältige Anordnung der PCIe-Karten wurde eine Überlastung einzelner PCIe Root Complexes vermieden, da erst durch die Verteilung auf alle vier Root Complexe der CPU die maximal mögliche Bandbreite genutzt werden konnte. Auf Softwareseite zeigte sich, dass der Linux-Kernel in seiner Version 5.8 mit io_uring den besten Weg bietet, um die enormen IO-Mengen mit minimalem Overhead zu verarbeiten. Das IO-Framework io_uring ermöglicht es Anwendungen, Anforderungen asynchron und kernel-nah zu stellen und Ausführungszeit zu sparen.

Bei einzelnen PCIe 4.0 SSDs stellte sich heraus, dass jede einzelne mit etwa 1 Mio. IOPS bei 4KB Leseoperationen arbeitet und eine Bandbreite von über 6 GB/s bei großen Blockgrößen liefert. Eine einzelne Prozessinstanz konnte die CPU-Limits mit etwa 450.000 IOPS pro Kern nicht vollständig ausnutzen, weshalb mehrere parallele Jobs nötig waren.

Besonders interessant ist der Unterschied der IO-Konfigurationen: Mit aktiviertem Direct I/O (O_DIRECT Flag) werden Daten nicht über den OS-Pagecache geliefert, was CPU-Last und Kontextwechsel minimiert. Ohne Direct I/O schossen CPU-Auslastung und Kernel-Threads in die Höhe, da der Kernel mit Cachemanagement und Readahead eine enorme Menge an Spinlocks verwalten musste. Dies führte zu starkem Performanceeinbruch nach kurzer Laufzeit, insbesondere durch spinlock-bedingte Kernel-Overheads. Die I/O Scheduler Einstellungen waren ebenfalls entscheidend. Für NVMe SSDs ist standardmäßig kein Scheduler aktiviert, um die geringstmögliche Latenz und CPU-Last zu gewährleisten.

Die Aktivierung eines Schedulers wie mq-deadline führte zu einer Verdopplung des CPU-Aufwands bei gleichzeitigem Durchsatzverlust. Im abschließenden Multi-Disk-Betrieb wurden alle zehn SSDs synchron mit je drei bis vier parallelen Job-Threads angesteuert, was zusammen die beeindruckenden 11 Millionen IOPS bei 4 KB Zugriffsgröße und sehr hohen Datendurchsatz erbrachte. Die CPU war dabei vollständig ausgelastet, vorwiegend im Kernel-Modus, was zeigt, dass der limitierende Faktor hier weniger die Hardwarebandbreite als die reine CPU-Leistung und der Overhead des IO-Handling-Prozesses waren. Für größere IO-Blockgrößen (beispielsweise 512 KB) fiel die IOPS-Zahl ab, aber die Bandbreite erreichte Spitzenwerte von 66 GiB/s bei gleichzeitig bemerkenswert niedriger CPU-Auslastung von unter 10 %. Dieses Ergebnis unterstreicht, wie richtiger Einsatz von PCIe 4.

0, schnellen NVMe SSDs und ausgeklügelter Software dazu führt, dass moderne Workstations selbst höchste Anforderungen in IO-intensiven Szenarien meistern können. Die Demonstration solcher Werte ist nicht nur ein Triumpf der Hardware, sondern zeigt auch, wie eng der Softwarestack mit der Hardware verzahnt sein muss, um maximale Leistung abzurufen. Die Erkenntnis, dass heute nicht mehr die Festplatte der Flaschenhals ist, sondern vielmehr CPU und Arbeitsspeicher, eröffnet neue Perspektiven für die Gestaltung von datenintensiven Anwendungen und Serverarchitekturen. Mit einer perfekt abgestimmten Kombination moderner Prozessoren, genügend PCIe-Lanes, hochwertigem RAM und aktuellen Kernel-Technologien lässt sich das volle Potenzial der Hardware nutzen. Anwendungsfälle, die Millionen von IOPS benötigen, wie etwa Datenbanken oder umfangreiche Datenanalyseapplikationen, profitieren von solch einer Konfiguration enorm, ohne in komplexe und teure Cluster investieren zu müssen.

Abseits der reinen Performance ist auch der geringere Komplexitätsaufwand ein Vorteil, da lokale IO-Systeme wesentlich leichter zu warten und zu sichern sind als verteilte Systeme mit Remote-Storage. Abschließend lässt sich beobachten, dass die Kombination von AMDs ThreadRipper Pro Plattform mit PCIe 4.0 SSDs und dem passenden Softwarestack ein neues Level im Bereich High-Performance Computing darstellt. Wer mit seinen IO-lastigen Workloads maximale Effizienz erreichen möchte, sollte sich mit diesen Technologien vertraut machen und diese gezielt einsetzen. Die Zukunft der datenintensiven Verarbeitung wird maßgeblich davon beeinflusst, wie erfolgreich man diese leistungsstarke Hardware richtig konfiguriert und nutzt.

Ein umfassendes Verständnis der Zusammenhänge zwischen CPU, RAM, PCIe-Struktur und NVMe-Geräten bleibt dafür unverzichtbar. Moderne Systeme sind geprägt von Netzwerken verschiedenster Art, die miteinander interagieren. Der PCIe-Bus und Speicherkanäle bilden nur einen Teil dieser komplexen Architektur. Gerade durch das Wissen um diese Netzwerke und deren optimale Ausnutzung wird höchste Geschwindigkeit erreichbar. Die Zeit, in der die Festplatte der langsamste Faktor war, ist endgültig vorbei.

Heute entscheidet die Fähigkeit eines Systems, Daten effizient durch diese Netzwerke zu schaufeln und alle Ressourcen synchron zu orchestrieren. Eine einzelne AMD ThreadRipper Workstation zeigt eindrucksvoll, wie modernste Technologie es ermöglicht, die Grenzen des Möglichen neu zu definieren und damit ein enormes Potenzial für datengetriebene Anwendungsfelder zu entfesseln.

Automatischer Handel mit Krypto-Geldbörsen Kaufen Sie Ihre Kryptowährung zum besten Preis

Als Nächstes
Attenborough at 99 delivers 'greatest message he's ever told'
Freitag, 06. Juni 2025. David Attenborough mit 99: Seine bedeutendste Botschaft für den Erhalt der Ozeane und des Planeten

David Attenborough nutzt seinen 99. Geburtstag, um mit seinem neuen Film ‚Ocean‘ ein eindringliches Plädoyer für den Schutz der Meere und die Rettung unseres Planeten vor dem Klimawandel zu senden.

Seven tools is all you need. Open source AI agent
Freitag, 06. Juni 2025. Sieben Tools, die Sie für einen Open Source KI-Agenten brauchen: Effizient und Vielseitig

Erfahren Sie, wie sieben wesentliche Werkzeuge einen Open Source KI-Agenten leistungsstark und vielseitig machen. Diese Tools ermöglichen eine einfache und effektive Automatisierung vielfältiger Aufgaben durch künstliche Intelligenz und bieten eine innovative Lösung für Entwickler und Anwender gleichermaßen.

Kenyan High Court Orders Worldcoin to Delete Biometric Data Within 7 Days Under Data Commissioner Supervision
Freitag, 06. Juni 2025. Kenias Obergericht fordert Löschung biometrischer Daten von Worldcoin unter Aufsicht des Datenschutzbeauftragten

Das höchste Gericht Kenias hat entschieden, dass Worldcoins Sammlung biometrischer Daten illegal war und ordnete die Löschung aller gesammelten Informationen innerhalb von sieben Tagen an, überwacht vom Datenschutzbeauftragten. Dieses Urteil wirft wichtige Fragen zum Datenschutz und der Regulierung von Blockchain-Technologien in Afrika auf.

‘Hawk Tuah’ girl Haliey Welch filmed cameo for Glen Powell’s show ‘Chad Powers’: report
Freitag, 06. Juni 2025. Haliey Welch: Vom viralen Meme-Star zur Schauspielerin in Glen Powells „Chad Powers“

Haliey Welch, bekannt als die ‚Hawk Tuah‘-Mädchen, begeistert Fans mit ihrem ersten Comeback in der Schauspielwelt durch eine Gastrolle in Glen Powells Hulu-Serie ‚Chad Powers‘ und positioniert sich als aufstrebende Persönlichkeit in Hollywood.

“So she will hawk tuah on the show?” — Fans poke fun as ‘Hawk Tuah’ girl joins Glen Powell’s series Chad Powers
Freitag, 06. Juni 2025. Haliey Welch und ihre virale Karriere: Vom Meme zum TV-Star in Glen Powells „Chad Powers“

Haliey Welch, bekannt als die ‚Hawk Tuah‘-Girl, erlangte durch einen viralen Clip weltweite Aufmerksamkeit und macht nun den nächsten Schritt als Schauspielerin in der Serie ‚Chad Powers‘. Die Mischung aus Popkultur, Internet-Hype und kritischen Reaktionen auf ihre Karriereentwicklung zeigt die Kraft und die Risiken viraler Berühmtheit im digitalen Zeitalter.

News Explorer — Hawk Tuah Token Controversy Notably Absent in Haliey Welch's Podcast Comeback
Freitag, 06. Juni 2025. Haliey Welchs Podcast-Comeback: Die umstrittene Hawk Tuah Token Debatte bleibt ausgespart

Haliey Welch, bekannt als "Hawk Tuah Girl," kehrt nach ihrer längeren Auszeit mit ihrem Talk Tuah Podcast zurück. Trotz der mit dem Solana-basierten HAWK Token verbundenen Kontroversen bleibt das Thema in ihrem Comeback unerwähnt, was bei der Community und Beobachtern für Aufsehen sorgt.

 Crypto spending will grow, but fiat isn’t going anywhere: Mercuryo CEO
Freitag, 06. Juni 2025. Kryptozahlungen auf dem Vormarsch: Warum Fiatgeld trotz Wachstums der Krypto-Akzeptanz weiterbesteht

Der CEO von Mercuryo erläutert, warum Kryptowährungen und Fiatgeld künftig nebeneinander bestehen bleiben, wie sich Krypto-Gehälter etablieren und welche Rolle praktische Krypto-Ausgabemöglichkeiten spielen werden.