Die Nutzung von Echtzeit-Path-Tracing-Technologien revolutioniert die visuelle Qualität moderner Spiele, stellt Entwickler aber ebenso vor Herausforderungen bezüglich Performance und Speicherbedarf auf aktuellen GPUs. Das Spiel "Indiana Jones und der Große Kreis™" demonstriert eindrucksvoll, wie sich Pfadverfolgung in komplexen, vegetationsreichen Umgebungen optimieren lässt. Dabei spielen speziell entwickelte Techniken wie Opacity MicroMaps (OMMs) und die Kompaktierung dynamischer Bottom-Level-Acceleration Structures (BLASs) eine zentrale Rolle, um sowohl die Renderzeit als auch die VRAM-Auslastung zu vermindern – insbesondere auf Grafikkarten der NVIDIA GeForce RTX 40- und 50-Serie. Diese Optimierungen wurden im Verlauf der Entwicklung bewusst eingesetzt, um maximale Detailtreue auch in anspruchsvollen Szenen mit hoher Polygonanzahl zu gewährleisten, ohne die Hardware zu überlasten. Der Einsatz von Path Tracing in Indiana Jones wurde besonders im Peru-Level getestet, einer Szene, die aufgrund der Menge an Vegetation und der darin enthaltenen Alpha-getesteten Objekte wie Blättern und Gras eine hohe Komplexität aufweist.
Die Ray-Tracing-Beschleunigungsstruktur in dieser Szene enthält beeindruckende 26,9 Millionen Dreiecke, was die Anforderungen an die GPU enorm erhöht. Standardmäßig fordert das Alpha-Testing in Ray-Tracing-Shaders jedoch einen hohen Overhead, da auf jedem durchlaufenen Dreieck eine shader-basierte Prüfung durchgeführt wird. Durch das Aktivieren von Opacity MicroMaps gelingt es, die Zahl der notwendigen Any-Hit-Shader-Aufrufe massiv zu reduzieren, ohne die visuelle Qualität einzuschränken. Opacity MicroMaps funktionieren, indem sie die Transparenzinformationen von Modellen direkt in kleinste Flächeneinheiten – sogenannte Mikro-Dreiecke – vorab berechnen und klassifizieren. Dabei gibt es unterschiedliche Zustände wie opak, transparent oder unbekannt, welche die Hardware dann nutzen kann, um schnell zu entscheiden, ob eine Intersection verworfen wird oder nicht.
Diese Herangehensweise minimiert die Notwendigkeit, während der Laufzeit aufwendige Shader-Prozeduren auszuführen, was insbesondere bei Alpha-getesteten Objekten, die meist aus vielen kleinen Flächen bestehen, eine drastische Effizienzsteigerung bedeutet. In Bezug auf die Performance führten die OMM-Optimierungen zu einer Reduktion der GPU-Zeiten im Hauptpfad-Tracing-Durchgang von ursprünglich 7,90 Millisekunden auf nur noch 3,58 Millisekunden. Dies entspricht einer Leistungssteigerung von etwa 55 Prozent und verbessert nicht nur die Framerate, sondern verringert auch thermische Belastungen der GPU. Auch andere Rendering-Phasen wie die Schatten- und indirekte Beleuchtung profitieren von der Optimierung, was für eine rundum verbesserte Performance sorgt. Ein weiterer entscheidender Aspekt der Optimierung ist die Speicherkompression der BLAS-Strukturen.
Dynamische BLASs, die im Spiel für die dynamisch animierte Vegetation verwendet werden, können durch Komprimierung einzelne Speicheranforderungen von 1027 MB auf lediglich 606 MB verringern. Diese Komprimierung ist möglich, da die dynamische Vegetation zwar animiert wird, aber die Struktur der Acceleration Structures nicht neu aufgebaut, sondern nur aktualisiert oder refittet wird. Das ist ein wichtiger Unterschied, denn eine erneute Neubildung würde eine andere Größe der Strukturen verursachen und Komprimierung unzuverlässig machen. Die Reduktion von fast 41 Prozent im VRAM-Bedarf ermöglicht es, auch auf GPUs mit mittlerem Speichervolumen eine verlustfreie Pfadverfolgung zu realisieren, was speziell bei ausgedehnten Vegetationsszenen im Dschungel von entscheidender Bedeutung für Spielbarkeit und Bildqualität ist. Das Erstellen und Integrieren der OMMs stellte die Entwickler allerdings vor Herausforderungen.
Die CPU-basierte Backende-Pipeline zur Erstellung dieser MicroMaps war auf den Entwickler-Arbeitsplätzen vergleichsweise langsam, weshalb das Backen auf offline Systemen abgewickelt wurde. Ein besonderes Problem dabei waren komplexe Modelle mit verzwickten UV-Koordinaten oder hochauflösenden Alpha-Maps, bei denen das Backen mehrere Minuten bis Stunden in Anspruch nehmen konnte. Um das Rekonstruieren bei solch aufwendigen Fällen zu minimieren, wurden spezifische Backen-Parameter angepasst oder große MicroMaps aussortiert, um eine Balance zwischen Qualität, Performance und Speicherbedarf zu finden. Die Entwickler führten zudem ein umfassendes Debugging-Tool ein, welches die Visualisierung der OMM-Präsenz in Echtzeit ermöglicht. Dies war nützlich, um Modelle zu identifizieren, die noch keine OMM-Unterstützung besitzen oder bei denen die MicroMaps aufgrund von Speicherrestriktionen deaktiviert wurden.
Die visuelle Hervorhebung durch farbliche Kennzeichnung half, die Vollständigkeit der Shader-Optimierungen sicherzustellen und eventuelle Lücken rechtzeitig zu schließen. Bei der Implementierung der Alpha-Test-Unterstützung im Pfad-Tracer steuerten Any-Hit-Shader die Entscheidung, ob eine Intersection berücksichtigt wird oder übersprungen werden sollte. Die Standardimplementierung rief diese Shader häufig auf, was aufgrund der Switch-Kosten zwischen Traversierung und Shaderausführung eine signifikante Overheadquelle darstellte. Die Opacity MicroMaps minimieren diese Switches, da große Bereiche als volltransparent oder voll opak vorab klassifiziert sind und daher sofort hardwareseitig entschieden werden kann, ohne Softwareausführung. Zusammenfassend sind die Path-Tracing-Optimierungen in Indiana Jones ein Paradebeispiel dafür, wie Hardware- und Softwaretechnologien zusammenspielen, um die Grenzen von Realzeitraytracing zu verschieben.
Die Kombination aus innovativen OMM-Techniken und BLAS-Kompaktierungen macht eine anspruchsvolle visuelle Darstellung möglich, die mit herkömmlichen Mitteln schwer oder gar nicht realisierbar wäre. Auch die sorgfältige Integration in den bestehenden Entwicklungs- und Produktionsworkflow, etwa durch Offline-Backen und automatisierte Qualitätssicherung, zeigt die Reife heutiger Entwicklungspraktiken. Mit der Veröffentlichung erhielt die Spielerschaft eine optisch hochwertige und gleichzeitig flüssig laufende Grafikdarstellung, die jene inwegingsweisen an die Komplexität realer Naturaufnahmen heranführt. Gleichzeitig geben die dokumentierten Optimierungen Einblick in zukunftsweisende Techniken, die für zahlreiche real-time Rendering-Anwendungen, von Spielen bis hin zu virtueller Produktion und Simulation, relevant sind. Die in Indiana Jones eingesetzten Techniken stehen exemplarisch für den Trend hin zu spezialisierter Hardwarebeschleunigung, die durch Softwareinnovationen ausgeschöpft wird.
Insbesondere Grafikkarten der neuesten NVIDIA Generationen profitieren von speziellen RT-Core-Funktionen, die solche MicroMap-Operationen hardwareseitig beschleunigen. Durch den Einsatz von Vulkan-Erweiterungen wie VK_EXT_opacity_micromap und DXR 1.2 wird zudem gewährleistet, dass diese Verbesserungen flexibel und zukunftssicher auf verschiedenen Plattformen bereitgestellt werden. Die Optimierungen sind somit sowohl technologisch als auch praktikabel im Spielebereich angekommen und ebnen den Weg für weitere Fortschritte. Für Entwickler zeigt Indiana Jones, wie wichtig es ist, detaillierte Profiler- und Debug-Tools einzusetzen, um Engpässe zu identifizieren und gezielt zu beseitigen.
Die Kombination von Shader-Execution-Reordering, Live-State-Reduktionen und den in diesem Beitrag beschriebenen OMM- und BLAS-Optimierungen illustriert, dass Performance-Gewinne an mehreren Ebenen erreichbar sind. Ebenso zeigt sich, dass Speicheroptimierung durch BLAS-Kompaktierung die Spielbarkeit auf Hardware mit begrenztem VRAM erheblich verbessert, ohne Kompromisse bei der visuellen Qualität. Abschließend lässt sich festhalten, dass die Optimierung von Path Tracing in Indiana Jones nicht nur die Performance auf einer einzelnen Hardwareplattform verbessert, sondern als Leitfaden für komplexe Echtzeit-Rendering-Szenarien mit viel transparenter Vegetation dienen kann. Die erzielten Effekte führen zu einem tieferen Eintauchen in die Spielwelten bei gleichzeitig optimiertem Ressourcenverbrauch – eine Balance, die für zukünftige Spieleentwicklungen von hoher Relevanz bleibt.