Alle Ergebnisse
Inhalt
Fakten
Hersteller
KFA2
Release
September 2025
Produkt
Grafikkarte
Preis
ab 999,99 Euro
Webseite
Media (18)
Das GB203-Silizium ist im Wesentlichen in der gleichen Komponentenhierarchie aufgebaut wie frühere Generationen von NVIDIA-GPUs, jedoch mit einigen bemerkenswerten Änderungen. Die GPU verfügt über eine PCI-Express 5.0 x16-Hostschnittstelle. PCIe Gen 5 gibt es seit Intels 12. Generation Core „Alder Lake“ und AMDs Ryzen 7000 „Zen 4“. Die GPU ist selbstverständlich mit älteren PCIe-Generationen kompatibel. Der GB203 verfügt außerdem über die neue GDDR7-Speicherschnittstelle, die mit dieser Generation ihr Debüt feiert. Der Chip verfügt über einen 256 Bit breiten Speicherbus, was der Hälfte der Busbreite des GB202 entspricht, der den RTX 5090 antreibt. NVIDIA nutzt diesen, um 16 GB Speicher mit 30 Gbit/s Geschwindigkeit anzutreiben, was eine Speicherbandbreite von 960 GB/s ergibt, was einer Steigerung von 34 % gegenüber dem RTX 4080 und seinem 22.5 Gbit/s GDDR6X entspricht.
Jeder Grafikverarbeitungscluster (GPC) ist eine Unterteilung der GPU mit nahezu allen für die Grafikwiedergabe erforderlichen Komponenten. Auf dem GB203 besteht ein GPC aus 12 Streaming-Multiprozessoren (SM) in 6 Texturverarbeitungsclustern (TPCs) und einer Raster-Engine, die aus 16 ROPs besteht. Jeder SM enthält 128 CUDA-Kerne. Im Gegensatz zur Ada-Generation SM, die jeweils über 64 FP32+INT32- und 64 reine FP32-SIMD-Einheiten verfügte, bietet die neue Blackwell-Generation SM die gleichzeitige FP32+INT32-Fähigkeit auf allen 128 SIMD-Einheiten. Diese 128 CUDA-Kerne sind in vier Slices angeordnet, jeweils mit einer Registerdatei, einem Level-0-Befehlscache, einem Warp-Scheduler, zwei Sätzen von Lade-Speicher-Einheiten und einer Spezialfunktionseinheit (SFU), die einige spezielle mathematische Funktionen wie Trigonometrie, Exponenten, Logarithmen, Kehrwerte und Quadratwurzel verarbeitet. Die vier Slices teilen sich einen 128 KB großen L1-Datencache und vier TMUs. Die exotischsten Komponenten des Blackwell SM sind die vier Tensor-Kerne der 5. Generation und ein RT-Kern der 4. Generation.
Der neue Tensor-Kern der 5. Generation bietet Unterstützung für das FP4-Datenformat (1/8 Präzision) für sich schnell bewegende atomare Arbeitslasten und bietet den 32-fachen Durchsatz des allerersten Tensor-Kerns, der mit der Volta-Architektur eingeführt wurde. Im Laufe der Generationen nutzten KI-Modelle Datenformate mit geringerer Präzision und Sparsity, um die Leistung zu verbessern. Der AI Management Processor (AMP) ermöglicht gleichzeitige KI- und Grafik-Workloads auf den höchsten Ebenen der GPU, sodass er gleichzeitig Echtzeitgrafiken für ein Spiel rendern kann, während ein LLM ausgeführt wird, ohne die Leistung des anderen zu beeinträchtigen. AMP ist ein spezialisierter Hardware-Scheduler für alle KI-Beschleunigungsressourcen auf dem Silizium. Dies spielt eine entscheidende Rolle für das Funktionieren der DLSS 4-Multiframe-Generierung.
Inhalt
Kommentar schreiben