Die NVIDIA HGX B300-Plattform stellt einen bedeutenden Fortschritt in unserer Recheninfrastruktur dar. Die neueste Variante – die NVIDIA HGX B300 NVL16 – gibt die Anzahl der über NVLink verbundenen Rechenchips an, anstatt nur die Anzahl der GPU-Pakete anzugeben. Diese geänderte Nomenklatur unterstreicht NVIDIAs weiterentwickelten Ansatz hinsichtlich Verbindungsleistung und modularer Skalierbarkeit.

SPEZIFIKATIONEN
In der folgenden Tabelle sind die wichtigsten Spezifikationen für den HGX B300 NVL16 und die früheren Varianten des HGX B200 aufgeführt:
Normen | HGX B300 NVL16 | HGX B200 |
Formfaktor | 16 × NVIDIA Blackwell Ultra-GPUs | 8 × NVIDIA Blackwell-GPUs |
FP4 Tensorkern** | 144 PFLOPS (mit Spärlichkeit) 144 PFLOPS (ohne Spärlichkeit) | 105 PFLOPS (mit Spärlichkeit) 72 PFLOPS (ohne Spärlichkeit) |
FP8/FP6 Tensorkern* | 72 PFLOPS | 72 PFLOPS |
INT8 Tensorkern* | 2 POPS | 72 POPS |
FP16/BF16 Tensorkern* | 36 PFLOPS | 36 PFLOPS |
TF32 Tensorkern* | 18 PFLOPS | 18 PFLOPS |
FP32-Leistung | 600 TFLOPS | 600 TFLOPS |
FP64/FP64 Tensorkern | 10 TFLOPS | 296 TFLOPS |
Gesamtspeicher | Bis zu 2.3 TB | 1.4 TB |
NVLink-Generierung | Fünfte Generation | Fünfte Generation |
NVIDIA NVSwitch™ | NVLink 5-Switch | NVLink 5-Switch |
NVSwitch GPU-zu-GPU-Bandbreite | 1.8 TB / s | 1.8 TB / s |
Gesamte NVLink-Bandbreite | 14.4 TB / s | 14.4 TB / s |
Netzwerkbandbreite | 1.6 TB / s | 0.8 TB / s |
Aufmerksamkeitsleistung | 2 × | 1 × |
* Mit Spärlichkeit
** Mit Spärlichkeit | ohne Spärlichkeit

NVIDIA unterzieht seine HGX B300-Plattform einer umfassenden Transformation.
Zunächst einmal ist die Änderung relativ unkompliziert: Die Plattform heißt jetzt NVIDIA HGX B300 NVL16. NVIDIA hat diesen Namen übernommen, weil er nun die Anzahl der über NVLink verbundenen Rechenchips und nicht die Anzahl der vorhandenen GPU-Pakete betont.

Vor der HGX B200 blieb alles weitgehend unverändert. Mit der Einführung der NVIDIA HGX B300 NVL16 verändert sich die Situation jedoch. Diese Plattform bietet bis zu 2.3 TB HBM3e-Speicher. Wie im obigen Bild zu sehen, verfügt sie über 16 Dual-Blackwell-GPU-Module. Im vergangenen Jahr hat NVIDIA die NVLink-Switch-Chips mit dem HGX B200-Design aktualisiert, bei dem zwei NVLink-Switch-Chips zwischen acht GPU-Modulen positioniert sind. Diese Konfiguration ähnelt der des HGX B300 und seiner Komponenten.

Im Bild unten ist zu sehen, dass das UBB-Motherboard mit acht großen luftgekühlten Kühlkörpern ausgestattet ist – jeder davon kühlt zwei Blackwell-GPUs –, zwischen denen sich der NVLink-Switch-Bereich befindet. Die Modulhöhe beträgt ca. 5 HE, wie das später vorgestellte ASUS-HGX-B300-Modul zeigt.

Am Ende des UBB befindet sich ein OCP-UBB-Stecker mit einer orangefarbenen Kappe. Die in der OCP-UBB-Spezifikation von AMD, NVIDIA und anderen Herstellern verwendeten High-Density-Stecker (ExaMax-Stecker) sind sehr zerbrechlich. Daher ist es wichtig, sie abzudecken, wenn sie nicht verwendet werden.

Zwischen diesen orangefarbenen Anschlüssen und den GPU-Kühlkörpern befinden sich kleinere Kühlkörper. Diese sind nicht mehr ausschließlich für PCIe-Retimer-Chips vorgesehen, sondern dienen nun der Versorgung von NVIDIA ConnectX-8-Netzwerkkarten (NICs).


Die UBB 2.0-Hochgeschwindigkeits- und Stromanschlüsse sind mit dem HIB (High-Performance Computing Interface Board) verbunden. Die NIC-Anschlüsse befinden sich zwischen den UBB-Anschlüssen und den acht auf dem UBB montierten NVIDIA ConnectX-8-NICs. Eine ähnliche Ansicht des HGX H200 zeigt, dass diese acht nach oben gerichteten Anschlüsse fehlen.

NVIDIA nutzt den integrierten PCIe-Switch des ConnectX-8, um Funktionen anzubieten, für die bisher zusätzliche Chips erforderlich waren. Dies mag zwar geringfügig erscheinen, stellt aber einen bedeutenden Branchenwandel dar. Auf der NVIDIA GTC-Konferenz 2025 präsentierte ASUS den ASUS AI Pod NVIDIA GB300 NVL72 und das ASUS XA NB3I-E12 (ein 10U-Modul). Das abnehmbare UBB-Fach an der Unterseite des Systems weist deutlich acht Netzwerkanschlüsse auf.


Die Spezifikationen und Schnittstellenanschlüsse des UBB 1.X-Motherboards werden ebenfalls hervorgehoben, wobei das ASUS XA NB3I-E12 mit der NVIDIA HGX B300 NVL16 ausgestattet ist.
Verschiedene Anbieter haben ihre Einschübe unterschiedlich gestaltet. Typischerweise befinden sich die Schnittstellen zur Verbindung mit der Frontblende des externen Gehäuses auf der den ConnectX-8-NICs gegenüberliegenden Seite, sodass eine Verkabelung erforderlich ist, um diese Lücke zu schließen. Andere Anbieter suchen nach Lösungen, um dieser Änderung Rechnung zu tragen.