Obwohl Nvidia gegen Ende des Jahres unter großem Druck steht, plant das Unternehmen Quellen aus der Lieferkette zufolge immer noch, seine KI-Serverplattform GB300 der nächsten Generation auf der GTC-Konferenz vorzustellen, die vom 17. bis 20. März 2025 stattfinden soll.
Die Plattform wurde einer Reihe neuer Upgrades unterzogen, die eine umfassende Verbesserung der Leistung und Konfiguration ermöglichten und für NVIDIA zu einem neuen Tool zur Leistungssteigerung werden. Darüber hinaus zielen zahlreiche Verbesserungen darauf ab, Leistung und Effizienz zu steigern, um den wachsenden Anforderungen des KI-Computings noch besser gerecht zu werden.

NVIDIA GB300-Server vollständig aktualisiert
Insbesondere integriert der NVIDIA GB300 AI-Server die neue GPU der Blackwell Ultra-Serie B300 mit einer Leistung von 1400 W und einer 4-fachen Verbesserung der FP1.5-Leistung einer einzelnen Karte.
Auf HBM-Ebene wird GB200 im Vergleich zum achtschichtigen Stapel von GB300 HBM3E mit einem zwölfschichtigen Stapel verwenden und die Kapazität wird von 12 GB auf 192 GB erhöht. Außerdem werden neue Flüssigkeitskühlschalen, Kühlplatten und UQD-Teile (Universal Quick Disconnect) für Flüssigkeitskühlleitungen eingeführt.
Darüber hinaus wird die optische Netzwerkkarte von CX7 auf CX8 und der optische Transceiver von 800G auf 1.6T aktualisiert.
Zu den weiteren Upgrades gehört die Verwendung eines Steckplatzdesigns; die Computerplatine wird LPCAMM verwenden; das Kapazitätsfach könnte zum Standard für das GB300 NVL72-Gehäuse werden; die BBU (Batterie-Backup-Einheit) könnte optional sein.
Die Lieferkette wies darauf hin, dass der Massenproduktionspreis eines BBU-Moduls bei etwa 300 US-Dollar liegt und der Gesamtpreis der BBU in einem GB300-System schätzungsweise 1,500 US-Dollar erreichen wird. Der Produktionspreis eines Superkondensators beträgt etwa 20 bis 25 US-Dollar und ein GB300 NVL72-Rack erfordert mehr als 300 Kapazitäten.
Allerdings gab es kürzlich Berichte, dass Nvidia bei der Entwicklung der GB300- und B300-KI-Server auf Herausforderungen in der Lieferkette gestoßen sei. Insbesondere sei es zu einem Überhitzungsproblem bei der Schlüsselkomponente, dem 5×5-DrMOS-Chip von AOS gekommen, was den Fortschritt der Massenproduktion beeinträchtigen könne.
Foxconn wird der größte Gewinner sein
Als Reaktion auf die Produktaktualisierungen von Nvidia reagierten Zulieferer wie Foxconn und Quanta rasch und begannen mit der Forschungs- und Entwicklungsphase sowie der Designphase des GB300-KI-Servers.
Berichten zufolge hat NVIDIA die Konfiguration der NVIDIA GB300 AI-Serverbestellung vorläufig abgeschlossen, wobei Foxconn nach wie vor der größte Lieferant ist. NVIDIA GB300 AI-Server werden voraussichtlich im ersten Halbjahr 2025 verfügbar sein und liegen damit vor den globalen Konkurrenten.
Branchenkenner wiesen darauf hin, dass Nvidia-CEO Jensen Huang, genau wie Apple, jedes Jahr ein neues iPhone auf den Markt bringt, zuvor angekündigt hatte, dass Nvidia ebenfalls das Tempo beibehalten werde, „jedes Jahr eine neue Generation von KI-Produkten auf den Markt zu bringen“. Große Partner müssen im Voraus investieren, um mit Nvidias Produktentwicklungstempo mithalten zu können.
Eine Analyse der Lieferkette zeigt, dass die Foxconn Group neben ihren Vorteilen der hohen vertikalen Integration auch stark in die frühe Forschung und Entwicklung von KI-Servern von NVIDIA investiert hat. Die beiden Parteien begannen bereits 2017 mit der Zusammenarbeit und haben eine enge Zusammenarbeit bei der Entwicklung neuer Produkte von der ersten Generation von KI-Servern bis hin zum aktuellen GB200 und sogar GB300 aufgebaut.
Am Beispiel des GB200-KI-Servers machen die von Foxconn bereitgestellten Komponenten neben GPU und CPU etwa 80 bis 90 Prozent aus.
Branchenkenner verrieten, dass Quanta und Inventec auch wichtige Partner für NVIDIAs GB300-KI-Server seien. Gemessen am Auftragsanteil ist Quanta nach Foxconn der zweitgrößte Lieferant, während für Inventec ein Wachstum erwartet wird.
GB200 wird 2025 seinen Höhepunkt erreichen
Jüngsten Marktforschungen zufolge werden im vierten Quartal 200 voraussichtlich etwa 2024 bis 150,000 Einheiten des GB200,000-Chips von Nvidia ausgeliefert, und im ersten Quartal 2025 dürften die Auslieferungen sogar um 200 bis 250 % deutlich steigen.
Der Liefertermin für GB200-Gehäuse hat sich jedoch verzögert. Da die Designspezifikationen der Lösung in Bezug auf Hochgeschwindigkeits-Verbindungsschnittstelle und thermischen Stromverbrauch deutlich höher sind als die des Mainstream-Marktes, benötigt die Lieferkette mehr Zeit für Anpassung und Optimierung. Es wird erwartet, dass sich die Spitzenlieferzeit für GB200-Gehäuse auf das zweite und dritte Quartal 2025 verzögern wird.
Darüber hinaus beträgt der TDP-Wert des GB200 NVL72-Gehäuses bis zu 140 kW, und die herkömmliche Luftkühlung kann diesen Bedarf nicht mehr decken. Daher ist die Flüssigkeitskühlungstechnologie zu einer Notwendigkeit geworden, und die entsprechenden Branchen verstärken ihre Forschungs- und Entwicklungsanstrengungen bei Flüssigkeitskühlungskomponenten, um die Wärmeableitungseffizienz zu verbessern.
Obwohl das Versandvolumen von GB200-Chips schnell wächst, wird es insgesamt noch einige Zeit dauern, bis die Schranklösung vollständig eingeführt ist. Es wird erwartet, dass der Versandhöhepunkt Mitte 2025 erreicht wird.
Darüber hinaus ist zu erwarten, dass das Design des GB300 mit hohem Stromverbrauch die Entwicklung der Flüssigkeitskühlungsbranche fördert, wovon die entsprechenden Hersteller in der Lieferkette profitieren könnten.