Auf der jüngsten CES-Konferenz kündigte Jensen Huang im neuen Jackett die offizielle Veröffentlichung der RTX 5090 an.

Hier sind die Preise für die GPUs der 50er-Serie.
RTX 5090: 1999 USD / RTX 5090 D: 16,499 RMB
RTX 5080: 999 USD / 8,299 RMB
RTX 5070 Ti: 749 $
RTX 5070: 549 $

Die RTX 5090 und RTX 5080 sind ab dem 30. Januar erhältlich, während die RTX 5070 Ti und RTX 5070 im Februar auf den Markt kommen. Die Laptops der RTX 50-Serie erscheinen im März.
Huang stellte außerdem den neuen Superchip für Rechenzentren vor – Grace Blackwell NVLink72, der über 72 Blackwell-GPUs, 1.4 ExaFLOPS Rechenleistung und 1.3 Billionen Transistoren verfügt und die schnellsten Supercomputer der Welt übertreffen soll.


Darüber hinaus wurde der weltweit erste echte Desktop-Supercomputer, Project Digits, vorgestellt, der nur 3000 US-Dollar kostet. Damit können Sie Modelle mit einer Größe von 200 Milliarden Parametern direkt auf Ihrem Schreibtisch ausführen. Dabei nimmt er nur den Platz einer Kaffeetasse ein, bietet aber Rechenleistung auf Rechenzentrumsniveau.

Ausgestattet mit dem neuen GB10 Grace Blackwell-Superchip kann Project Digits eine Leistung von bis zu 1 PFLOPS bei FP4-Präzision liefern.
Huang prognostiziert, dass in Zukunft jeder Datenwissenschaftler, Forscher und Student einen persönlichen KI-Supercomputer von Project Digits auf seinem Schreibtisch haben wird. Das KI-Zeitalter wird allen gehören.

Beim Debüt der RTX 5090 wurde auch DLSS 4 vorgestellt. Nach Monaten voller Leaks und Gerüchten wurde die neue Generation der RTX Blackwell GPUs offiziell mit den folgenden Leistungsparametern vorgestellt:
- 92 Milliarden Transistoren
- 4000 TOPS KI-Rechenleistung
- 380 TFLOPS Raytracing-Leistung
- 125 TFLOPS Shader-Leistung
- 32 GB GDDR7-Speicher
- 1792 GB/s Speicherbandbreite
- Bis zu 21,760 CUDA-Kerne
Es ist erwähnenswert, dass die KI-Rechenleistung des RTX 5090 D nur 2375 TOPS beträgt, aber immer noch doppelt so hoch ist wie die des 4090 D.

Mit solch luxuriösen Konfigurationen und der Unterstützung von DLSS 4 und der Blackwell-Architektur ist die Leistung der RTX 5090 direkt doppelt so hoch wie die der RTX 4090. Dies bedeutet jedoch auch einen hohen Stromverbrauch, mit einer Gesamtleistung der Grafikkarte von 575 Watt und einem empfohlenen Netzteil von 1000 Watt.
Eine Demo zeigte, dass beim Ausführen von „Cyberpunk 2077“ auf der RTX 5090 mit aktiviertem DLSS 4 238 Bilder pro Sekunde erreicht wurden, verglichen mit nur 106 Bildern pro Sekunde auf der RTX 4090 mit aktiviertem DLSS 3.5.

Die RTX 5080 ist doppelt so schnell wie die RTX 4080 und verfügt über 16 GB GDDR7-Speicher, eine Speicherbandbreite von 960 GB/s und 10,752 CUDA-Kerne. Die RTX 5070 Ti verfügt über 16 GB GDDR7-Speicher, 896 GB/s Bandbreite und 8,960 CUDA-Kerne. Die RTX 5070 hat 12 GB GDDR7-Speicher, 672 GB/s Kapazität und 6,144 CUDA-Kerne. Jensen Huang behauptete sogar, dass die RTX 5070, die 549 US-Dollar kostet, dank DLSS 4090 eine Leistung auf dem Niveau der RTX 4 bieten wird.




Darüber hinaus präsentierte Huang die RTX Blackwell GPU mit einer Echtzeit-Rendering-Demo. Er erklärte: „Die neue Generation von DLSS generiert nicht nur Frames, sondern sagt auch die Zukunft voraus. Wir haben KI mit GeForce vorangetrieben, und jetzt revolutioniert KI GeForce.“ Die neuen RTX Neural Shader von NVIDIA können zum Komprimieren von Spieltexturen verwendet werden, und RTX Neural Faces nutzen generative KI, um die Gesichtsqualität zu verbessern. Das DLSS der nächsten Generation umfasst eine Technologie zur Generierung mehrerer Frames, die bis zu drei zusätzliche Frames pro herkömmlichem Frame erzeugt und die Framerate um das bis zu Achtfache erhöht. DLSS 8 verwendet auch Transformers in Echtzeitanwendungen, um die Bildqualität zu verbessern, Ghosting zu reduzieren und dynamischen Szenen mehr Details hinzuzufügen.

Es ist bemerkenswert, dass NVIDIA ein neues Design für die Founders Edition der RTX 50-Serie eingeführt hat, das über zwei Axiallüfter, eine 3D-Dampfkammer und GDDR7-Speicher verfügt. Alle GPUs der RTX 50-Serie unterstützen PCIe Gen 5 und sind mit DisplayPort 2.1b-Schnittstellen ausgestattet, die eine 8K-Auflösung bei 165 Hz ermöglichen. Überraschenderweise ist die RTX 5090 Founders Edition eine Dual-Slot-Grafikkarte, die sich für Gehäuse mit kleinem Formfaktor eignet – eine bedeutende Änderung im Vergleich zur RTX 4090.

Jim Fan, leitender Wissenschaftler bei NVIDIA, hob die „Essenz“ von Jensen Huangs Präsentation zur Grafiktechnologie hervor. Huang erklärte, dass die neuen GPUs neuronale Netzwerke verwenden, um über 90 % der Pixel in Spielen zu generieren. Herkömmliche Raytracing-Algorithmen rendern nur etwa 10 % des Inhalts, ähnlich einer „groben Skizze“, wobei generative Modelle die restlichen Details in Echtzeit ausfüllen. Meine Damen und Herren, KI ist die neue Generation der Grafiktechnologie.

Nach dem Debüt der GPUs der 50er-Serie erwähnte Huang, dass das „Skalierungsgesetz weiterhin gilt“:
- Das erste Skalierungsgesetz ist das Vortraining.
- Das zweite Skalierungsgesetz gilt nach dem Training.
- Das dritte Skalierungsgesetz betrifft Berechnungen zur Inferenzzeit.

Diese sich entwickelnden Skalierungsgesetze treiben den immensen Rechenbedarf für KI voran. Erstaunlicherweise sind etwa 15 Supercomputing-Zentren, darunter die von Microsoft, Meta und xAI, bereits mit Blackwell-GPUs ausgestattet.

Als nächstes erwähnte er KI-Agenten als perfektes Beispiel für Skalierung während des Tests. Darüber hinaus kündigte er die Einführung einer Reihe von frei lizenzierten Basismodellen namens Llama Nemotron an, die eine hohe Genauigkeit für verschiedene KI-Agentenaufgaben bieten. Jensen Huang erklärte: „KI-Agenten könnten die nächste Roboterindustrie sein und potenziell eine Multi-Billionen-Dollar-Chance darstellen.“



Darüber hinaus wird NVIDIAs NIM Blueprint bald auf dem PC verfügbar sein. Mit diesen Blueprints können Entwickler Podcasts auf Basis von PDF-Dokumenten erstellen und anhand von 3D-Szenen beeindruckende Bilder generieren.

KI-Supercomputer auf Desktop-Niveau kann 4.05 Billionen LLM-Parameter ausführen
Vor dem Abschluss der CES-Konferenz stellte Jensen Huang ein revolutionäres Produkt vor – Project Digits – einen echten „Desktop-Supercomputer!“. Er ist für KI-Entwickler, Datenwissenschaftler, Studenten und andere Fachleute konzipiert, die sich mit KI beschäftigen.

Dieser kompakte Computer ist der kleinste KI-Supercomputer der Welt, der ein 200-Milliarden-Parameter-Modell ausführen kann. Er kostet 3,000 US-Dollar (ca. 21,986 Yen). Wie Huang demonstriert, bietet dieses kompakte Desktop-System enorme Rechenleistung und nimmt dabei nur minimalen Platz auf dem Schreibtisch ein – etwa so breit wie eine durchschnittliche Kaffeetasse und ungefähr halb so hoch. Stellen Sie sich vor, Sie hätten ein Miniaturgerät auf Ihrem Schreibtisch, das Rechenleistung auf dem Niveau eines Rechenzentrums bietet. Dies ist der revolutionäre Durchbruch, den Project Digits gebracht hat!
Project Digits verfügt über den neuen GB10 Grace Blackwell-Superchip, der bis zu 1 PFLOPS (Petaflops) KI-Leistung mit FP4-Präzision liefern kann.

Dieser leistungsstarke Chip enthält außerdem eine Grace-CPU mit 20 Kernen auf ARM-Basis. CPU und GPU sind mithilfe der NVIDIA NVLink C2C-Technologie für Hochgeschwindigkeitskommunikation miteinander verbunden. Jeder Project Digits ist mit 128 GB stromsparendem, hochkonsistentem einheitlichem Speicher und bis zu 4 TB NVME-Speicher ausgestattet. Mit diesem Setup können Entwickler Modelle mit bis zu 200 Milliarden Parametern direkt auf ihren Desktops ausführen. Darüber hinaus können mit dem ConnectX-Netzwerkchip zwei Project Digits-Supercomputer miteinander verbunden werden, um Modelle mit bis zu 4.05 Billionen Parametern auszuführen.

Darüber hinaus ist Project Digits mit dem NVIDIA DGX-Basisbetriebssystem (basierend auf Ubuntu Linux) und dem NVIDIA AI-Software-Stack vorinstalliert, sodass Entwickler eine Plug-and-Play-Entwicklungsumgebung für KI erhalten. Entwickler können sofort mit ihren KI-Projekten loslegen. Für Millionen von Entwicklern wird es ein bahnbrechendes innovatives Produkt sein, insbesondere für diejenigen, die Cloud-Computing-/Rechenzentrumsressourcen benötigen, um große KI-Modelle auszuführen. Dieser Desktop-KI-Supercomputer verfügt über ein breites Anwendungsspektrum, darunter Experimente und Prototyping von KI-Modellen, Feinabstimmung und Inferenz von Modellen (zum Testen oder Auswerten von Modellen) sowie lokale KI-Inferenzdienste (wie Chatbots oder Code Intelligence-Assistenten). Darüber hinaus können Datenwissenschaftler das System nutzen, um NVIDIA RAPIDS auszuführen und so groß angelegte Data-Science-Workflows direkt auf ihren Desktops effizient abzuwickeln.

Dank der umfassenden Unterstützung des KI-Technologie-Stacks (Frameworks, Tools, APIs) von NVIDIA wird Project Digits zu einer idealen Entwicklungsplattform für Edge-Computing-Anwendungen, insbesondere in den Bereichen Robotik und VLM (Vision-Language Models). Die Einführung von Project Digits markiert eine neue Ära im Bereich des persönlichen KI-Computings. Es ermöglicht Entwicklern weltweit, KI-Modelle im großen Maßstab auf ihren Desktops auszuführen, wodurch vorhandene Cloud-Computing-Ressourcen ergänzt und die Effizienz der KI-Entwicklung deutlich gesteigert wird.
Die neue Ära der physischen KI: Open Source-Weltmodell
Nach der Einführung intelligenter KI hat Jensen Huang die Diskussion nun auf „physische KI“ gelenkt. Seiner Ansicht nach ist „physische KI die nächste Grenze für KI“. Das Prinzip großer Modelle besteht darin, basierend auf Eingabeaufforderungen jeweils ein Token als Ausgabe zu generieren. Wenn dieser Kontext zur realen Umgebung wird und die Eingabeaufforderung zu einer Anfrage wird, muss das Modell von der Generierung von „Inhaltstoken“ zur Generierung von „Aktionstoken“ übergehen. Was wir jetzt brauchen, ist die Erstellung eines effektiven „Weltmodells“ anstelle von GPT-basierten Sprachmodellen.

Dieses „Weltmodell“ muss die Sprache der Welt verstehen, physikalische Dynamiken wie Schwerkraft und Reibung begreifen, geometrische und räumliche Beziehungen erfassen, Kausalität begreifen und physikalische Permanenz erkennen.
Auf der CES kündigte Jensen Huang eine revolutionäre Plattform zur Entwicklung von Weltmodellen namens Cosmos an, die auf das Verständnis der physischen Welt abzielt. Cosmos wurde mit einem 20 Millionen Stunden umfassenden Datensatz trainiert und kann Text, Bilder und Videos als Eingabe verwenden und virtuelle Weltzustände und Videos generieren. Die Plattform umfasst mehrere Funktionsmodule wie Diffusionsmodelle, autoregressive Modelle und Video-Tokenizer, sodass Entwickler je nach spezifischen Anforderungen auswählen können. Jensen Huang kündigte insbesondere an, dass Cosmos in seiner Gesamtheit, einschließlich Nano, Super und Ultra, Open Source sein und zum Download zur Verfügung stehen wird.

Darüber hinaus kann Cosmos in Omniverse integriert werden, um einen physikalisch realistischen Multigenerator bereitzustellen. Dies bedeutet, dass durch Cosmos alles in der physikalischen Simulationswelt gleichzeitig generiert werden kann.

Jensen Huang erwähnte auch drei Arten von Computern: einen DGX zum Trainieren von KI, einen AGX zum Bereitstellen von KI und eine Kombination aus Omniverse und Cosmos. Wenn wir die ersten beiden verbinden, brauchen wir einen digitalen Zwilling. Huang glaubt: „In Zukunft wird jede Fabrik einen digitalen Zwilling haben, und Sie können Omniverse und Cosmos kombinieren, um zahlreiche Zukunftsszenarien zu generieren.“





Autonome Fahrzeuge und Roboter
Diese drei Computer sind erforderlich, um autonome Fahrzeuge, wie Roboter, zu bauen. Mit derzeit 100 Millionen Autos, die jährlich produziert werden, und Milliarden von Autos weltweit, werden sie nach und nach zu hochautomatisierten und vollständig autonomen Fahrsystemen. Jensen Huang prognostiziert, dass dies die erste Billionen-Dollar-Roboterindustrie werden wird. Er stellte auch den Automobilprozessor der nächsten Generation vor, Thor, der im Vergleich zu seinem Vorgänger Orin eine 20-fach höhere Verarbeitungsleistung bietet und als Allzweck-Roboterprozessor dient.


Was können Omniverse und Cosmos also im Zusammenhang mit autonomem Fahren leisten? Sie können unendlich viele Fahrszenarien generieren und so die Entwicklung des autonomen Fahrens in Szenarien mit kurzen Enden und nicht erfassbaren Daten beschleunigen.

Anschließend rief Jensen Huang alle Roboter auf die Bühne und verkündete den „ChatGPT-Moment für Allzweckroboter“. Er erklärte: „Derzeit gibt es drei Arten von Robotern: intelligente KI, autonome Fahrzeuge und Maschinen. Wenn wir über die Technologie verfügen, um diese drei Probleme zu lösen, ist das Zeitalter der Roboter angebrochen.“ Zum Abschluss der Pressekonferenz fasste Huang zusammen, dass derzeit drei neue Blackwell-Systeme in Produktion sind: der Grace Blackwell NVLink72-Supercomputer, ein grundlegendes Modell für physische KI, und drei Arten von Robotern, die im Bereich der intelligenten KI entwickelt wurden.

Ähnliche Produkte:
-
NVIDIA MMA4Z00-NS400 kompatibles 400G OSFP SR4 Flat Top PAM4 850 nm 30 m auf OM3/50 m auf OM4 MTP/MPO-12 Multimode FEC optisches Transceiver-Modul $550.00
-
NVIDIA MMA4Z00-NS-FLT-kompatibles 800 Gbit/s Twin-Port OSFP 2x400G SR8 PAM4 850 nm 100 m DOM Dual MPO-12 MMF optisches Transceiver-Modul $650.00
-
NVIDIA MMA4Z00-NS-kompatibles 800-Gbit/s-Twin-Port-OSFP-2x400G-SR8-PAM4-850-nm-100-m-DOM-Dual-MPO-12-MMF-optisches Transceiver-Modul $650.00
-
NVIDIA MMS4X00-NM-kompatibles 800-Gbit/s-Twin-Port-OSFP-2x400G-PAM4-1310-nm-500-m-DOM-Dual-MTP/MPO-12-SMF-Optisch-Transceiver-Modul $900.00
-
NVIDIA MMS4X00-NM-FLT-kompatibles 800G-Twin-Port-OSFP-2x400G-Flat-Top-PAM4-1310-nm-500-m-DOM-Dual-MTP/MPO-12-SMF-optisches Transceiver-Modul $900.00
-
NVIDIA MMS4X00-NS400 kompatibles 400G OSFP DR4 Flat Top PAM4 1310 nm MTP/MPO-12 500 m SMF FEC optisches Transceiver-Modul $700.00
-
Mellanox MMA1T00-HS kompatibles 200G Infiniband HDR QSFP56 SR4 850nm 100m MPO-12 APC OM3/OM4 FEC PAM4 optisches Transceiver-Modul $149.00
-
NVIDIA MFP7E10-N010-kompatibel, 10 m (33 Fuß), 8 Fasern, geringe Einfügungsdämpfung, Buchse auf Buchse, MPO-Stammkabel, Polarität B, APC auf APC LSZH, Multimode OM3 50/125 $47.00
-
NVIDIA MCP7Y00-N003-FLT-kompatibler 3 m (10 Fuß) 800G Twin-Port OSFP zu 2x400G Flat Top OSFP InfiniBand NDR Breakout DAC $260.00
-
NVIDIA MCP7Y70-H002 kompatibles 2 m (7 Fuß) 400G Twin-Port 2x200G OSFP zu 4x100G QSFP56 Passives Breakout Direct Attach Kupferkabel $155.00
-
NVIDIA MCA4J80-N003-FTF-kompatibles 3 m (10 Fuß) 800G Twin-Port 2x400G OSFP zu 2x400G OSFP InfiniBand NDR Aktives Kupferkabel, flache Oberseite an einem Ende und gerippte Oberseite am anderen Ende $600.00
-
NVIDIA MCP7Y10-N002 kompatibler 2 m (7 Fuß) 800G InfiniBand NDR Twin-Port OSFP zu 2x400G QSFP112 Breakout DAC $190.00