NVIDIA-CEO Jensen Huang hat den kleinsten KI-Supercomputer der Welt vorgestellt

Auf der jüngsten CES-Konferenz kündigte Jensen Huang im neuen Jackett die offizielle Veröffentlichung der RTX 5090 an.

die offizielle Veröffentlichung des RTX 5090

Hier sind die Preise für die GPUs der 50er-Serie.

RTX 5090: 1999 USD / RTX 5090 D: 16,499 RMB

RTX 5080: 999 USD / 8,299 RMB

RTX 5070 Ti: 749 $

RTX 5070: 549 $

Hier sind die Preise für die GPUs der 50er-Serie.

Die RTX 5090 und RTX 5080 sind ab dem 30. Januar erhältlich, während die RTX 5070 Ti und RTX 5070 im Februar auf den Markt kommen. Die Laptops der RTX 50-Serie erscheinen im März.

Huang stellte außerdem den neuen Superchip für Rechenzentren vor – Grace Blackwell NVLink72, der über 72 Blackwell-GPUs, 1.4 ExaFLOPS Rechenleistung und 1.3 Billionen Transistoren verfügt und die schnellsten Supercomputer der Welt übertreffen soll.

Huang präsentierte auch den neuen Superchip für Rechenzentren
Grace Blackwell NVLink72

Darüber hinaus wurde der weltweit erste echte Desktop-Supercomputer, Project Digits, vorgestellt, der nur 3000 US-Dollar kostet. Damit können Sie Modelle mit einer Größe von 200 Milliarden Parametern direkt auf Ihrem Schreibtisch ausführen. Dabei nimmt er nur den Platz einer Kaffeetasse ein, bietet aber Rechenleistung auf Rechenzentrumsniveau.

Projektziffern

Ausgestattet mit dem neuen GB10 Grace Blackwell-Superchip kann Project Digits eine Leistung von bis zu 1 PFLOPS bei FP4-Präzision liefern.

Huang prognostiziert, dass in Zukunft jeder Datenwissenschaftler, Forscher und Student einen persönlichen KI-Supercomputer von Project Digits auf seinem Schreibtisch haben wird. Das KI-Zeitalter wird allen gehören.

Ausgestattet mit dem neuen GB10 Grace Blackwell Superchip,

Beim Debüt der RTX 5090 wurde auch DLSS 4 vorgestellt. Nach Monaten voller Leaks und Gerüchten wurde die neue Generation der RTX Blackwell GPUs offiziell mit den folgenden Leistungsparametern vorgestellt:

  • 92 Milliarden Transistoren
  • 4000 TOPS KI-Rechenleistung
  • 380 TFLOPS Raytracing-Leistung
  • 125 TFLOPS Shader-Leistung
  • 32 GB GDDR7-Speicher
  • 1792 GB/s Speicherbandbreite
  • Bis zu 21,760 CUDA-Kerne

Es ist erwähnenswert, dass die KI-Rechenleistung des RTX 5090 D nur 2375 TOPS beträgt, aber immer noch doppelt so hoch ist wie die des 4090 D.

Es ist erwähnenswert, dass die KI-Rechenleistung des RTX 5090 D nur 2375 TOPS beträgt, aber immer noch doppelt so hoch ist wie die des 4090 D

Mit solch luxuriösen Konfigurationen und der Unterstützung von DLSS 4 und der Blackwell-Architektur ist die Leistung der RTX 5090 direkt doppelt so hoch wie die der RTX 4090. Dies bedeutet jedoch auch einen hohen Stromverbrauch, mit einer Gesamtleistung der Grafikkarte von 575 Watt und einem empfohlenen Netzteil von 1000 Watt.

Eine Demo zeigte, dass beim Ausführen von „Cyberpunk 2077“ auf der RTX 5090 mit aktiviertem DLSS 4 238 Bilder pro Sekunde erreicht wurden, verglichen mit nur 106 Bildern pro Sekunde auf der RTX 4090 mit aktiviertem DLSS 3.5.

Cyberpunk 2077 auf der RTX 5090

Die RTX 5080 ist doppelt so schnell wie die RTX 4080 und verfügt über 16 GB GDDR7-Speicher, eine Speicherbandbreite von 960 GB/s und 10,752 CUDA-Kerne. Die RTX 5070 Ti verfügt über 16 GB GDDR7-Speicher, 896 GB/s Bandbreite und 8,960 CUDA-Kerne. Die RTX 5070 hat 12 GB GDDR7-Speicher, 672 GB/s Kapazität und 6,144 CUDA-Kerne. Jensen Huang behauptete sogar, dass die RTX 5070, die 549 US-Dollar kostet, dank DLSS 4090 eine Leistung auf dem Niveau der RTX 4 bieten wird.

RTX 5090
RTX 5080
RTX 5070 Ti
RTX 5070

Darüber hinaus präsentierte Huang die RTX Blackwell GPU mit einer Echtzeit-Rendering-Demo. Er erklärte: „Die neue Generation von DLSS generiert nicht nur Frames, sondern sagt auch die Zukunft voraus. Wir haben KI mit GeForce vorangetrieben, und jetzt revolutioniert KI GeForce.“ Die neuen RTX Neural Shader von NVIDIA können zum Komprimieren von Spieltexturen verwendet werden, und RTX Neural Faces nutzen generative KI, um die Gesichtsqualität zu verbessern. Das DLSS der nächsten Generation umfasst eine Technologie zur Generierung mehrerer Frames, die bis zu drei zusätzliche Frames pro herkömmlichem Frame erzeugt und die Framerate um das bis zu Achtfache erhöht. DLSS 8 verwendet auch Transformers in Echtzeitanwendungen, um die Bildqualität zu verbessern, Ghosting zu reduzieren und dynamischen Szenen mehr Details hinzuzufügen.

Huang präsentierte die RTX Blackwell GPU mit einer Echtzeit-Rendering-Demo

Es ist bemerkenswert, dass NVIDIA ein neues Design für die Founders Edition der RTX 50-Serie eingeführt hat, das über zwei Axiallüfter, eine 3D-Dampfkammer und GDDR7-Speicher verfügt. Alle GPUs der RTX 50-Serie unterstützen PCIe Gen 5 und sind mit DisplayPort 2.1b-Schnittstellen ausgestattet, die eine 8K-Auflösung bei 165 Hz ermöglichen. Überraschenderweise ist die RTX 5090 Founders Edition eine Dual-Slot-Grafikkarte, die sich für Gehäuse mit kleinem Formfaktor eignet – eine bedeutende Änderung im Vergleich zur RTX 4090.

NVIDIA hat ein neues Design für die RTX 50-Serie vorgestellt

Jim Fan, leitender Wissenschaftler bei NVIDIA, hob die „Essenz“ von Jensen Huangs Präsentation zur Grafiktechnologie hervor. Huang erklärte, dass die neuen GPUs neuronale Netzwerke verwenden, um über 90 % der Pixel in Spielen zu generieren. Herkömmliche Raytracing-Algorithmen rendern nur etwa 10 % des Inhalts, ähnlich einer „groben Skizze“, wobei generative Modelle die restlichen Details in Echtzeit ausfüllen. Meine Damen und Herren, KI ist die neue Generation der Grafiktechnologie.

Jim Fan, leitender Wissenschaftler bei NVIDIA

Nach dem Debüt der GPUs der 50er-Serie erwähnte Huang, dass das „Skalierungsgesetz weiterhin gilt“:

  • Das erste Skalierungsgesetz ist das Vortraining.
  • Das zweite Skalierungsgesetz gilt nach dem Training.
  • Das dritte Skalierungsgesetz betrifft Berechnungen zur Inferenzzeit.
Nach dem Debüt der GPUs der 50er-Serie

Diese sich entwickelnden Skalierungsgesetze treiben den immensen Rechenbedarf für KI voran. Erstaunlicherweise sind etwa 15 Supercomputing-Zentren, darunter die von Microsoft, Meta und xAI, bereits mit Blackwell-GPUs ausgestattet.

Blackwell In voller Produktion

Als nächstes erwähnte er KI-Agenten als perfektes Beispiel für Skalierung während des Tests. Darüber hinaus kündigte er die Einführung einer Reihe von frei lizenzierten Basismodellen namens Llama Nemotron an, die eine hohe Genauigkeit für verschiedene KI-Agentenaufgaben bieten. Jensen Huang erklärte: „KI-Agenten könnten die nächste Roboterindustrie sein und potenziell eine Multi-Billionen-Dollar-Chance darstellen.“

KI-Agenten könnten die nächste Roboterindustrie sein
Skalierung der Testzeit für agentenbasierte KI
Nvidia Liama

Darüber hinaus wird NVIDIAs NIM Blueprint bald auf dem PC verfügbar sein. Mit diesen Blueprints können Entwickler Podcasts auf Basis von PDF-Dokumenten erstellen und anhand von 3D-Szenen beeindruckende Bilder generieren.

NVIDIAs NIM-Blueprint

KI-Supercomputer auf Desktop-Niveau kann 4.05 Billionen LLM-Parameter ausführen

Vor dem Abschluss der CES-Konferenz stellte Jensen Huang ein revolutionäres Produkt vor – Project Digits – einen echten „Desktop-Supercomputer!“. Er ist für KI-Entwickler, Datenwissenschaftler, Studenten und andere Fachleute konzipiert, die sich mit KI beschäftigen.

KI-Supercomputer auf Desktop-Niveau kann 4.05 Billionen LLM-Parameter ausführen

Dieser kompakte Computer ist der kleinste KI-Supercomputer der Welt, der ein 200-Milliarden-Parameter-Modell ausführen kann. Er kostet 3,000 US-Dollar (ca. 21,986 Yen). Wie Huang demonstriert, bietet dieses kompakte Desktop-System enorme Rechenleistung und nimmt dabei nur minimalen Platz auf dem Schreibtisch ein – etwa so breit wie eine durchschnittliche Kaffeetasse und ungefähr halb so hoch. Stellen Sie sich vor, Sie hätten ein Miniaturgerät auf Ihrem Schreibtisch, das Rechenleistung auf dem Niveau eines Rechenzentrums bietet. Dies ist der revolutionäre Durchbruch, den Project Digits gebracht hat!

Project Digits verfügt über den neuen GB10 Grace Blackwell-Superchip, der bis zu 1 PFLOPS (Petaflops) KI-Leistung mit FP4-Präzision liefern kann.

Project Digits präsentiert den neuen GB10 Grace Blackwell-Superchip

Dieser leistungsstarke Chip enthält außerdem eine Grace-CPU mit 20 Kernen auf ARM-Basis. CPU und GPU sind mithilfe der NVIDIA NVLink C2C-Technologie für Hochgeschwindigkeitskommunikation miteinander verbunden. Jeder Project Digits ist mit 128 GB stromsparendem, hochkonsistentem einheitlichem Speicher und bis zu 4 TB NVME-Speicher ausgestattet. Mit diesem Setup können Entwickler Modelle mit bis zu 200 Milliarden Parametern direkt auf ihren Desktops ausführen. Darüber hinaus können mit dem ConnectX-Netzwerkchip zwei Project Digits-Supercomputer miteinander verbunden werden, um Modelle mit bis zu 4.05 Billionen Parametern auszuführen.

20-Core ARM-basierte Grace-CPU

Darüber hinaus ist Project Digits mit dem NVIDIA DGX-Basisbetriebssystem (basierend auf Ubuntu Linux) und dem NVIDIA AI-Software-Stack vorinstalliert, sodass Entwickler eine Plug-and-Play-Entwicklungsumgebung für KI erhalten. Entwickler können sofort mit ihren KI-Projekten loslegen. Für Millionen von Entwicklern wird es ein bahnbrechendes innovatives Produkt sein, insbesondere für diejenigen, die Cloud-Computing-/Rechenzentrumsressourcen benötigen, um große KI-Modelle auszuführen. Dieser Desktop-KI-Supercomputer verfügt über ein breites Anwendungsspektrum, darunter Experimente und Prototyping von KI-Modellen, Feinabstimmung und Inferenz von Modellen (zum Testen oder Auswerten von Modellen) sowie lokale KI-Inferenzdienste (wie Chatbots oder Code Intelligence-Assistenten). Darüber hinaus können Datenwissenschaftler das System nutzen, um NVIDIA RAPIDS auszuführen und so groß angelegte Data-Science-Workflows direkt auf ihren Desktops effizient abzuwickeln.

Project Digits ist mit dem NVIDIA DGX-Basisbetriebssystem vorinstalliert

Dank der umfassenden Unterstützung des KI-Technologie-Stacks (Frameworks, Tools, APIs) von NVIDIA wird Project Digits zu einer idealen Entwicklungsplattform für Edge-Computing-Anwendungen, insbesondere in den Bereichen Robotik und VLM (Vision-Language Models). Die Einführung von Project Digits markiert eine neue Ära im Bereich des persönlichen KI-Computings. Es ermöglicht Entwicklern weltweit, KI-Modelle im großen Maßstab auf ihren Desktops auszuführen, wodurch vorhandene Cloud-Computing-Ressourcen ergänzt und die Effizienz der KI-Entwicklung deutlich gesteigert wird.

Die neue Ära der physischen KI: Open Source-Weltmodell

Nach der Einführung intelligenter KI hat Jensen Huang die Diskussion nun auf „physische KI“ gelenkt. Seiner Ansicht nach ist „physische KI die nächste Grenze für KI“. Das Prinzip großer Modelle besteht darin, basierend auf Eingabeaufforderungen jeweils ein Token als Ausgabe zu generieren. Wenn dieser Kontext zur realen Umgebung wird und die Eingabeaufforderung zu einer Anfrage wird, muss das Modell von der Generierung von „Inhaltstoken“ zur Generierung von „Aktionstoken“ übergehen. Was wir jetzt brauchen, ist die Erstellung eines effektiven „Weltmodells“ anstelle von GPT-basierten Sprachmodellen.

Open Source-Weltmodell

Dieses „Weltmodell“ muss die Sprache der Welt verstehen, physikalische Dynamiken wie Schwerkraft und Reibung begreifen, geometrische und räumliche Beziehungen erfassen, Kausalität begreifen und physikalische Permanenz erkennen.

Auf der CES kündigte Jensen Huang eine revolutionäre Plattform zur Entwicklung von Weltmodellen namens Cosmos an, die auf das Verständnis der physischen Welt abzielt. Cosmos wurde mit einem 20 Millionen Stunden umfassenden Datensatz trainiert und kann Text, Bilder und Videos als Eingabe verwenden und virtuelle Weltzustände und Videos generieren. Die Plattform umfasst mehrere Funktionsmodule wie Diffusionsmodelle, autoregressive Modelle und Video-Tokenizer, sodass Entwickler je nach spezifischen Anforderungen auswählen können. Jensen Huang kündigte insbesondere an, dass Cosmos in seiner Gesamtheit, einschließlich Nano, Super und Ultra, Open Source sein und zum Download zur Verfügung stehen wird.

eine revolutionäre Plattform zur Entwicklung von Weltgrundmodellen

Darüber hinaus kann Cosmos in Omniverse integriert werden, um einen physikalisch realistischen Multigenerator bereitzustellen. Dies bedeutet, dass durch Cosmos alles in der physikalischen Simulationswelt gleichzeitig generiert werden kann.

Cosmos kann mit Omniverse integriert werden, um einen physikalisch realistischen Multigenerator bereitzustellen

Jensen Huang erwähnte auch drei Arten von Computern: einen DGX zum Trainieren von KI, einen AGX zum Bereitstellen von KI und eine Kombination aus Omniverse und Cosmos. Wenn wir die ersten beiden verbinden, brauchen wir einen digitalen Zwilling. Huang glaubt: „In Zukunft wird jede Fabrik einen digitalen Zwilling haben, und Sie können Omniverse und Cosmos kombinieren, um zahlreiche Zukunftsszenarien zu generieren.“

Omniversum und Kosmos
Weltsimulator
Bauplan des digitalen Zwillings einer Mega-Roboteranlage
Omniversum
Lager der nächsten Generation

Autonome Fahrzeuge und Roboter

Diese drei Computer sind erforderlich, um autonome Fahrzeuge, wie Roboter, zu bauen. Mit derzeit 100 Millionen Autos, die jährlich produziert werden, und Milliarden von Autos weltweit, werden sie nach und nach zu hochautomatisierten und vollständig autonomen Fahrsystemen. Jensen Huang prognostiziert, dass dies die erste Billionen-Dollar-Roboterindustrie werden wird. Er stellte auch den Automobilprozessor der nächsten Generation vor, Thor, der im Vergleich zu seinem Vorgänger Orin eine 20-fach höhere Verarbeitungsleistung bietet und als Allzweck-Roboterprozessor dient.

Autonome Fahrzeuge und Roboter
Thor

Was können Omniverse und Cosmos also im Zusammenhang mit autonomem Fahren leisten? Sie können unendlich viele Fahrszenarien generieren und so die Entwicklung des autonomen Fahrens in Szenarien mit kurzen Enden und nicht erfassbaren Daten beschleunigen.

Generierung unendlich vieler Fahrszenarien

Anschließend rief Jensen Huang alle Roboter auf die Bühne und verkündete den „ChatGPT-Moment für Allzweckroboter“. Er erklärte: „Derzeit gibt es drei Arten von Robotern: intelligente KI, autonome Fahrzeuge und Maschinen. Wenn wir über die Technologie verfügen, um diese drei Probleme zu lösen, ist das Zeitalter der Roboter angebrochen.“ Zum Abschluss der Pressekonferenz fasste Huang zusammen, dass derzeit drei neue Blackwell-Systeme in Produktion sind: der Grace Blackwell NVLink72-Supercomputer, ein grundlegendes Modell für physische KI, und drei Arten von Robotern, die im Bereich der intelligenten KI entwickelt wurden.

Jensen Huang rief alle Roboter auf die Bühne

Hinterlasse einen Kommentar

Nach oben scrollen