Jensen Huang, PDG de NVIDIA, a dévoilé le plus petit supercalculateur d'IA au monde

Lors de la récente conférence CES, Jensen Huang, vêtu d'une nouvelle veste, a annoncé la sortie officielle de la RTX 5090.

la sortie officielle de la RTX 5090

Voici les prix des GPU de la série 50.

RTX 5090 : 1999 5090 $ / RTX 16,499 D : XNUMX XNUMX RMB

RTX 5080 : 999 $ / 8,299 XNUMX RMB

RTX 5070 Ti : 749 $

RTX 5070 : 549 $

Voici les prix des GPU de la série 50.

Les RTX 5090 et RTX 5080 seront disponibles à partir du 30 janvier, tandis que les RTX 5070 Ti et RTX 5070 seront lancées en février. Les ordinateurs portables de la série RTX 50 sortiront en mars.

Huang a également présenté la nouvelle super puce de centre de données, Grace Blackwell NVLink72, qui comprend 72 GPU Blackwell, 1.4 exaFLOPS de puissance de calcul et 1.3 billion de transistors, visant à surpasser les supercalculateurs les plus rapides du monde.

Huang a également présenté la nouvelle super puce du centre de données
Grace Blackwell NVLink72

De plus, le premier véritable superordinateur de bureau au monde, Project Digits, a été dévoilé au prix de seulement 3000 200 dollars. Grâce à lui, vous pouvez exécuter des modèles de XNUMX milliards de paramètres directement sur votre bureau, en occupant seulement l'espace d'une tasse à café mais en offrant une puissance de calcul de niveau centre de données.

projet-chiffres

Équipé de la nouvelle super puce GB10 Grace Blackwell, Project Digits peut fournir jusqu'à 1 PFLOPS de performances sous la précision FP4.

Huang prédit qu'à l'avenir, chaque data scientist, chercheur et étudiant aura un supercalculateur d'IA personnel Project Digits sur son bureau. L'ère de l'IA appartiendra à tout le monde.

Equipé de la nouvelle super puce GB10 Grace Blackwell,

Lors des débuts de la RTX 5090, le DLSS 4 a également été introduit. Après des mois de fuites et de rumeurs, la nouvelle génération de GPU RTX Blackwell a été officiellement dévoilée avec les paramètres de performances suivants :

  • 92 milliards de transistors
  • 4000 TOPS de puissance de calcul IA
  • 380 TFLOPS de performances de lancer de rayons
  • 125 TFLOPS de performances de shader
  • 32 Go de mémoire GDDR7
  • Bande passante mémoire de 1792 Go/s
  • Jusqu'à 21,760 XNUMX cœurs CUDA

Il convient de noter que la puissance de calcul de l'IA de la RTX 5090 D n'est que de 2375 TOPS, mais reste le double de celle de la 4090 D.

Il convient de noter que la puissance de calcul de l'IA de la RTX 5090 D n'est que de 2375 TOPS, mais reste le double de celle de la 4090 D

Avec des configurations aussi luxueuses et le support de l'architecture DLSS 4 et Blackwell, les performances de la RTX 5090 sont directement le double de celles de la RTX 4090. Cependant, cela signifie également qu'elle a une consommation d'énergie élevée, avec une puissance totale de la carte graphique de 575 watts et une alimentation recommandée de 1000 watts.

Une démo a montré que l'exécution de « Cyberpunk 2077 » sur la RTX 5090 avec DLSS 4 activé atteignait 238 images par seconde, contre seulement 106 images par seconde sur la RTX 4090 avec DLSS 3.5 activé.

Cyberpunk 2077 sur la RTX 5090

La RTX 5080 est deux fois plus rapide que la RTX 4080, équipée de 16 Go de mémoire GDDR7, d'une bande passante mémoire de 960 Go/s et de 10,752 5070 cœurs CUDA. La RTX 16 Ti est livrée avec 7 Go de mémoire GDDR896, une bande passante de 8,960 Go/s et 5070 12 cœurs CUDA. La RTX 7 dispose de 672 Go de mémoire GDDR6,144, d'une capacité de 5070 Go/s et de 549 4090 cœurs CUDA. Jensen Huang a même affirmé que la RTX 4, vendue XNUMX $, offrira des performances de niveau RTX XNUMX, grâce au DLSS XNUMX.

RTX 5090
RTX 5080
RTX 5070 Ti
RTX 5070

En outre, Huang a présenté le GPU RTX Blackwell avec une démonstration de rendu en temps réel. Il a déclaré : « La nouvelle génération de DLSS ne génère pas seulement des images, mais elle prédit également l'avenir. Nous avons poussé l'IA avec GeForce, et maintenant l'IA révolutionne GeForce. » Les nouveaux shaders neuronaux RTX de NVIDIA peuvent être utilisés pour compresser les textures de jeu, et les visages neuronaux RTX exploitent l'IA générative pour améliorer la qualité faciale. Le DLSS de nouvelle génération comprend une technologie de génération multi-images, produisant jusqu'à trois images supplémentaires par image traditionnelle, augmentant les fréquences d'images jusqu'à 8 fois. DLSS 4 utilise également des transformateurs dans des applications en temps réel pour améliorer la qualité de l'image, réduire les images fantômes et ajouter plus de détails aux scènes dynamiques.

Huang a présenté le GPU RTX Blackwell avec une démonstration de rendu en temps réel

Il convient de noter que NVIDIA a introduit un nouveau design pour la série RTX 50 Founders Edition, avec deux ventilateurs à flux axial, une chambre à vapeur 3D et une mémoire GDDR7. Tous les GPU de la série RTX 50 prennent en charge le PCIe Gen 5 et sont équipés d'interfaces DisplayPort 2.1b, capables de gérer une résolution 8K à 165 Hz. Étonnamment, la RTX 5090 Founders Edition est une carte graphique à double emplacement, ce qui la rend adaptée aux boîtiers à petit facteur de forme, un changement significatif par rapport à la RTX 4090.

NVIDIA a présenté un nouveau design pour la série RTX 50

Jim Fan, scientifique senior chez NVIDIA, a souligné l'« essence » de la présentation de Jensen Huang sur la technologie graphique. Huang a expliqué que les nouveaux GPU utilisent des réseaux neuronaux pour générer plus de 90 % des pixels dans les jeux. Les algorithmes de ray tracing traditionnels ne restituent qu'environ 10 % du contenu, ce qui s'apparente à une « esquisse grossière », les modèles génératifs complétant les détails restants en temps réel. Mesdames et messieurs, l'IA est la nouvelle génération de technologie graphique.

Jim Fan, scientifique senior chez NVIDIA

Après le lancement des GPU de la série 50, Huang a mentionné que la « loi de mise à l’échelle continue » :

  • La première loi d’échelle est celle du pré-entraînement.
  • La deuxième loi d’échelle est post-formation.
  • La troisième loi d’échelle est le calcul au temps d’inférence.
Après les débuts des GPU de la série 50

Ces lois d’échelle en constante évolution sont à l’origine d’une demande de calcul immense pour l’IA. Étonnamment, environ 15 centres de calcul intensif, dont ceux de Microsoft, Meta et xAI, sont déjà équipés de GPU Blackwell.

Blackwell en pleine production

Il a ensuite mentionné les agents IA comme un parfait exemple de mise à l’échelle lors des tests. En outre, il a annoncé le lancement d’une série de modèles fondamentaux sous licence ouverte appelés Llama Nemotron, qui offrent une grande précision pour diverses tâches d’agents IA. Jensen Huang a déclaré : « Les agents IA pourraient être la prochaine industrie de la robotique, représentant potentiellement une opportunité de plusieurs milliards de dollars. »

Les agents IA pourraient être la prochaine industrie de la robotique
mise à l'échelle du temps de test de l'IA agentique
nvidia liam

De plus, le Blueprint NIM de NVIDIA sera bientôt disponible sur PC. Grâce à ces plans, les développeurs pourront créer des podcasts à partir de documents PDF et générer des images époustouflantes guidées par des scènes 3D.

Plan directeur NIM de NVIDIA

Supercalculateur d'IA de niveau bureautique capable d'exécuter 4.05 billions de paramètres LLM

Avant de conclure la conférence CES, Jensen Huang a dévoilé un produit révolutionnaire : le projet Digits, un véritable « superordinateur de bureau » ! Il est conçu pour les développeurs d’IA, les data scientists, les étudiants et autres professionnels impliqués dans le domaine de l’IA.

Supercalculateur d'IA de niveau bureautique capable d'exécuter 4.05 billions de paramètres LLM

Cet ordinateur compact est le plus petit supercalculateur d'intelligence artificielle au monde, capable d'exécuter un modèle de 200 milliards de paramètres, au prix de 3,000 21,986 $ (environ XNUMX XNUMX ¥). Comme l'a démontré Huang, ce système de bureau compact fournit une puissance de calcul immense tout en occupant un espace de bureau minimal, soit environ la largeur d'une tasse à café moyenne et environ la moitié de sa hauteur. Imaginez avoir un appareil miniature sur votre bureau qui offre une puissance de calcul de niveau centre de données. C'est la percée révolutionnaire apportée par le projet Digits !

Le projet Digits présente la nouvelle superpuce GB10 Grace Blackwell, capable de fournir jusqu'à 1 PFLOPS (pétaflops) de performances d'IA avec une précision FP4.

Project Digits présente la nouvelle superpuce GB10 Grace Blackwell

Cette puce puissante comprend également un processeur Grace à 20 cœurs basé sur ARM. Le processeur et le processeur graphique sont interconnectés à l'aide de la technologie NVIDIA NVLink C2C pour une communication à haut débit. Chaque Project Digits est équipé de 128 Go de mémoire unifiée à faible consommation et hautement cohérente, et jusqu'à 4 To de stockage NVME. Avec cette configuration, les développeurs peuvent exécuter des modèles jusqu'à 200 milliards de paramètres directement sur leurs ordinateurs de bureau. De plus, avec la puce réseau ConnectX, deux supercalculateurs Project Digits peuvent être interconnectés pour exécuter des modèles avec jusqu'à 4.05 billions de paramètres.

Processeur Grace à 20 cœurs basé sur ARM

De plus, Project Digits est livré préinstallé avec le système d'exploitation de base NVIDIA DGX (basé sur Ubuntu Linux) et la pile logicielle NVIDIA AI, offrant aux développeurs un environnement de développement d'IA plug-and-play. Les développeurs peuvent rapidement démarrer leurs projets d'IA dès la sortie de la boîte. Pour des millions de développeurs, ce sera un produit innovant qui changera la donne, en particulier pour ceux qui ont besoin de ressources de cloud computing/centre de données pour exécuter de grands modèles d'IA. Ce supercalculateur d'IA de bureau offre un large éventail d'applications, notamment l'expérimentation et le prototypage de modèles d'IA, le réglage fin et l'inférence de modèles (pour les tests ou l'évaluation de modèles) et les services d'inférence d'IA locaux (tels que les chatbots ou les assistants d'intelligence de code). De plus, les data scientists peuvent utiliser le système pour exécuter NVIDIA RAPIDS, gérant efficacement les flux de travail de science des données à grande échelle directement sur leurs ordinateurs de bureau.

Project Digits est préinstallé avec le système d'exploitation de base NVIDIA DGX

Grâce à la prise en charge complète de la pile technologique d'IA de NVIDIA (frameworks, outils, API), Project Digits devient une plateforme de développement idéale pour les applications d'informatique de pointe, notamment dans les domaines de la robotique et des modèles de langage de vision (VLM). L'avènement de Project Digits marque une nouvelle ère dans l'informatique d'IA personnelle. Il permet aux développeurs du monde entier d'exécuter des modèles d'IA à grande échelle sur leurs postes de travail, complétant ainsi les ressources de cloud computing existantes et améliorant considérablement l'efficacité du développement de l'IA.

La nouvelle ère de l'IA physique : le modèle mondial open source

Après l’introduction de l’IA intelligente, Jensen Huang a désormais orienté la conversation vers « l’IA physique ». Selon lui, « la prochaine frontière de l’IA est l’IA physique ». Le principe des grands modèles consiste à générer une sortie un jeton à la fois en fonction des invites. Si ce contexte devient l’environnement du monde réel et que l’invite devient une demande, le modèle doit passer de la génération de « jetons de contenu » à la génération de « jetons d’action ». Ce dont nous avons besoin maintenant, c’est de créer un « modèle mondial » efficace plutôt que des modèles de langage basés sur GPT.

Modèle mondial Open Source

Ce « modèle du monde » doit comprendre le langage du monde, appréhender la dynamique physique comme la gravité et la friction, saisir les relations géométriques et spatiales, comprendre la causalité et reconnaître la permanence physique.

Au CES, Jensen Huang a annoncé une plateforme révolutionnaire de développement de modèles fondamentaux du monde appelée Cosmos, visant à comprendre le monde physique. Formé sur un ensemble de données de 20 millions d'heures, Cosmos peut prendre du texte, des images et des vidéos en entrée et générer des états du monde virtuel et des vidéos. La plateforme comprend plusieurs modules fonctionnels, tels que des modèles de diffusion, des modèles autorégressifs et des tokenizers vidéo, permettant aux développeurs de choisir en fonction de besoins spécifiques. Jensen Huang a notamment annoncé que Cosmos, dans son intégralité, y compris Nano, Super et Ultra, sera open source et disponible en téléchargement.

une plate-forme révolutionnaire de développement d'un modèle fondateur mondial

De plus, Cosmos peut être intégré à Omniverse pour fournir un multi-générateur physiquement réaliste, ce qui signifie que tout dans le monde de la simulation physique peut être généré simultanément via Cosmos.

Cosmos peut être intégré à Omniverse pour fournir un multi-générateur physiquement réaliste

Jensen Huang a également mentionné trois types d’ordinateurs : un DGX pour la formation de l’IA, un AGX pour le déploiement de l’IA et une combinaison d’Omniverse et de Cosmos. Pour relier les deux premiers, nous avons besoin d’un jumeau numérique. Huang estime que « dans le futur, chaque usine aura un jumeau numérique et que vous pourrez combiner Omniverse et Cosmos pour générer de nombreux scénarios futurs ».

Omnivers et Cosmos
simulateur mondial
plan du jumeau numérique d'une installation robotique géante
omnivers
entrepôt de nouvelle génération

Véhicules et robots autonomes

La création de véhicules autonomes, comme celle de robots, nécessite ces trois ordinateurs. À l’heure actuelle, avec 100 millions de voitures produites chaque année et des milliards de voitures dans le monde, elles deviendront progressivement des systèmes de conduite hautement automatisés et entièrement autonomes. Jensen Huang prédit que cela deviendra la première industrie robotique de mille milliards de dollars. Il a également présenté le processeur automobile de nouvelle génération, Thor, qui bénéficie d’une puissance de traitement 20 fois supérieure à celle de son prédécesseur, Orin, et sert de processeur robotique à usage général.

Véhicules et robots autonomes
Thor

Alors, que peuvent faire Omniverse et Cosmos dans le contexte de la conduite autonome ? Ils peuvent générer des scénarios de conduite infinis, accélérant ainsi le développement de la conduite autonome dans des scénarios à courte traîne et aux données non collectables.

générer des scénarios de conduite infinis

Après cela, Jensen Huang a convoqué tous les robots sur scène et a annoncé l'arrivée du « moment ChatGPT pour les robots à usage général ». Il a déclaré : « Il existe actuellement trois types de robots : l'IA intelligente, les véhicules autonomes et les machines. Si nous avons la technologie pour résoudre ces trois problèmes, l'ère des robots est à portée de main. » En conclusion de la conférence de presse, Huang a résumé qu'il y avait désormais trois nouveaux systèmes Blackwell en production : le supercalculateur Grace Blackwell NVLink72, un modèle fondamental pour l'IA physique, et trois types de robots développés dans le domaine de l'IA intelligente.

Jensen Huang a convoqué tous les robots sur scène

Laisser un commentaire

Remonter en haut