最近の CES カンファレンスで、新しいジャケットを着たジェンセン・フアンが RTX 5090 の正式リリースを発表しました。
50 シリーズ GPU の価格は次のとおりです。
RTX 5090: 1999ドル / RTX 5090 D: 16,499人民元
RTX 5080: 999ドル / 8,299人民元
RTX 5070 Ti: 749ドル
RTX 5070: 549 ドル
RTX 5090 と RTX 5080 は 30 月 5070 日から発売され、RTX 5070 Ti と RTX 50 は XNUMX 月に発売されます。RTX XNUMX シリーズのノート PC は XNUMX 月に発売されます。
黄氏はまた、72 個の Blackwell GPU、72 エクサフロップスの計算能力、1.4 兆個のトランジスタを搭載し、世界最速のスーパーコンピューターを上回ることを目指した新しいデータセンター スーパー チップ、Grace Blackwell NVLink1.3 も披露しました。
さらに、世界初の真のデスクトップ スーパーコンピューター Project Digits が発表されました。価格はわずか 3000 ドルです。これにより、200 億のパラメーターを持つ大規模なモデルをデスク上で実行できます。コーヒー マグカップほどのスペースしか占有しませんが、データ センター レベルのコンピューティング パワーが得られます。
新しい GB10 Grace Blackwell スーパー チップを搭載した Project Digits は、FP1 精度で最大 4 PFLOPS のパフォーマンスを実現できます。
Huang 氏は、将来的にはすべてのデータ サイエンティスト、研究者、学生が自分のデスクに Project Digits の個人用 AI スーパーコンピューターを置くようになると予測しています。AI の時代はすべての人のものになります。
RTX 5090 のデビュー時には、DLSS 4 も導入されました。数か月に渡るリークと噂の後、新世代の RTX Blackwell GPU が、次のパフォーマンス パラメータとともに正式に発表されました。
- 92億個のトランジスタ
- 4000 TOPSのAIコンピューティングパワー
- 380 TFLOPSのレイトレーシング性能
- 125 TFLOPSのシェーダー性能
- 32GBのGDDR7メモリ
- 1792GB / sのメモリ帯域幅
- 最大 21,760 個の CUDA コア
RTX 5090 D の AI コンピューティング能力はわずか 2375 TOPS ですが、それでも 4090 D の XNUMX 倍であることは注目に値します。
このような贅沢な構成と、DLSS 4 および Blackwell アーキテクチャのサポートにより、RTX 5090 のパフォーマンスは RTX 4090 の 575 倍になります。ただし、これは消費電力が高いことも意味します。グラフィック カードの合計電力は 1000 ワットで、推奨電源は XNUMX ワットです。
デモでは、DLSS 2077 を有効にした RTX 5090 で「サイバーパンク 4」を実行すると、238 秒あたり 106 フレームに達したのに対し、DLSS 4090 を有効にした RTX 3.5 では XNUMX 秒あたり XNUMX フレームにとどまりました。
RTX 5080 は RTX 4080 の 16 倍の速度で、7GB の GDDR960 メモリ、10,752GB/s のメモリ帯域幅、5070 個の CUDA コアを備えています。RTX 16 Ti には、7GB の GDDR896 メモリ、8,960GB/s の帯域幅、5070 個の CUDA コアが搭載されています。RTX 12 には、7GB の GDDR672 メモリ、6,144GB/s の容量、5070 個の CUDA コアがあります。Jensen Huang は、549 ドルで販売されている RTX 4090 は、DLSS 4 のおかげで RTX XNUMX レベルのパフォーマンスを提供するとさえ主張しました。
さらに、Huang 氏はリアルタイム レンダリング デモで RTX Blackwell GPU を紹介しました。同氏は、「新世代の DLSS はフレームを生成するだけでなく、未来を予測します。私たちは GeForce で AI を推進してきましたが、今や AI が GeForce に革命を起こしています」と述べています。NVIDIA の新しい RTX ニューラル シェーダーはゲーム テクスチャの圧縮に使用でき、RTX ニューラル フェイスは生成 AI を活用して顔のクオリティを高めます。次世代 DLSS にはマルチフレーム生成テクノロジが含まれており、従来のフレームごとに最大 8 つの追加フレームを生成し、フレーム レートを最大 4 倍に高めます。DLSS XNUMX では、リアルタイム アプリケーションでトランスフォーマーも採用し、画質を向上させ、ゴーストを減らし、動的なシーンにディテールを追加します。
NVIDIA が RTX 50 シリーズ Founders Edition にデュアル軸流ファン、3D ベイパーチャンバー、GDDR7 メモリを搭載した新しいデザインを導入したことは注目に値します。すべての RTX 50 シリーズ GPU は PCIe Gen 5 をサポートし、DisplayPort 2.1b インターフェイスを備え、8Hz で 165K 解像度を駆動できます。驚くべきことに、RTX 5090 Founders Edition はデュアルスロット グラフィックス カードであるため、小型フォーム ファクター ケースに適しています。これは RTX 4090 と比較して大きな変更点です。
NVIDIA のシニア サイエンティストであるジム ファン氏は、ジェンスン フアン氏のグラフィックス テクノロジに関するプレゼンテーションの「本質」を強調しました。フアン氏は、新しい GPU はニューラル ネットワークを使用して、ゲーム内のピクセルの 90% 以上を生成すると説明しました。従来のレイ トレーシング アルゴリズムは、コンテンツの約 10% のみをレンダリングし、「ラフ スケッチ」のようなもので、生成モデルが残りの詳細をリアルタイムで埋めていきます。皆さん、AI はグラフィックス テクノロジの新世代です。
50 シリーズ GPU のデビュー後、Huang 氏は「スケーリングの法則は継続している」と述べました。
- 最初のスケーリング法則は事前トレーニングです。
- 2 番目のスケーリング法則はトレーニング後のものです。
- 3 番目のスケーリング法則は推論時間の計算です。
これらの進化するスケーリング法則により、AI に対する膨大な計算需要が促進されます。驚くべきことに、Microsoft、Meta、xAI を含む約 15 のスーパーコンピューティング センターにはすでに Blackwell GPU が搭載されています。
次に、彼はテスト中のスケーリングの完璧な例として AI エージェントについて言及しました。さらに、彼はさまざまな AI エージェント タスクに高い精度を提供する Llama Nemotron と呼ばれるオープン ライセンスの基礎モデル シリーズのリリースを発表しました。Jensen Huang は、「AI エージェントは次のロボット産業になる可能性があり、数兆ドル規模のビジネス チャンスとなる可能性があります」と述べました。
さらに、NVIDIA の NIM ブループリントはまもなく PC で利用できるようになります。これらのブループリントを使用すると、開発者は PDF ドキュメントに基づいてポッドキャストを作成したり、3D シーンに基づいて魅力的な画像を生成したりできます。
4.05兆個のLLMパラメータを実行できるデスクトップレベルのAIスーパーコンピュータ
CES カンファレンスの締めくくりに、Jensen Huang 氏は革命的な製品である Project Digits を発表しました。これはまさに「デスクトップ スーパーコンピューター」です。この製品は、AI 開発者、データ サイエンティスト、学生、その他 AI 業務に携わる専門家向けに設計されています。
この小型コンピュータは、200億パラメータのモデルを実行できる世界最小のAIスーパーコンピュータで、価格は3,000ドル(約21,986円)。黄氏が実演したように、この小型デスクトップシステムは、平均的なコーヒーカップの幅と高さの約半分という最小限のデスクスペースを占有しながら、膨大な計算能力を提供します。データセンターレベルの計算能力を備えた小型デバイスがデスクにあることを想像してみてください。これがProject Digitsがもたらした革命的なブレークスルーです。
Project Digits には、FP10 精度で最大 1 PFLOPS (ペタフロップス) の AI パフォーマンスを実現できる新しい GB4 Grace Blackwell スーパーチップが搭載されています。
この強力なチップには、20 コアの ARM ベースの Grace CPU も含まれています。CPU と GPU は、高速通信用の NVIDIA NVLink C2C テクノロジを使用して相互接続されています。各 Project Digits には、128 GB の低電力で一貫性の高い統合メモリと、最大 4 TB の NVME ストレージが搭載されています。このセットアップにより、開発者は最大 200 億のパラメータを持つモデルをデスクトップで直接実行できます。さらに、ConnectX ネットワーク チップを使用すると、4.05 台の Project Digits スーパーコンピューターを相互接続して、最大 XNUMX 兆のパラメータを持つモデルを実行できます。
さらに、Project Digits には、NVIDIA DGX 基本オペレーティング システム (Ubuntu Linux ベース) と NVIDIA AI ソフトウェア スタックがプリインストールされており、開発者にプラグ アンド プレイの AI 開発環境を提供します。開発者は、箱から出してすぐに AI プロジェクトを開始できます。何百万人もの開発者にとって、特に大規模な AI モデルを実行するためにクラウド コンピューティング/データ センター リソースを必要とする開発者にとって、これは画期的な革新的な製品となるでしょう。このデスクトップ AI スーパーコンピューターには、AI モデルの実験とプロトタイピング、モデルの微調整と推論 (モデルのテストまたは評価用)、ローカル AI 推論サービス (チャットボットやコード インテリジェンス アシスタントなど) など、幅広いアプリケーションがあります。さらに、データ サイエンティストは、このシステムを利用して NVIDIA RAPIDS を実行し、大規模なデータ サイエンス ワークフローをデスクトップで直接効率的に処理できます。
NVIDIA の AI テクノロジー スタック (フレームワーク、ツール、API) の包括的なサポートにより、Project Digits は、特にロボティクスや VLM (視覚言語モデル) の分野におけるエッジ コンピューティング アプリケーションに最適な開発プラットフォームになります。Project Digits の登場は、パーソナル AI コンピューティングの新しい時代を告げるものです。これにより、世界中の開発者がデスクトップで大規模な AI モデルを実行できるようになり、既存のクラウド コンピューティング リソースが補完され、AI 開発の効率が大幅に向上します。
フィジカルAIの新時代: オープンソースの世界モデル
インテリジェント AI の導入に続いて、Jensen Huang 氏は現在、会話を「物理 AI」に向けています。彼の見解では、「AI の次のフロンティアは物理 AI です。」大規模モデルの原則は、プロンプトに基づいて一度に 1 つのトークンの出力を生成することです。このコンテキストが現実世界の環境になり、プロンプトがリクエストになると、モデルは「コンテンツ トークン」の生成から「アクション トークン」の生成に移行する必要があります。今必要なのは、GPT ベースの言語モデルではなく、効果的な「世界モデル」を作成することです。
この「世界モデル」は、世界の言語を理解し、重力や摩擦などの物理的な力学を理解し、幾何学的および空間的な関係を把握し、因果関係を理解し、物理的な永続性を認識する必要があります。
CES で、ジェンセン・フアンは、物理世界を理解することを目的とした、Cosmos と呼ばれる革新的な世界基盤モデル開発プラットフォームを発表しました。20 万時間のデータセットでトレーニングされた Cosmos は、テキスト、画像、ビデオを入力として受け取り、仮想世界の状態とビデオを生成できます。このプラットフォームには、拡散モデル、自己回帰モデル、ビデオ トークナイザーなどの複数の機能モジュールが含まれており、開発者は特定のニーズに基づいて選択できます。特に、ジェンセン・フアンは、Nano、Super、Ultra を含む Cosmos 全体がオープンソース化され、ダウンロード可能になると発表しました。
さらに、Cosmos を Omniverse と統合して物理的にリアルなマルチジェネレーターを提供することもできます。つまり、物理シミュレーションの世界のすべてを Cosmos を通じて一度に生成できるということです。
ジェンセン・フアン氏は、AI トレーニング用の DGX、AI 展開用の AGX、そして Omniverse と Cosmos の組み合わせという 3 種類のコンピューターについても言及しました。最初の 2 つを接続するには、デジタル ツインが必要です。フアン氏は、「将来的には、すべての工場にデジタル ツインが設置され、Omniverse と Cosmos を組み合わせて、さまざまな将来のシナリオを生成できるようになります」と考えています。
自律走行車とロボット
ロボットのような自律走行車を作るには、この100つのコンピューターが必要です。現在、年間20億台、世界中で数十億台の自動車が生産されており、それらは徐々に高度に自動化され、完全に自律的な運転システムになります。ジェンセン・フアンは、これが最初のXNUMX兆ドル規模のロボット産業になると予測しています。彼はまた、前身のOrinと比較してXNUMX倍の処理性能を誇り、汎用ロボットプロセッサとして機能する次世代自動車プロセッサThorを紹介しました。
では、Omniverse と Cosmos は自動運転の分野で何ができるのでしょうか。無限の運転シナリオを生成し、短いテールと収集不可能なデータを伴うシナリオでの自動運転の開発を加速できます。
続いて、ジェンセン・フアンはすべてのロボットをステージに呼び集め、「汎用ロボットのChatGPT時代」の到来を宣言しました。彼は「現在、ロボットには知能AI、自律走行車、機械の72種類があります。このXNUMXつの問題を解決する技術があれば、ロボットの時代はすぐそこに来ています」と述べました。記者会見の最後に、フアンは、現在、XNUMXつの新しいブラックウェルシステムが生産中であるとまとめました。それは、物理的AIの基礎モデルであるグレースブラックウェルNVLinkXNUMXスーパーコンピューターと、知能AIの分野で開発されたXNUMX種類のロボットです。
関連製品:
-
NVIDIA MMA4Z00-NS400 互換 400G OSFP SR4 フラットトップ PAM4 850nm OM30 で 3m/OM50 で 4m MTP/MPO-12 マルチモード FEC 光トランシーバ モジュール $650.00
-
NVIDIA MMA4Z00-NS-FLT 互換 800Gb/s ツインポート OSFP 2x400G SR8 PAM4 850nm 100m DOM デュアル MPO-12 MMF 光トランシーバー モジュール $850.00
-
NVIDIA MMA4Z00-NS 互換 800Gb/s ツインポート OSFP 2x400G SR8 PAM4 850nm 100m DOM デュアル MPO-12 MMF 光トランシーバー モジュール $750.00
-
NVIDIA MMS4X00-NM 互換 800Gb/s ツインポート OSFP 2x400G PAM4 1310nm 500m DOM デュアル MTP/MPO-12 SMF 光トランシーバー モジュール $1100.00
-
NVIDIA MMS4X00-NM-FLT 互換 800G ツインポート OSFP 2x400G フラットトップ PAM4 1310nm 500m DOM デュアル MTP/MPO-12 SMF 光トランシーバー モジュール $1200.00
-
NVIDIA MMS4X00-NS400 互換 400G OSFP DR4 フラットトップ PAM4 1310nm MTP/MPO-12 500m SMF FEC 光トランシーバー モジュール $800.00
-
Mellanox MMA1T00-HS 互換 200G Infiniband HDR QSFP56 SR4 850nm 100m MPO-12 APC OM3/OM4 FEC PAM4 光トランシーバー モジュール $200.00
-
NVIDIA MFP7E10-N010 互換 10 メートル (33 フィート) 8 ファイバー 低挿入損失 メス - メス MPO トランク ケーブル 極性 B APC - APC LSZH マルチモード OM3 50/125 $47.00
-
NVIDIA MCP7Y00-N003-FLT 互換 3m (10 フィート) 800G ツインポート OSFP ~ 2x400G フラットトップ OSFP InfiniBand NDR ブレイクアウト DAC $275.00
-
NVIDIA MCP7Y70-H002 互換 2m (7 フィート) 400G ツインポート 2x200G OSFP から 4x100G QSFP56 パッシブ ブレークアウト ダイレクト アタッチ銅線ケーブル $155.00
-
NVIDIA MCA4J80-N003-FTF 互換 3m (10 フィート) 800G ツインポート 2x400G OSFP から 2x400G OSFP InfiniBand NDR アクティブ銅線ケーブル、一方の端はフラット トップ、もう一方の端はフィン付きトップ $600.00
-
NVIDIA MCP7Y10-N002 互換性のある 2m (7 フィート) 800G InfiniBand NDR ツインポート OSFP から 2x400G QSFP112 ブレイクアウト DAC $200.00