100 年にリリースされた NVIDIA DGX H2022 には、NDR 8Gb/s 帯域幅をサポートする 7 つのシングルポート ConnectX-400 ネットワーク カードと、IB/イーサネット ネットワークをサポートできる 2 つのデュアルポート Bluefield-3 DPU (200Gb/s) が装備されています。 。外観を次の図に示します。
DGX H100 には、ストレージ ネットワークとインバンド管理ネットワーク用に 4 つの QSFP56 ポートがあります。さらに、リモート ホスト OS 管理用に 10G イーサネット ポートが 1 つ、リモート システム管理用に XNUMXG イーサネット ポートが XNUMX つあります。
サーバーの内部ネットワーク トポロジの図から、コンピューティング ネットワーク接続用の 4 つの OSFP ポート (紫色のポート) があり、青いブロックはネットワーク カードであり、ネットワーク カードとして機能し、PCIe スイッチ拡張の役割も果たすことができます。 、CPUとGPUの間の橋渡しになります。
NVIDIA SuperPOD NVLink クラスター相互接続スキームが採用されている場合、32 台の H100 が外部 NVLink スイッチを介して相互接続されます。サーバー内の 8 つの GPU は 4 つの NVSwitch モジュールに接続されており、各 NVSwitch モジュールは 4 ~ 5 に対応します。 OSFP光モジュール、合計 18 個の OSFP があり、OSFP は 18 個の外部 NVLink スイッチに接続されます。 (現在、市販されている H100 にはこれら 18 個の OSFP モジュールが搭載されていません) この記事では、NVLink ネットワーキング方式については説明せず、IB ネットワーキング方式に焦点を当てています。 NVIDIA リファレンス設計ドキュメントによると、DGX H100 サーバー クラスターでは、32 台の DGX H100 ごとに SU を形成し、4 台ごとの DGX H100 が別のラックに配置されます (各ラックの電力は 40KW に近いと推定されます)。各種スイッチは独立した10つのラックに配置されています。したがって、各 SU には 8 ラック (サーバー配置用に 2 ラック、スイッチ配置用に 9700 ラック) が含まれます。コンピューティング ネットワークでは、Spine-Leaf XNUMX 層スイッチ (Mellanox QMXNUMX) を使用するだけで済みます。ネットワーク トポロジは次の図に示されています。
スイッチの使用: クラスターでは、32 台の DGX H100 ごとに SU を形成し (各 SU に 8 つのリーフ スイッチがあります)、4 台の H128 サーバー クラスターには 100 つの SU があるため、合計 32 個のリーフ スイッチがあります。 SU 内の各 DGX H100 は、8 つのリーフ スイッチすべてと接続する必要があります。各サーバーにはコンピューティング ネットワーク接続用の OSFP ポートが 4 つしかないため、各ポートに 800G 光モジュールを接続した後、拡張ポートを介して 100 つの OSFP ポートが 8 つの QSFP ポートに拡張され、各 DGX H16 と 16 つのリーフ スイッチの接続が実現します。各リーフ スイッチには、XNUMX 個のスパイン スイッチに接続する XNUMX 個のアップリンク ポートがあります。
光モジュールの使用量: リーフ スイッチのダウンリンク ポートには 400G 光モジュールが必要で、需要は 3284 です。リーフ スイッチのアップリンク ポートには 800G 光モジュールが使用され、需要は 1684 です。800G 光モジュールは、 Spine スイッチのダウンリンク ポート。したがって、128 台の H800 サーバー クラスターで使用されるコンピューティング ネットワークは、 800G光学モジュール 1536 および 400G 光モジュール 1024。
関連製品:
- NVIDIA MMA4Z00-NS400 互換 400G OSFP SR4 フラットトップ PAM4 850nm OM30 で 3m/OM50 で 4m MTP/MPO-12 マルチモード FEC 光トランシーバ モジュール $900.00
- NVIDIA MMA4Z00-NS-FLT 互換 800Gb/s ツインポート OSFP 2x400G SR8 PAM4 850nm 100m DOM デュアル MPO-12 MMF 光トランシーバー モジュール $1200.00
- NVIDIA MMA4Z00-NS 互換 800Gb/s ツインポート OSFP 2x400G SR8 PAM4 850nm 100m DOM デュアル MPO-12 MMF 光トランシーバー モジュール $1200.00
- NVIDIA MMS4X00-NM 互換 800Gb/s ツインポート OSFP 2x400G PAM4 1310nm 500m DOM デュアル MTP/MPO-12 SMF 光トランシーバー モジュール $1550.00
- NVIDIA MMS4X00-NM-FLT 互換 800G ツインポート OSFP 2x400G フラットトップ PAM4 1310nm 500m DOM デュアル MTP/MPO-12 SMF 光トランシーバー モジュール $1550.00
- NVIDIA MMS4X00-NS400 互換 400G OSFP DR4 フラットトップ PAM4 1310nm MTP/MPO-12 500m SMF FEC 光トランシーバー モジュール $1350.00
- Mellanox MMA1T00-HS 互換 200G Infiniband HDR QSFP56 SR4 850nm 100m MPO-12 APC OM3/OM4 FEC PAM4 光トランシーバー モジュール $300.00
- NVIDIA MFP7E10-N010 互換 10 メートル (33 フィート) 8 ファイバー 低挿入損失 メス - メス MPO トランク ケーブル 極性 B APC - APC LSZH マルチモード OM3 50/125 $47.00
- NVIDIA MCP7Y00-N003-FLT 互換 3m (10 フィート) 800G ツインポート OSFP ~ 2x400G フラットトップ OSFP InfiniBand NDR ブレイクアウト DAC $495.00
- NVIDIA MCP7Y70-H002 互換 2m (7 フィート) 400G ツインポート 2x200G OSFP から 4x100G QSFP56 パッシブ ブレークアウト ダイレクト アタッチ銅線ケーブル $250.00
- NVIDIA MCA4J80-N003-FTF 互換 3m (10 フィート) 800G ツインポート 2x400G OSFP から 2x400G OSFP InfiniBand NDR アクティブ銅線ケーブル、一方の端はフラット トップ、もう一方の端はフィン付きトップ $600.00
- NVIDIA MCP7Y10-N002 互換性のある 2m (7 フィート) 800G InfiniBand NDR ツインポート OSFP から 2x400G QSFP112 ブレイクアウト DAC $680.00