目次
トグルエグゼクティブサマリー
デジタル経済と人工知能(AI)技術の爆発的な成長に伴い、世界のデータセンターネットワークインフラは、100Gから400G/800Gへの移行という歴史的に重要な節目を迎えています。大規模言語モデル(LLM)パラメータが兆単位を突破し、高性能コンピューティング(HPC)と分散ストレージの需要が急増する中、ネットワークはもはや単なるデータ伝送チャネルではなく、コンピューティングクラスターの効率を左右する中核的なボトルネックへと進化しています。次世代データセンターネットワークの礎となる400Gイーサネットスイッチの技術的本質は、単なる帯域幅のアップグレードを超え、基盤となるチップアーキテクチャの異種性、輻輳制御アルゴリズムのインテリジェンス、そして光電子相互接続形態の革新に深く関わっています。
本レポートは、現在の400Gスイッチ市場における技術エコシステムと競争環境を包括的かつ徹底的に分析することを目的としています。調査によると、2024年から2025年にかけて、世界のイーサネットスイッチ市場はAIバックエンドネットワークの需要に大きく牽引され、2桁の大幅な成長を達成する見込みです。800Gポートの出荷成長率は急速ですが、成熟したサプライチェーン、優れたコストパフォーマンス、そして広範なレガシー互換性により、400Gは現在および今後3年間、データセンターにおける主要なキャリアプラットフォームであり続けるでしょう。
技術的な側面では、イーサネットは従来の RoCEv2(RDMA over Converged Ethernet)技術を通じて、イーサネットの本来の「ベストエフォート」特性とAIトレーニングにおける「ロスレスネットワーク」への要求との間の矛盾を解決するため、Broadcom、NVIDIA、Ciscoといったチップ大手は、ディープテレメトリと高度なフロー制御機能を備えたASICチップ(Tomahawk 5、Spectrum-4、Silicon One G100など)を発売しました。一方、Huawei、H3C、Ruijieといったシステムベンダーは、iLossless、SeerNetwork、RALBといったソフトウェアとハードウェアを統合したアルゴリズムの革新を通じて、差別化された競争障壁を構築してきました。本レポートでは、これらの技術的詳細を掘り下げ、市場データと組み合わせることで、企業ユーザー、投資家、そして技術意思決定者にとって将来を見据えた戦略的参考資料を提供します。
マクロ的な背景と技術的推進要因:クラウドコンピューティングからAIファクトリーまで
交通モデルの根本的な変化
過去10年間、データセンターのネットワーク設計は主にクラウドコンピューティングとWebアプリケーションへのサービス提供を目的としており、トラフィック特性は「North-South」(クライアントからサーバー)フローが中心でしたが、仮想化によってもたらされる「East-West」(VM間)トラフィックも考慮されていました。しかし、Generative AIの台頭により、このパラダイムは完全に変化しました。AIトレーニングクラスターでは、数千台のGPUがパラメータ同期(All-Reduce)を実行する必要があり、ネットワークトラフィックが極めて高い負荷を伴います。 バースト性 および 多対一(インキャスト) 特性。
このトラフィックモデルの移行により、従来のオーバーサブスクリプション型ネットワークアーキテクチャはもはや適用できなくなりました。AIファクトリーでは、ネットワークは高スループット、パケットロスゼロ、そして決定論的な低レイテンシを実現する必要があります。研究によると、ネットワークレイテンシがわずかに増加すると(例えば10マイクロ秒から100マイクロ秒に)、高価なGPUコンピューティングリソースがアイドル状態になり、モデルトレーニングにかかる時間コストと消費電力が大幅に増加する可能性があります。したがって、400Gスイッチの導入は単なるポートアップグレードではなく、コンピューティングパワーの線形拡張性をサポートできる高性能ネットワーク基盤を構築するための取り組みです。

400Gイーサネットにおける主要な技術的飛躍
400G イーサネット規格 (IEEE 802.3bs) の実装により、いくつかの革新的な技術が導入され、物理層の伝送効率が飛躍的に向上しました。
PAM4変調技術の導入: 限られた帯域幅内でより多くのデータを伝送するために、400G規格では従来のNRZ(非ゼロ復帰)符号化方式を廃止し、PAM4(4値パルス振幅変調)を採用しました。PAM4はクロックサイクルごとに2ビット(4値)を伝送するため、NRZと比較して効率が2倍になります。しかし、PAM4は信号対雑音比(SNR)の要件がより厳しく、物理層(PHY)設計の複雑化とDSP(デジタル信号処理)チップへの依存につながります。
FEC(前方誤り訂正)の必要性: PAM4信号は干渉の影響を受けやすいため、ビットエラー率(BER)が大幅に上昇します。そのため、400GリンクではFEC機能(RS-FEC 544,514など)を必須で有効にする必要があります。FECは伝送の信頼性を確保しますが、処理遅延(通常100ns~250ns)を増加させます。これは、超低遅延を追求するAIネットワークにとって考慮すべき要素となります。
光モジュール形態の進化: QSFP-DD(Double Density)とOSFP(Octal Small Form-factor Pluggable)は、400G時代の主流パッケージ規格となっています。QSFP-DDはQSFP28との下位互換性により、一般的なデータセンターで主流となっています。一方、OSFPは優れた放熱性能(最大15W~20W以上の消費電力をサポート)により、高性能コンピューティングや将来の800Gへの進化において好まれています。
エネルギー効率と密度の経済分析
ハイパースケールデータセンターでは、電力効率が重要な考慮事項です。400Gスイッチは、100Gアーキテクチャと比較して大幅な経済的なメリットをもたらします。業界データ分析によると、400Gネットワークアーキテクチャは、同等の帯域幅を持つ100Gネットワークと比較して、1Gbpsあたりの消費電力を約43%(約1.2W/Gbから約0.7W/Gbに)削減し、ラックスペース使用量を48%削減できます。
表2.1: エネルギー効率と密度の経済比較: 400G vs. 100Gアーキテクチャ
| 主要な指標 | 100G ネットワーク アーキテクチャ (ベースライン) | 400Gネットワークアーキテクチャ | 改善/利点 |
| ポート帯域幅 | 100 Gbps | 400 Gbps | 4倍の増加 |
| Gbpsあたりの電力 | 約35mW / 1.2W(システムレベル) | 約20mW / 0.7W(システムレベル) | 約43%のエネルギー節約 |
| ラックスペース(Tbpsあたり) | 2.5 RU | 1.3 RU | 48%の節約 |
| ケーブル数(等帯域幅) | 100% (ベースライン) | 25の% - 50% | 50%~75%の削減、簡素化されたオペレーション |
| スイッチチップ容量 | 3.2 Tbps – 6.4 Tbps | 12.8 Tbps – 25.6 Tbps | 4倍~8倍の増加、ネットワーク層の平坦化 |
| TCO(3年間) | ベースライン($X) | 0.65X | 35%削減 |
このエネルギー効率の向上は、主にスイッチチッププロセスの進歩(16nm/12nmから7nm/5nmへの移行)とSerDesレートの向上(25G SerDesから56G/112G SerDesへ)によるものです。これにより、データセンターは物理的な設置面積を増やすことなく、AIコンピューティングによってもたらされる帯域幅需要の急激な増加に対応できるようになります。
コアチップ(ASIC)アーキテクチャとテクノロジースクールの詳細
スイッチチップ(ASIC)は、400Gスイッチのパフォーマンス上限を決定する心臓部です。現在の市場は、以下の3つの側面に分かれています。 ブロードコム 膨大な出荷量と標準化されたエコシステムにより商業市場を支配しています。 NVIDIA 深い HPC のバックグラウンドを活用したエンドツーエンドの最適化に重点を置いています。 Cisco 統合アーキテクチャを通じて、ルーティングとスイッチングの境界を打ち破ろうとしています。さらに、Marvellのようなベンダーは特定のニッチ市場で競争力を維持しています。
Broadcom Tomahawkシリーズ:スループットとエコシステムの王者
Broadcom の StrataXGS Tomahawk シリーズは、世界的な商用データ センター スイッチ市場における「事実上の標準」です。
トマホーク4(TH4): 業界初の広く採用されている25.6TbpsチップであるTH4は、7nmプロセスを採用し、1つのチップで64 x 400Gポートをサポートします。そのアーキテクチャは、極めて高いスループットと電力効率を重視しており、 スライスメモリアーキテクチャこのアーキテクチャは、極端に不均一なトラフィック (インキャスト) を処理する際に課題に直面する可能性がありますが、その成熟度とコスト上の利点により、スパイン/リーフ ネットワークを構築するハイパースケーラーにとって最適な選択肢となっています。
トマホーク5(TH5): 5nmプロセスを採用することで、帯域幅は倍増し51.2Tbpsとなります。TH5は単なる帯域幅のアップグレードではなく、ハードウェアベースのダイナミックロードバランシング(DLB)やよりきめ細かなテレメトリなど、AIワークロード向けの拡張機能を導入しています。1つのTH5チップで64 x 800Gポートまたは128 x 400Gポートをサポートし、ネットワークトポロジを大幅に簡素化し、ホップ数を削減します。
トマホーク ウルトラ: AIスケールアップネットワーク向けに新しいアーキテクチャが発表されました。ブランド名はTomahawkシリーズを継承していますが、カーネルはリファクタリングされています。Broadcomは、リンク層再送信(LLR)とクレジットベースフロー制御(CBFC)を実現し、レイテンシを250nsレベルにまで低減することで、InfiniBandのロスレス特性をイーサネット上で再現することを目指しており、主にNVIDIAのSpectrum-Xソリューションをターゲットとしています。
NVIDIA Spectrum Platform: AIのために生まれたエンドツーエンドのアーキテクチャ
NVIDIA (旧 Mellanox) の Spectrum シリーズ スイッチ チップは、最初から「データのスイッチ」だけでなく「コンピューティングの高速化」を目的として設計されました。
完全共有バッファ: Broadcomのスライスアーキテクチャとは異なり、Spectrumシリーズ(Spectrum-3およびSpectrum-4など)は動的共有バッファアーキテクチャを採用しています。これは、すべてのポートが同じオンチップメモリを共有することを意味します。ポートが輻輳(マイクロバーストなど)に遭遇した場合、チップ全体のアイドル状態のキャッシュリソースを動的に活用できます。この設計により、パケットロスの可能性が大幅に低減され、AIトレーニングで一般的に見られる「Many-to-One」トラフィックパターンにおいて、より決定論的なパフォーマンスを実現します。
スペクトラム4: TSMC 4Nプロセスを採用し、51.2Tbpsの帯域幅を提供します。高帯域幅に加え、最も注目すべき機能は、ナノ秒レベルのクロック同期精度(5~6桁向上)と「What Just Happened(WJH)」テレメトリです。WJHは、単純な集計統計情報ではなく、詳細な障害コンテキスト(具体的なドロップ理由、影響を受けたフロー特性など)をキャプチャしてストリーミングします。これは、複雑な分散AIトレーニングの障害トラブルシューティングに不可欠です。
Cisco Silicon One: 統合アーキテクチャへの野望
Cisco の Silicon One アーキテクチャは、従来のネットワークにおける「ルーティング チップ」(深いバッファ、低帯域幅、複雑な機能) と「スイッチング チップ」(浅いバッファ、高帯域幅、シンプルな機能) の二分対立を打破することを目的としています。
Q100/G100 アーキテクチャ: G100は、7nmプロセスをベースに25.6Tbpsの帯域幅を提供する、Webスケールスイッチング市場向けのシスコのフラッグシップチップです。その中核となるイノベーションは、「Run-to-Completion」処理パイプラインと統合オンチップ共有キャッシュにあります。シスコによると、G100は業界初となる高帯域幅スイッチチップ上で完全共有パケットバッファリングを実現した製品であり、P4プログラマビリティも備えているため、高性能ToRスイッチとしても、複雑なルーティング機能を必要とするスパインノードとしても最適です。
マルチロール機能: Silicon One は、マイクロコード構成を介して「ルーティング モード」と「スイッチング モード」を切り替えることができるため、お客様は単一のハードウェア アーキテクチャで DCI エッジからデータ センター コアまでのすべてのシナリオをカバーでき、スペア部品の管理と運用の複雑さが大幅に簡素化されます。
表3.1: 主流の400G/800Gスイッチチップアーキテクチャの比較
| 機能/メトリック | ブロードコム トマホーク 4 | NVIDIA スペクトラム-3 | NVIDIA スペクトラム-4 | シスコ シリコン ワン G100 | ブロードコム トマホーク 5 |
| プロセス | 7nm | 16nm | 4N(TSMC) | 7nm | 5nm |
| 最大容量 | 25.6Tbps | 12.8Tbps | 51.2Tbps | 25.6Tbps | 51.2Tbps |
| 400G密度 | 64ポート | 32ポート | 128ポート | 64ポート | 128ポート |
| バッファーアーチ | 分散/スライス | 完全に共有 | 完全に共有 | 完全に共有 | 分散/スライス |
| AI/HPC オプション | 基本的なRoCE | RoCE Opt.、WJH | Spectrum-X、ナノクロック | P4 プログラム、アドバンスフローコントロール | コグニティブルーティング、DLB |
| 典型的。レイテンシ | 約500ナノ秒 | <400ns | 約500ナノ秒 | 約600ナノ秒 | 約500ナノ秒 |
| シナリオ | クラウドスパイン/リーフ | HPC、AIストレージ、金融 | 大規模AIクラスター、スーパーコンピューティング | クラウドルーティング、統合アーキテクチャ | 次世代 AI クラスター、800G バックボーン |

AI時代のネットワークアーキテクチャの変革:ベストエフォートからゼロパケットロスへ
400Gスイッチの普及は、単なるハードウェアのアップグレードではなく、ネットワークプロトコルスタックとトポロジの再構築です。その核となる目標は、イーサネット上でInfiniBandレベルのパフォーマンスを実現することです。 「ロスレスネットワーク」
RoCEv2と輻輳制御アルゴリズムのゲーム
RoCEv2(RDMA over Converged Ethernet バージョン2)では、アプリケーションがCPUカーネルをバイパスしてリモートメモリに直接アクセスできるため、レイテンシとCPU使用率を極めて低く抑えることができます。ただし、RoCEv2は基盤となるネットワークにおけるロスレス伝送に依存しています。パケットロスが発生すると、RDMAの再送メカニズム(Go-back-N)によってスループットが大幅に低下します。
従来のPFC(優先度ベースフロー制御)は、粗雑な「ポーズフレーム」によってパケットロスを防いでいますが、これは「ヘッドオブラインブロッキング」や「輻輳拡散」を容易に引き起こし、デッドロックにつながる可能性があります。そのため、ECN(明示的輻輳通知)に基づくインテリジェントな輻輳制御アルゴリズムが、主要ベンダー間の競争の焦点となっています。

4.1.1 DCQCN(データセンター量子化輻輳通知) 現在最も基本的なRoCEv2輻輳制御アルゴリズムです。ECNとPFCを組み合わせたもので、スイッチがしきい値を超えるキューを検出すると、ECNでマークします。受信側NICは受信時にCNP(輻輳通知パケット)を送信側に送信し、送信側はレートを低下させます。 制限: 従来のDCQCNパラメータ(Kmin、Kmax、Pmax)は静的に設定されます。トラフィックの変動が激しいAIトレーニングシナリオでは、静的なしきい値では反応が遅すぎる(パケットロスが発生する)か、過剰に反応する(スループットの低下が発生する)可能性があります。
4.1.2 Huawei iLossless(インテリジェントロスレス): Huawei は CloudEngine シリーズ スイッチに AI チップを導入し、iLossless アルゴリズムによる動的な ECN しきい値調整を実装しました。 メカニズム: スイッチはトラフィックモデルをリアルタイムで学習し(大小のフロー、インキャスト度を識別)、ECNトリガーウォーターラインを動的に調整します。Huawei社によると、このアルゴリズムによりパケットロスをゼロに抑えながら、スループットを100%に向上させ、ロングテールレイテンシを大幅に削減できるとのことです。
4.1.3 Ruijie RALB(レール対応アダプティブロードバランシング)とNFIM: Ruijie は、AI クラスターのマルチレール特性に特化した RALB テクノロジーを開発しました。 メカニズム: 従来のECMP(等コストマルチパスルーティング)はハッシュ選択に依存しており、ハッシュ衝突(一部のリンクが輻輳し、他のリンクがアイドル状態になる)が発生します。RALBはリアルタイムのリンク品質(輻輳レベル)を検知し、動的負荷分散を実行します。 パケットごと パケットを最もアイドル状態のリンクに分散することで、帯域幅利用率を97.6%以上に向上させます。NFIM(ナノ秒フローインテリジェント制御モジュール)と組み合わせることで、輻輳が発生する前に予測的なスケジューリングを実行できます。
4.1.4 H3C SeerNetwork & DDC アーキテクチャ: H3C は、輻輳を徹底的に解決するために、DDC (Distributed Disaggregated Chassis) に基づくソリューションを開始しました。 メカニズム: DDCアーキテクチャは、シャーシスイッチのラインカードとファブリックを物理的に分離し、光ファイバーを介して相互接続します。データ転送時には、 スプレーリンク パケットをスライスしてすべてのアップリンクに均等に散布するテクノロジにより、ハッシュ衝突が物理的に排除され、理論上 100% の非ブロッキング パフォーマンスが実現されます。
ネットワークトポロジー: Clos vs. Multi-Rail
伝統的なクロス(スパインリーフ): 一般的なコンピューティングに適しています。サーバーは単一のNICを介して接続され、トラフィックはSpineレイヤーに集約されます。
AIマルチレール: 最新のAIサーバー(例:NVIDIA HGX H100)は、通常8基のGPUと8基のNICを搭載しています。マルチレールアーキテクチャでは、8つの独立した物理ネットワークプレーン(レール)が構築されます。各サーバーのGPU 0はレール0ネットワークに接続し、GPU 1はレール1に接続します。この設計により、GPU間通信(特にAll-Reduce)は、ToRスイッチを1階層のみ通過することで、同一レール内で完全に完了するため、レイテンシと衝突確率が大幅に低減されます。このアーキテクチャでは、通常、400Gスイッチが高密度リーフノードとして機能します。

世界の主流400Gスイッチベンダーの競争力分析
NVIDIA (Mellanox): AI ネットワークの定義者
主な製品: SN4000(スペクトラム-3)、SN5600(スペクトラム-4)。
市場での位置付け: AI バックエンド ネットワーク市場 (InfiniBand と Ethernet の組み合わせ) における絶対的な優位性。
競争上の優位性:
- フルスタックエコシステム: GPU + DPU + NIC + スイッチ + NOS (Cumulus/SONiC) + 管理ソフトウェア (UFM/NetQ) を提供する唯一のベンダー。
- スペクトラムX: BlueField-3 DPU を「スーパー NIC」として活用し、Spectrum-4 スイッチと組み合わせて、正確な RTT (ラウンドトリップ時間) 測定と直接メモリ アクセスを通じて、標準イーサネットをはるかに超えるパフォーマンスを実現します。
- テレメトリー: WJH (What Just Happened) は、チップレベルの障害可視性を提供し、大規模な AI クラスターを運用するための「天の恵み」となります。
- 短所: 比較的高価で、エコシステムは比較的閉鎖的です (ただし、イーサネットに基づいているため、最適なパフォーマンスはフルスタックに関連付けられています)。
アリスタネットワークス:クラウド大手企業にとっての最良の選択肢
主な製品: 7060X5 (TH5 リーフ)、7800R3 (ジェリコ 2 スパイン/DCI)。
市場での位置付け: フロントエンド ネットワークとハイパースケーラーで非常に高いシェアを持ち、AI バックエンド ネットワークにも積極的に参入しています。
競争上の優位性:
- EOS オペレーティング システム: 業界で最も安定性とオープン性を備えたネットワークOSとして認められています。単一のイメージであらゆるハードウェアに対応し、運用の複雑さを大幅に軽減します。
- ディープバッファアーキテクチャ: 7800R シリーズは、GB レベルの VOQ (仮想出力キュー) キャッシュを備えた Broadcom DNX ベースのディープ バッファ チップを使用しており、データ センター相互接続 (DCI) やトラフィックが極めて不均一なシナリオに最適です。
- DLB と Etherlink: 7700R4 シリーズでは、Arista は大規模クラスタの相互接続効率を最適化するために分散 Etherlink テクノロジーを導入しました。
シスコシステムズ:巨人の変革
主な製品: Nexus 9300-GX2 (リーフ)、Nexus 9800 (モジュラー スパイン)。
競争上の優位性:
自社製シリコンワンチップ: Broadcomへの依存から解放され、アーキテクチャの差別化とコスト管理を実現。G100/G200チップは、高い帯域幅とプログラマビリティにより、高い柔軟性を提供します。
光学と電子の相乗効果: シスコはアカシアの買収により光モジュール技術の蓄積を深め、400G/800G時代の光リンクの安定性に非常に価値のある検証済みの「スイッチ + 光モジュール」統合ソリューションを提供しています。
広範なエンタープライズ顧客ベース: 従来のエンタープライズ ネットワークから AI に移行するクライアントにスムーズな移行パス (ACI アーキテクチャまたは NX-OS モード) を提供します。
Huawei:技術力の統合者
主な製品: CloudEngine 16800 シリーズ (モジュラー)、CE8800/9800 (固定)。
競争上の優位性:
- iLossless AIアルゴリズム: AIコンピューティング能力をスイッチ制御プレーンに導入し、フロー制御パラメータを動的に最適化することが、ロスレスイーサネット分野におけるHuaweiの核心です。
- ハードウェアエンジニアリング: CE16800 は、直交バックプレーン設計、効率的な放熱、高度な電源技術を採用し、優れたシステムエネルギー効率で非常に高密度の 400G/800G ポート展開をサポートします。
- 自律性: 自社製の Solar シリーズ チップと完全なソフトウェア/ハードウェア スタックを備えており、高いサプライ チェーン セキュリティを保証します (特定の市場向け)。
H3C & Ruijie: コストパフォーマンスとシナリオカスタマイズ
H3C: SeerNetworkアーキテクチャを採用し、インテリジェントな運用を重視しています。S9825シリーズスイッチは、密度と電力のバランスに優れたパフォーマンスを発揮します。H3CはCPO技術にも積極的に取り組んでおり、低消費電力シリコンフォトニクスのパッケージング済みプロトタイプを展示しています。
ルイジエ: 大手インターネット企業(ByteDance、Alibabaなど)との深いパートナーシップにより、卓越した俊敏性を実現しています。RG-S6900シリーズは「インテリジェントスピード」DCNに注力し、RALBと「ワンキーRoCE」機能により、大規模ネットワークの導入とチューニングにおける課題を解決します。Ruijieは、ホワイトボックスおよびカスタマイズされたODCC仕様製品で迅速に対応します。
市場データと経済分析
市場規模と成長傾向
IDC と Dell'Oro Group の最新の追跡データによると、世界のイーサネット スイッチ市場は 2024 年も堅調な成長を維持しました。
- 全体のサイズ: 2024年第3四半期には、データセンタースイッチ市場の収益が前年比で30%以上増加し、その大部分はAI関連のバックエンドネットワークによるものでした。
- 港湾輸送: 400Gポートは絶対的な主流となり、データセンター全体の帯域幅容量の半分を占めています。800Gポートのベースは小さいものの、四半期ごとの連続成長率は100%に近づいており、AIクラスターへの導入は2025年までに400Gを超えると予想されています。
- ベンダーシェア: Ciscoは市場全体の売上高では依然として首位を維持しているものの、シェアの縮小に直面しています。Aristaはデータセンター分野(特に100G/400G)で僅差で追随しています。NVIDIAは最も急速な成長を示し、InfiniBandおよびSpectrum Ethernetソリューションによって特定のAIニッチ市場を席巻しています。中国市場では、Huawei、H3C、Ruijieがトップ3の座を堅持しています。

コストと電力の傾向
ビットあたりのコスト: 400G 光モジュールのサプライ チェーンが成熟するにつれ、1 つの 400G ポートのコストは 4 つの 100G ポートの合計よりも大幅に低くなり、光ファイバー ケーブルのコストが節約され、メンテナンスの複雑さが軽減されます。
電力に関する課題: 400GではGbpsあたりのエネルギー効率が向上しているにもかかわらず、スイッチ単体の総消費電力は急増しています。2Uスイッチに64個の400Gポートをフル装備した場合、通常1500W~2000W(光モジュールを含む)を消費します。これは、キャビネットの電源供給と放熱に深刻な課題をもたらし、液冷スイッチの研究開発を促進しています。
表6.1: 主流の400Gスイッチの消費電力推定値(一般的な全負荷時)
| ベンダー | モデル | ポート設定 | 標準的なシステム電力(光学系を含む推定値) | 熱設計 |
| H3C | S9825-64D | 64x 400G | 約1850W(最大)/約613W(標準空) | フロントリアエアフロー、ホットスワップファン |
| ルイジエ | RG-S6980-64QC | 64x 400G | 約2400W(最大)/約1760W(標準) | 4+1冗長ファン、スマートスピード |
| NVIDIA | SN5600 | 64x 800G/400G | 約670W(システムのみ、光学系なし) | 高効率エアフロー、AOC/DACに最適 |
| Huawei社 | CE16800 | モジュラー(48x 400G/カード) | 約 800W+/カード (構成に依存) | 直交アーチ、混合液体冷却 |
将来展望:800G、UEC、光エレクトロニクスの統合
800Gおよび1.6Tへの進化
NVIDIA Blackwell GPU と次世代 AI アクセラレータのリリースにより、シングル カードの帯域幅の需要は 800Gbps 以上に急増します。
- 800G時代: 2025年は800Gイーサネットの飛躍の年となるでしょう。Tomahawk 5とSpectrum-4をベースとしたスイッチが、AIクラスターのコアレイヤー(Spine)に大規模に導入されるでしょう。
- 1.6Tの見通し: 2026 ~ 2027 年までに、Tomahawk 6 (102.4T) などの次世代チップが商用化され、1.6T インターフェイスがハイパースケール クラスターに導入され始めると予想されます。
UEC(ウルトライーサネットコンソーシアム)の台頭
InfiniBand の独占を打ち破り、AI シナリオにおける従来のイーサネットの問題点を解決するために、AMD、Arista、Broadcom、Cisco、Meta、Microsoft などの大手企業が共同で UEC を設立しました。
目標: 次世代の「AIネイティブ」イーサネットトランスポート層プロトコルを定義し、マルチパスパケットスプレー、柔軟な再送メカニズム、より効率的な輻輳制御を導入することでRoCEv2を改良します。将来の400G/800GスイッチはUEC規格を普遍的にサポートし、イーサネットの「ロス」リスクを徹底的に排除します。
CPO(Co-Packaged Optics)とLPO(Linear Drive Pluggable Optics)の比較
電気的相互接続の物理的制限 (SerDes 距離制約) を打ち破り、消費電力を削減するには、光電子統合が最終的な方向性です。
CPO: 光エンジンをスイッチチップ基板上に直接カプセル化します。エネルギー効率は優れていますが、メンテナンスの難しさ(光モジュールはホットスワップ不可)のため、現在は特定の超高密度シナリオ(例:51.2T以上)にのみ暫定的に適用されており、普及には時間がかかります。
LPO: CPOへの移行ソリューションとして、LPOは光モジュールからDSPチップを取り除き、スイッチASICの強力なSerDesを用いて光コンポーネントを直接駆動します。これにより、プラガブルな特性を維持しながら消費電力とレイテンシを大幅に削減できるため、現在の400G/800G市場における注目の技術トレンドとなっています。

結論
400Gイーサネットスイッチ市場は、技術革新とスケールアプリケーションの黄金の交差点にあります。AIは帯域幅を消費するだけでなく、ネットワークアーキテクチャの再構築を促進する触媒でもあります。
- 技術的側面: 「ロスレス」、「低レイテンシ」、「可視性」は、スイッチのパフォーマンスを測定するための新たな3次元基準となっています。共有バッファアーキテクチャ、インテリジェントな輻輳制御アルゴリズム(iLossless、RALBなど)、そしてハードウェアレベルのテレメトリ機能は、ハイエンドAIスイッチと汎用スイッチを区別する鍵となります。
- 市場の側面: NVIDIA は AI フルスタック ソリューションでリードしていますが、Arista、Cisco、中国のベンダー (Huawei、H3C、Ruijie) がオープン エコシステム、コスト パフォーマンス、差別化されたソフトウェア機能を備えた強力なイーサネット陣営を構築しており、InfiniBand の市場スペースを徐々に侵食しています。
400Gスイッチを選択する企業や機関は、ポート密度や価格だけでなく、RoCEv2環境における実際のパフォーマンス、輻輳制御アルゴリズムの成熟度、既存のAIコンピューティングプラットフォームとの互換性を深く評価する必要があります。UEC規格の進歩と800Gの登場により、よりオープンで効率的、そしてインテリジェントなイーサネットエコシステムの形成が加速しています。
関連製品:
-
NVIDIA MSN4700-WS2FC Spectrum-3 ベース 400GbE 1U オープン イーサネット スイッチ、Cumulus Linux、32 QSFP-DD ポート、2 つの AC 電源、x86 CPU、標準奥行き、P2C エアフロー、レール キット
$28900.00
-
NVIDIA SN5400 Spectrum-4 ベース 400GbE 2U オープン イーサネット スイッチ (Cumulus Linux 認証、64 QSFP56-DD ポート、2xSFP28 ポート、2 つの AC 電源、x86 CPU、セキュア ブート、標準奥行き、C2P エアフロー、ツールレス レール キット搭載)
$39000.00
-
NVIDIA MQM9790-NS2F Quantum-2 NDR InfiniBand スイッチ、64 x 400Gb/s ポート、32 OSFP ケージ、アンマネージド、P2C エアフロー (順方向)
$24000.00
-
NVIDIA MQM9700-NS2R Quantum-2 NDR InfiniBand スイッチ、64 ポート NDR 400Gb/s、32 OSFP ポート、マネージド、P2C エアフロー (リバース)
$34000.00
-
NVIDIA MQM9700-NS2F Quantum-2 NDR InfiniBand スイッチ、64 x 400Gb/s ポート、32 OSFP ポート、マネージド、P2C エアフロー (順方向)
$30000.00
-
NVIDIA MQM9790-NS2R Quantum-2 NDR InfiniBand スイッチ、64 ポート NDR 400Gb/s、32 OSFP ポート、アンマネージド、P2C エアフロー (リバース)
$24000.00
