ウルトラ イーサネット コンソーシアム (UEC) とは何ですか?

ウルトラ イーサネット コンソーシアム (UEC) は、 off19 年 2023 月 XNUMX 日に正式に設立されました。これは、Linux Foundation とその Joint Development Foundation が後援する新しい組織です。 UEC は、リモート ダイレクト メモリ アクセス (RDMA) や RDMA over Converged Ethernet (RoCE) などの既存のイーサネット機能を超えて、ハイ パフォーマンス コンピューティングと人工知能向けに最適化された高性能の分散型ロスレス トランスポート層を提供することを目指しています。 ライバルの伝送プロトコルInfiniBandを直接狙っている。

ウルトライーサネットコンソーシアム

ウルトライーサネットコンソーシアム

UEC の設立メンバーには、AMD、Arista、Broadcom、Cisco、Eviden、HPE、Intel、Meta、Microsoft が含まれており、いずれもネットワーキング、人工知能、クラウド、ハイパフォーマンス コンピューティングの大規模導入において数十年の経験を持っています。

設立メンバー

設立メンバー

イーサネットに UEC が必要なのはなぜですか?

UECは現在のイーサネットとどう違うのですか?

人工知能とハイパフォーマンス コンピューティングは、ネットワークに新たな課題をもたらします。たとえば、大規模化、より高い帯域幅密度、マルチパス、輻輳への迅速な対応、個々のデータ フローの実行の相互依存性 (テール レイテンシーが重要なポイントです) などです。考慮する)。 UEC 仕様は、これらのギャップを埋め、これらのワークロードに必要な大規模なネットワークを提供するように設計されています。 UEC は、複数のプロトコル層にわたる技術的問題を解決し、構成と管理が簡単な機能を提供する完全な通信スタックをターゲットとしています。

UEC は他の現在のプロトコルとどう違うのですか?

既存のプロトコルは、上記の問題の一部の側面 (従来の輻輳管理など) に対処している可能性がありますが、一般的なネットワーク向けに設計されているため、マルチパスや簡単な構成など、人工知能やハイパフォーマンス コンピューティングに重要な機能が欠けています。 関連するシナリオでは、既存のプロトコルも脆弱になる可能性があります。 UEC メンバーの人工知能の導入とハイパフォーマンス コンピューティング ワークロードにおける豊富な経験を活かして、UEC は、今日のイーサネットやその他のネットワーク テクノロジでは利用できない新しいハードウェアおよびソフトウェア製品をもたらす、魅力的で包括的なソリューションを提供します。

電気通信大学は何をする予定ですか?

UEC は、大規模な人工知能と高性能コンピューティングの増大するネットワーク ニーズを満たすために、イーサネットをベースとしたオープンで相互運用可能な高性能の完全な通信スタック アーキテクチャを提供します。 UEC は、物理層からソフトウェア層に至るまで、イーサネット スタックの複数の層に変更を加える予定です。 「これはイーサネットに革命を起こすことではありません」とUEC会長のJ・メッツ博士は述べた。 「これは、特定のパフォーマンス要件を持つワークロードの効率を高めるためにイーサネットを調整することです。 私たちは、大規模な効率とパフォーマンスを向上させる最善の方法を見つけるために、物理層からソフトウェアまでのあらゆる層を検討しています。」 Metz 氏は、今日ではイーサネットのネットワーク標準と組織が不足しているわけではなく、IEEE が主要な役割を果たしている一方で、UEC は IEEE が通常重点を置く物理トランスポート層以上のものに重点を置いていると指摘しました。 UEC の目標は、イーサネットを改善するために必要なすべての要素を研究し、関連する標準化組織や技術グループと協力してこれらの改善を実装することです。 コンソーシアムは、通信スタックへの変更を最小限に抑えながら、イーサネットの相互運用性を維持および促進するよう努めます。 UEC の技術的な目標は、以下を定義する仕様、API、およびソース コードを開発することです。

  • イーサネット通信のプロトコル、電気信号および光信号特性、アプリケーション プログラム インターフェイス/データ構造。
  • 既存のリンクおよびトランスポート プロトコルを拡張または置き換える、リンク レベルおよびエンドツーエンドのネットワーク トランスポート プロトコル。
  • リンク レベルおよびエンドツーエンドの輻輳、テレメトリ、およびシグナリング メカニズムはすべて、人工知能、機械学習、およびハイ パフォーマンス コンピューティング環境に適しています。
  • さまざまなワークロードとオペレーティング環境をサポートするソフトウェア、ストレージ、管理、セキュリティ アーキテクチャ。

RDMA と UEC の伝送

イーサネットを改善するために、UEC は UEC 伝送プロトコルを提案しました。 Metz 氏は、UEC トランスポートは現在よりも優れたイーサネット トランスポートを提供するために開発されていると述べました。 RDMA (引き続き RDMA をサポートします)、AI および HPC アプリケーションに必要なパフォーマンスを提供しながら、イーサネット/IP の利点を維持します。 UEC トランスポートは、セマンティック調整、輻輳通知プロトコル、強化されたセキュリティ機能を備えた、トランスポート層に近い新しい形式です。 UEC は、ロスレス ネットワークを必要としない、より柔軟なトランスポートを提供し、多対多の AI ワークロードに必要なマルチパスやアウトオブオーダーのパケット トランスポートなどの機能を可能にします。 UEC伝送プロトコル:

  • IP およびイーサネット上で動作するようにゼロから設計されたオープン プロトコル仕様
  • マルチパス、パケット スプレー送信により、集中型の負荷分散アルゴリズムやルーティング コントローラーを必要とせず、輻輳やヘッドオブライン ブロッキングを引き起こすことなく AI ネットワークを最大限に活用します。
  • パケット損失を最小限に抑えながら、ターゲット ホストへの最終リンクでのファンインを制御するインキャスト管理メカニズム
  • 効率的なレート制御アルゴリズムにより、競合するストリームのパフォーマンス損失を招くことなく、伝送速度を迅速に回線速度まで高めることができます。
  • メッセージを順番に完了するオプションを備えたアウトオブオーダーパケット配信用の API。ネットワークとアプリケーションの同時実行性を最大化し、メッセージ遅延を最小限に抑えます。
  • 1,000,000 エンドポイントをサポートするスケーラブルな将来のネットワーク
  • ネットワークを必要としないパフォーマンスと最適なネットワーク利用率、および輻輳アルゴリズム パラメータのワークロード固有の調整
  • ワイヤレートのパフォーマンスを実現するように設計されています。 800G、1.6T および汎用ハードウェア上の将来の高速イーサネット

電気通信大学の今後の道のり

今後、AI とハイ パフォーマンス コンピューティングのワークロードとネットワーキングのニーズはますます重なり合うことが予想されます。 帯域幅と遅延に対するさまざまな感度を考慮して、UEC 仕様では XNUMX つのプロファイルが提供されます。XNUMX つは AI に最適化され、もう XNUMX つは HPC に最適化されます。

UEC技術諮問委員会の委員長であるウリ・エルズール氏は、プラグインテストとコンプライアンステストを通じて相互運用性を確保することが将来の焦点になると述べた。 UEC の目標は、オープン性と相互運用性を確保することです。 UEC のドラフト仕様は間もなくリリースされ、使用できるようになる予定です。

コメント

上へスクロール