Was ist das Ultra Ethernet Consortium (UEC)?

Das Ultra Ethernet Consortium (UEC) war offOffiziell gegründet am 19. Juli 2023. Es handelt sich um eine neue Organisation, die von der Linux Foundation und ihrer Joint Development Foundation gefördert wird. UEC zielt darauf ab, über bestehende Ethernet-Funktionen wie Remote Direct Memory Access (RDMA) und RDMA over Converged Ethernet (RoCE) hinauszugehen, um eine leistungsstarke, verteilte und verlustfreie Transportschicht bereitzustellen, die für Hochleistungsrechnen und künstliche Intelligenz optimiert ist. Es nimmt direkt das Übertragungsprotokoll seines Konkurrenten InfiniBand ins Visier.

Ultra-Ethernet-Konsortium

Ultra-Ethernet-Konsortium

Zu den Gründungsmitgliedern von UEC gehören AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta und Microsoft, alle mit jahrzehntelanger Erfahrung im groß angelegten Einsatz von Netzwerken, künstlicher Intelligenz, Cloud und Hochleistungsrechnen.

Gründungsmitglieder

Gründungsmitglieder

Warum braucht Ethernet UEC?

Wie unterscheidet sich UEC vom aktuellen Ethernet?

Künstliche Intelligenz und Hochleistungsrechnen bringen neue Herausforderungen für Netzwerke mit sich, wie z. B. die Notwendigkeit einer größeren Skalierung, einer höheren Bandbreitendichte, von Mehrpfaden, einer schnellen Reaktion auf Überlastungen und einer gegenseitigen Abhängigkeit von der Ausführung einzelner Datenflüsse (wobei die Endlatenz ein entscheidender Punkt ist). halten). Die UEC-Spezifikation soll diese Lücken schließen und eine umfassendere Vernetzung ermöglichen, die für diese Arbeitslasten erforderlich ist. UEC zielt auf einen vollständigen Kommunikationsstapel ab, der technische Probleme über mehrere Protokollschichten hinweg löst und Funktionen bereitstellt, die einfach zu konfigurieren und zu verwalten sind.

Wie unterscheidet sich UEC von anderen aktuellen Protokollen?

Bestehende Protokolle lösen möglicherweise einige Aspekte der oben genannten Probleme (z. B. das veraltete Überlastungsmanagement). Da sie jedoch für allgemeine Netzwerke konzipiert sind, fehlen ihnen Funktionen, die für künstliche Intelligenz und Hochleistungsrechnen von entscheidender Bedeutung sind, z. B. Mehrpfad und einfache Konfiguration. Bestehende Protokolle können in relevanten Szenarien ebenfalls anfällig sein. Mit der reichen Erfahrung der UEC-Mitglieder bei der Bereitstellung künstlicher Intelligenz und bei Hochleistungs-Computing-Workloads wird UEC eine überzeugende und umfassende Lösung liefern, die neue Hardware- und Softwareprodukte hervorbringt, die heute mit Ethernet oder keiner anderen Netzwerktechnologie nicht verfügbar sind.

Was plant UEC zu tun?

UEC wird eine offene, interoperable, leistungsstarke, vollständige Kommunikations-Stack-Architektur auf Basis von Ethernet bereitstellen, um den wachsenden Netzwerkanforderungen großer künstlicher Intelligenz und Hochleistungsrechnens gerecht zu werden. Von der physikalischen Schicht bis zur Softwareschicht plant UEC, Änderungen an mehreren Schichten des Ethernet-Stacks vorzunehmen. „Hier geht es nicht darum, Ethernet zu revolutionieren“, sagte UEC-Präsident Dr. J. Metz. „Es geht darum, Ethernet so zu optimieren, dass es für Workloads mit spezifischen Leistungsanforderungen effizienter wird. Wir betrachten jede Ebene von der physischen bis zur Softwareebene, um die besten Möglichkeiten zur Verbesserung von Effizienz und Leistung im großen Maßstab zu finden.“ Metz wies darauf hin, dass es heute keinen Mangel an Netzwerkstandards und -organisationen für Ethernet gebe, und während das IEEE eine wichtige Rolle übernommen habe, konzentriert sich das UEC auf mehr als die physische Transportschicht, auf die sich das IEEE normalerweise konzentriert. Das Ziel der UEC besteht darin, alle Elemente zu untersuchen, die zur Verbesserung von Ethernet erforderlich sind, und dann mit relevanten Standardisierungsorganisationen und technischen Gruppen zusammenzuarbeiten, um diese Verbesserungen umzusetzen. Das Konsortium wird daran arbeiten, die Ethernet-Interoperabilität aufrechtzuerhalten und zu fördern und gleichzeitig Änderungen am Kommunikationsstapel zu minimieren. Das technische Ziel von UEC besteht darin, Spezifikationen, APIs und Quellcode zu entwickeln, um Folgendes zu definieren:

  • Protokolle, elektrische und optische Signaleigenschaften, Anwendungsprogrammschnittstellen/Datenstrukturen für die Ethernet-Kommunikation.
  • Link-Level- und End-to-End-Netzwerktransportprotokolle, die bestehende Link- und Transportprotokolle erweitern oder ersetzen.
  • Verbindungsebene und End-to-End-Überlastungs-, Telemetrie- und Signalisierungsmechanismen eignen sich alle für künstliche Intelligenz, maschinelles Lernen und Hochleistungsrechnerumgebungen.
  • Software-, Speicher-, Verwaltungs- und Sicherheitsarchitektur zur Unterstützung einer Vielzahl von Arbeitslasten und Betriebsumgebungen.

RDMA vs. UEC-Übertragung

Um Ethernet zu verbessern, schlug die UEC das UEC-Übertragungsprotokoll vor. Laut Metz wird der UEC-Transport entwickelt, um einen besseren Ethernet-Transport als derzeit zu ermöglichen RDMA (das immer noch RDMA unterstützt), wobei die Vorteile von Ethernet/IP erhalten bleiben und gleichzeitig die für KI- und HPC-Anwendungen erforderliche Leistung bereitgestellt wird. Der UEC-Transport ist eine neue Form nahe der Transportschicht mit einigen semantischen Optimierungen und einem Überlastungsbenachrichtigungsprotokoll sowie erweiterten Sicherheitsfunktionen. UEC bietet einen flexibleren Transport, der keine verlustfreie Vernetzung erfordert, und ermöglicht Funktionen wie Multipath und Out-of-Order-Pakettransport, die für Many-to-Many-KI-Workloads erforderlich sind. UEC-Übertragungsprotokoll:

  • Eine offene Protokollspezifikation, die von Grund auf für die Ausführung auf IP und Ethernet entwickelt wurde
  • Mit Multipath-Paketspray-Übertragung wird das KI-Netzwerk vollständig genutzt, ohne dass es zu Überlastungen oder Head-of-Line-Blockierungen kommt, ohne dass zentralisierte Lastausgleichsalgorithmen und Routing-Controller erforderlich sind
  • Incast-Verwaltungsmechanismus zur Steuerung des Fan-Ins auf der endgültigen Verbindung zum Zielhost mit minimalem Paketverlust
  • Ein effizienter Ratensteuerungsalgorithmus ermöglicht eine schnelle Erhöhung der Übertragungsgeschwindigkeit auf Leitungsgeschwindigkeit, ohne dass es zu Leistungseinbußen bei konkurrierenden Streams kommt
  • API für die Zustellung von Paketen außerhalb der Reihenfolge mit der Option, Nachrichten der Reihe nach zu vervollständigen, wodurch die Netzwerk- und Anwendungsparallelität maximiert und die Nachrichtenlatenz minimiert wird
  • Skalierbares zukünftiges Netzwerk, das 1,000,000 Endpunkte unterstützt
  • Leistung und optimale Netzwerkauslastung ohne die Notwendigkeit einer netzwerk- und arbeitslastspezifischen Abstimmung der Parameter des Überlastungsalgorithmus
  • Entwickelt, um Wire-Rate-Leistung für zu ermöglichen 800G, 1.6T und zukünftiges schnelleres Ethernet auf Standardhardware

Der Weg in die Zukunft für UEC

Mit Blick auf die Zukunft wird erwartet, dass sich die Arbeitslasten und Netzwerkanforderungen von KI und Hochleistungsrechnen zunehmend überschneiden. Unter Berücksichtigung der unterschiedlichen Empfindlichkeiten gegenüber Bandbreite und Latenz wird die UEC-Spezifikation zwei Profile bereitstellen – eines für KI optimiert und das andere für HPC optimiert.

„Die Sicherstellung der Interoperabilität durch Plug-in-Tests und Compliance-Tests wird ein zukünftiger Schwerpunkt sein“, sagte Uri Elzur, Vorsitzender des UEC Technical Advisory Committee. Das Ziel von UEC besteht darin, seine Offenheit und Interoperabilität sicherzustellen. Der UEC-Spezifikationsentwurf wird in Kürze veröffentlicht und kann verwendet werden.

Hinterlasse einen Kommentar

Nach oben scrollen