¿Qué es el Consorcio Ultra Ethernet (UEC)?

El Consorcio Ultra Ethernet (UEC) fue offEstablecida oficialmente el 19 de julio de 2023. Es una nueva organización patrocinada por la Fundación Linux y su Fundación de Desarrollo Conjunto. UEC tiene como objetivo ir más allá de las capacidades de Ethernet existentes, como el acceso remoto directo a la memoria (RDMA) y RDMA sobre Ethernet convergente (RoCE), para proporcionar una capa de transporte de alto rendimiento, distribuida y sin pérdidas, optimizada para la informática de alto rendimiento y la inteligencia artificial. Apunta directamente al protocolo de transmisión InfiniBand de su rival.

Consorcio Ultra Ethernet

Consorcio Ultra Ethernet

Los miembros fundadores de UEC incluyen AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta y Microsoft, todos con décadas de experiencia en la implementación a gran escala de redes, inteligencia artificial, nube y computación de alto rendimiento.

Miembros fundadores

Miembros fundadores

¿Por qué Ethernet necesita UEC?

¿En qué se diferencia UEC de la Ethernet actual?

La inteligencia artificial y la computación de alto rendimiento plantean nuevos desafíos a las redes, como la necesidad de mayor escala, mayor densidad de ancho de banda, múltiples rutas, respuesta rápida a la congestión e interdependencia en la ejecución de flujos de datos individuales (donde la latencia de cola es un punto clave para considerar). La especificación UEC está diseñada para cerrar estas brechas y proporcionar las redes de mayor escala necesarias para estas cargas de trabajo. UEC apunta a una pila de comunicaciones completa que resuelve problemas técnicos en múltiples capas de protocolo y proporciona una funcionalidad fácil de configurar y administrar.

¿En qué se diferencia UEC de otros protocolos actuales?

Los protocolos existentes pueden abordar algunos aspectos de los problemas anteriores (como la gestión de congestión heredada), pero dado que están diseñados para redes generales, carecen de características críticas para la inteligencia artificial y la computación de alto rendimiento, como rutas múltiples y configuración sencilla. Los protocolos existentes también pueden ser vulnerables en escenarios relevantes. Con la rica experiencia de los miembros de UEC en la implementación de inteligencia artificial y en cargas de trabajo informáticas de alto rendimiento, UEC ofrecerá una solución integral y convincente que ofrece nuevos productos de hardware y software que no están disponibles con Ethernet ni con ninguna otra tecnología de red en la actualidad.

¿Qué planea hacer la UEC?

UEC proporcionará una arquitectura de pila de comunicaciones completa, abierta, interoperable y de alto rendimiento basada en Ethernet para satisfacer las crecientes necesidades de red de inteligencia artificial a gran escala y computación de alto rendimiento. Desde la capa física hasta la capa de software, UEC planea realizar cambios en múltiples capas de la pila Ethernet. “No se trata de revolucionar Ethernet”, afirmó el Dr. J. Metz, presidente de la UEC. “Se trata de ajustar Ethernet para hacerla más eficiente para cargas de trabajo con requisitos de rendimiento específicos. Estamos analizando cada capa, desde la física hasta el software, para encontrar las mejores formas de mejorar la eficiencia y el rendimiento a escala”. Metz señaló que hoy en día no faltan estándares de red y organizaciones para Ethernet, y si bien el IEEE ha asumido un papel importante, la UEC se centra en algo más que la capa de transporte físico en la que normalmente se centra el IEEE. El objetivo de la UEC es estudiar todos los elementos necesarios para mejorar Ethernet y luego trabajar con organizaciones de estandarización y grupos técnicos relevantes para implementar estas mejoras. El Consorcio trabajará para mantener y promover la interoperabilidad de Ethernet mientras minimiza los cambios en la pila de comunicaciones. El objetivo técnico de UEC es desarrollar especificaciones, API y código fuente para definir:

  • Protocolos, características de señales eléctricas y ópticas, interfaces de programas de aplicación/estructuras de datos para comunicaciones Ethernet.
  • Protocolos de transporte de red de nivel de enlace y de extremo a extremo que amplían o reemplazan los protocolos de enlace y transporte existentes.
  • Los mecanismos de señalización, telemetría y congestión a nivel de enlace y de extremo a extremo son todos adecuados para inteligencia artificial, aprendizaje automático y entornos informáticos de alto rendimiento.
  • Arquitectura de software, almacenamiento, administración y seguridad para admitir una variedad de cargas de trabajo y entornos operativos.

Transmisión RDMA frente a UEC

Para mejorar Ethernet, la UEC propuso el protocolo de transmisión UEC. Metz dijo que el transporte UEC se está desarrollando para proporcionar un mejor transporte Ethernet que el actual. RDMA (que todavía admite RDMA), conservando las ventajas de Ethernet/IP y al mismo tiempo ofreciendo el rendimiento necesario para las aplicaciones de IA y HPC. El transporte UEC es una nueva forma cercana a la capa de transporte con algún protocolo de notificación de congestión y ajuste semántico y características de seguridad mejoradas. UEC proporcionará un transporte más flexible que no requiere redes sin pérdidas, lo que permitirá funciones como el transporte de paquetes desordenados y de múltiples rutas necesarios para cargas de trabajo de IA de muchos a muchos. Protocolo de transmisión UEC:

  • Una especificación de protocolo abierto diseñada desde cero para ejecutarse en IP y Ethernet
  • Con transmisión por ruta múltiple y pulverización de paquetes, que utiliza plenamente la red de IA sin causar congestión ni bloqueo de cabecera, sin la necesidad de algoritmos de equilibrio de carga centralizados ni controladores de enrutamiento.
  • Mecanismo de gestión de incast para controlar la entrada en abanico en el enlace final al host de destino con una pérdida mínima de paquetes.
  • El algoritmo de control de velocidad eficiente permite que la transmisión aumente rápidamente a la velocidad de la línea sin incurrir en la pérdida de rendimiento de las transmisiones competidoras.
  • API para entrega de paquetes desordenados con la opción de completar mensajes en orden, maximizando la simultaneidad de la red y las aplicaciones y minimizando la latencia de los mensajes.
  • Red futura escalable que admite 1,000,000 de puntos finales
  • Rendimiento y utilización óptima de la red sin necesidad de red, y ajuste de los parámetros del algoritmo de congestión específico de la carga de trabajo
  • Diseñado para permitir el rendimiento a velocidad de cable para 800G, 1.6T y futura Ethernet más rápida en hardware básico

El camino a seguir para la UEC

De cara al futuro, se espera que las cargas de trabajo y las necesidades de redes de la IA y la informática de alto rendimiento se superpongan cada vez más. Teniendo en cuenta las diferentes sensibilidades al ancho de banda y la latencia, la especificación UEC proporcionará dos perfiles: uno optimizado para IA y el otro optimizado para HPC.

Garantizar la interoperabilidad mediante pruebas de complementos y pruebas de cumplimiento será un objetivo futuro, afirmó Uri Elzur, presidente del Comité Asesor Técnico de la UEC. El objetivo de la UEC es garantizar su apertura e interoperabilidad. El borrador de la especificación UEC se publicará pronto y estará abierto para su uso.

Deja un comentario

Ir al Inicio