Actualizaciones de los grupos de trabajo del Consorcio UItra Ethernet

Direcciones de investigación del consorcio UItra Ethernet

El Consorcio UItra Ethernet está comprometido a mejorar la tecnología Ethernet desde la capa física, la capa de enlace, la capa de transporte y la capa de software. Bajo la premisa de ser compatible con el ecosistema Ethernet actual, mejora el rendimiento de reenvío de Ethernet y se compromete a mejorar los protocolos de comunicación Ethernet y la interfaz del programa de aplicación. También mejora las capacidades de almacenamiento, gestión, estructura de seguridad y telemetría, de modo que la tecnología UItra Ethernet pueda satisfacer las necesidades de red de la inteligencia artificial y la informática de alto rendimiento.

El Consorcio Ultra Ethernet ha identificado el tipo de red en el que debe centrarse como Red Tipo2 (Red Back-End) y no se opone a su uso en Red Tipo1 (Red Front-End), pero no reducirá el rendimiento de la red Tipo2 porque necesita adaptarse al Tipo 1.

Redes tipo 1 y tipo 2

UEC determina métricas de rendimiento para cada tipo de red

Grupos de trabajo de la UEC

UEC inicialmente estableció cuatro grupos de trabajo, a saber, capa física, capa de enlace, capa de transporte y capa de software, que lograron resultados sobresalientes. Recientemente, se han establecido grupos de trabajo de almacenamiento, administración, compatibilidad y pruebas, rendimiento y depuración, que acaban de comenzar a trabajar. La siguiente figura muestra los grupos de trabajo de la UEC:

Los cuatro grupos de trabajo de la UEC

Grupo de trabajo de capa física

El grupo de trabajo de la capa física está comprometido a mejorar el rendimiento físico, reducir la latencia y mejorar la gestión de la infraestructura física de Ethernet. Incluye el desarrollo de especificaciones de la capa física de Ethernet, características de señales eléctricas y ópticas, interfaces de aplicaciones y estructuras de datos. Su objetivo es fortalecer la base y garantizar que Ethernet pueda cumplir con los rigurosos requisitos de Al y HPC. El grupo de trabajo de capa física actual está comprometido con la formulación de especificaciones PHY para 100G/Lane y 200G/Lane y ha determinado el tipo de medio 100G/Lane y la tasa y el tipo admitidos por PHY. Las especificaciones para 200G/carril se determinarán después de que se apruebe IEEE P802.3dji.

El grupo de trabajo de capa física ha introducido varios conceptos nuevos para la predicción de la calidad del enlace: UCR (proporción de palabras de código incorregibles), MTBPE (el tiempo medio entre errores PHY) y MTTFPA (el tiempo medio hasta la aceptación de paquetes falsos), dedicados a predecir y medir la calidad física del enlace. calidad del enlace de capa con mayor precisión.

El grupo de trabajo de la capa de enlace está comprometido a mejorar la confiabilidad y eficiencia de la transmisión de la capa de enlace y mejorar las capacidades de telemetría de la capa de enlace.

Las principales direcciones de investigación de la capa de enlace son:

Confiabilidad de la capa de enlace:

Agregue una subcapa LLR a la capa de enlace, ubicada entre las subcapas LLC y CONTROL MAC, para la retransmisión de paquetes de errores de un extremo a otro en la capa de enlace.

Control de flujo basado en crédito:

Admite un mecanismo de control de flujo basado en créditos de extremo a extremo en la capa de enlace para gestionar la transmisión sin pérdidas de tramas entre enlaces. El mecanismo CBFC (Control de flujo basado en crédito) se utiliza para reemplazar el control de flujo PFC. El receptor envía periódicamente espacio de búfer al par y el remitente envía mensajes según la prioridad del mensaje y el tamaño del búfer. El espacio de búfer también se puede utilizar para la selección de enrutamiento adaptativo.

Control de flujo basado en crédito

Control de flujo basado en crédito

Mejora de la tasa de paquetes:

Está comprometido con la compresión de los encabezados de los mensajes Ethernet para aumentar la eficiencia de la transmisión de tramas. Durante la evolución a largo plazo de Ethernet, los encabezados de los mensajes continuaron expandiéndose, lo que resultó en una eficiencia de transmisión relativamente baja. Muchos campos no se utilizan en las redes informáticas inteligentes. Por lo tanto, es imperativo comprimir los encabezados de los mensajes y mejorar la eficiencia de la transmisión de tramas.

Es necesario que haya una marca en el encabezado del mensaje para indicar si el mensaje está comprimido o descomprimido para que el mensaje comprimido y el mensaje sin comprimir coexistan en la red. El remitente puede elegir si desea comprimir el mensaje sin afectar la función original.

Actualmente, existen múltiples soluciones para la compresión de encabezados de mensajes, que están en discusión.

Negociación:

Establece un método de negociación para los parámetros y características de la capa de enlace. Varias capacidades nuevas en la capa de enlace, como LLR, CBFC y PRI, requieren negociación para respaldarlas. La idea principal es ampliar LLDP y agregar un UEC OUI para la negociación de nuevas capacidades de capa de enlace entre dispositivos.

Grupo de trabajo de la capa de transporte

El grupo de trabajo UET (capa de transporte UEC) está comprometido con la expansión de aplicaciones más desafiante, la transmisión confiable de mensajes, la transmisión segura de datos y evitar la congestión en la red. Su objetivo es resolver las deficiencias de la transmisión RoCE y proporcionar una transmisión a gran escala eficiente, confiable y segura. El punto final de transporte de destino llega a 256,000 100,000,000 y el número de procesos admitidos llega a XNUMX XNUMX XNUMX.

Los principales módulos de UET se muestran en la siguiente figura:

Módulos principales de la UET

UET contiene tres módulos: entrega de paquetes, seguridad y semántica. Las funciones de cada módulo son las siguientes:

  • Subcapa de entrega de paquetes (PDS):

PDS contiene dos módulos: confiabilidad y gestión de congestión.

El módulo de confiabilidad debe cubrir tres requisitos clave:

  1. Escalabilidad extrema
  2. Transmisión ordenada de mensajes
  3. Transmisión de mensajes desordenada

El módulo de confiabilidad está diseñado con cuatro modos de transmisión de mensajes y cada modo se utiliza para un propósito específico para cumplir con HPC, Al, ML y otros escenarios de aplicaciones. Los cuatro modos de transmisión de mensajes son:

Entrega confiable y ordenada (ROD):

Este modo transmite mensajes en orden y se utiliza para aplicaciones que requieren una transmisión ordenada de mensajes.

Entrega confiable y desordenada para operaciones (RUD):

Este modo solo puede transmitir mensajes a la capa semántica una vez, pero puede tolerar la entrega desordenada en la red. La capa de transporte confiable necesita detectar mensajes duplicados para garantizar que cada mensaje solo pueda transmitirse a la capa semántica una vez.

Entrega confiable y desordenada para operaciones idempotentes (RUDI):

Este modo está optimizado para operaciones de lectura y escritura de RDMA.

Entrega no confiable y desordenada (UUD):

Los mensajes no fiables pueden contener muchas semánticas nuevas de UET. Los usuarios de UDD no necesitan una transmisión confiable y utilizan otros métodos confiables.

El módulo de gestión de la congestión aún está en estudio, incluida la gestión de la congestión y el equilibrio de carga, y puede realizar la gestión de la congestión en función de cada FEP. El núcleo es el control de flujo basado en el crédito del receptor. El control de congestión define el tamaño de la ventana y la tasa de inyección. El objetivo es reducir la velocidad y limitar los mensajes para evitar la congestión en los nodos intermedios y los puntos finales. El equilibrio de carga de ruta define qué ruta elige un mensaje específico y se puede utilizar ECMP para seleccionar la ruta.

  • Seguridad del Transporte:

La seguridad del transporte es una prioridad máxima en el diseño de UET, con cifrado y autenticación opcionales de todas las cargas de datos y la mayoría de los encabezados de transmisión.

  • Semántica:

La capa semántica de UET proporciona operaciones de alto rendimiento y altamente escalables, lo que permite la implementación de IA especializada y HPC con todas las funciones.

La capa semántica es el puente entre el software del usuario y PDS (capa de entrega de mensajes). La capa semántica define una serie de
operaciones, como enviar, recibir, escribir, leer, etc. La capa proporciona clasificación opcional, incluidos varios iniciadores opcionales y capacidades de notificación de finalización de objetivos.

La capa semántica proporciona API de llamadas sin conexión y debe admitir de forma nativa *CCL, MPI, OpenSHMEM y otras API.

Grupo de trabajo de capa de software

La capa de software promueve la rápida adopción de UEC mediante el uso de la API libfabric como marco del plano de datos a través de la compatibilidad con varias bibliotecas de comunicación actualmente ampliamente adoptadas, como *CCL, MPI y SHMEM. Define la interacción entre varios aceleradores y FEP, incluidas las API de acelerador relacionadas. Define mecanismos de plano de control y plano de datos para conmutadores, FEP y administradores de agregación (AM) para permitir la interoperabilidad entre diferentes proveedores de UEC. Aborda la necesidad de que UEC admita múltiples perfiles de carga de trabajo.

Grupo de trabajo de capa de software

El trabajo que la capa de software debe realizar para INC incluye:

  • Defina una APl (usando lenguaje C) usando la comunicación de colección de INC (libfabric).
  • Definir un mecanismo de descubrimiento para confirmar INC disponible offcapacidades de carga.
  • Defina la interfaz RPC que utilizan estas bibliotecas para comunicarse con Aggregation Manager (AM). Especifique la interfaz RPC utilizada para la comunicación entre AM y el conmutador UEC que proporciona recursos INC.
  • Extensión OpenConfig para configurar el FEP de dispositivos de red (configurados por AM) para comunicación colectiva offcarga y seguimiento del rendimiento y errores.
  • Comportamiento de dispositivos de red compatibles con INC con múltiples perfiles de funciones. Guiar el desarrollo de protocolos de transmisión UEC para que la tecnología INC pueda aplicarse fácilmente a la implementación de hardware.

Deja un comentario

Ir al Inicio