¿Qué tiene de especial InfiniBand?

InfiniBand, como tecnología de red nativa de RDMA (Acceso remoto directo a memoria), es la preferida y utilizada por muchos clientes. Pero, ¿qué otras ventajas únicas tiene InfiniBand en comparación con ROCE (RDMA sobre Ethernet convergente), Ethernet sin pérdidas, que también es compatible y admite el protocolo RDMA?

Los “creyentes originales” del SDN tradicional: hacer que la red sea eficiente y simple

InfiniBand es la primera arquitectura de red verdaderamente diseñada de forma nativa según SDN. Está gestionado por un administrador de subred (es decir, un controlador SDN). A diferencia de Ethernet tradicional (incluida Ethernet sin pérdidas ROCE), los conmutadores InfiniBand no ejecutan ningún protocolo de enrutamiento y un administrador de subred centralizado calcula y distribuye la tabla de reenvío de toda la red. Además de reenviar tablas, el administrador de subred también es responsable de administrar la configuración dentro de la subred InfiniBand, como la zonificación y la QoS. La red InfiniBand ya no depende de mecanismos de transmisión como ARP para el aprendizaje de la tabla de reenvío y no habrá tormentas de transmisión ni desperdicio adicional de ancho de banda.

Aunque Ethernet tradicional (incluido Ethernet sin pérdidas ROCE) también admite redes de controladores SDN, varios fabricantes de redes se han desviado del concepto inicial de reenvío de tablas de flujo OpenSlow y en su lugar adoptaron la solución netconf+VXLAN+EVPN para evitar convertirse en una “máquina sin marca”. ”fabricante. El controlador SDN se ha convertido en una "gestión de gran red" más avanzada que solo proporciona la distribución de políticas de control relevantes. El nivel de reenvío todavía se basa en el aprendizaje entre dispositivos (aprendizaje de entrada de tabla MAC, aprendizaje de entrada de tabla ARP y aprendizaje de entrada de tabla de enrutamiento, etc.), lo que hace que ROCE Ethernet sin pérdidas pierda la ventaja de una red eficiente y simple como InfiniBand.

La red eficiente y sencilla de InfiniBand

La red eficiente y sencilla de InfiniBand

Permítanme usar un ejemplo de la vida para ilustrar:

Podemos comparar los viajes en tren de alta velocidad con la red InfiniBand. Todo el viaje en tren de alta velocidad lo gestiona y programa un despachador (administrador de subred). Los pasajeros (tráfico de la red) no necesitan aprender ni encontrar rutas para llegar a sus destinos. Sólo necesitan tomar el autobús según el número de tren programado (tabla de reenvío). En este modo, todo el viaje es eficiente y fluido, sin anuncios redundantes ni cambios temporales de ruta, lo que garantiza la calidad y velocidad del viaje de los pasajeros.

En comparación, los viajes sin conductor representan Ethernet tradicional y Ethernet sin pérdidas ROCE. Aunque también están equipados con un sistema de navegación (controlador SDN) para la navegación, el conductor (dispositivo de red) aún necesita hacer juicios en tiempo real y ajustar la dirección de conducción según las condiciones de la carretera (aprendizaje entre dispositivos). Este proceso puede implicar consultar el mapa (mecanismo de transmisión) varias veces, esperar los semáforos (desperdicio de ancho de banda) o tomar desvíos para evitar la congestión (configuración de red compleja), lo que hace que todo el proceso de viaje sea relativamente ineficiente.

Mecanismo ex ante para evitar la congestión crediticia: realización de una red nativa sin pérdidas

La red InfiniBand utiliza un mecanismo basado en créditos para evitar fundamentalmente los problemas de desbordamiento del búfer y pérdida de paquetes. Este mecanismo garantiza que el remitente solo iniciará la transmisión del paquete cuando confirme que el receptor tiene crédito suficiente para aceptar la cantidad correspondiente de mensajes.

Este mecanismo basado en créditos funciona de la siguiente manera: cada enlace de red InfiniBand tiene un búfer predeterminado para almacenar los paquetes que se transmitirán. El remitente verifica el crédito disponible del receptor antes de transmitir datos. Este crédito puede entenderse como el tamaño del buffer actualmente disponible para el receptor. El remitente decidirá si inicia la transmisión del paquete en función de este valor de crédito. Si el receptor no tiene crédito suficiente, el remitente espera hasta que el receptor libere suficientes buffers e informe nuevos créditos disponibles.

Una vez que el receptor completa el reenvío, libera los buffers usados ​​e informa continuamente al remitente el tamaño del buffer programado disponible actualmente. De esta forma, el remitente puede comprender el estado del búfer del receptor en tiempo real y ajustar la transmisión de paquetes de datos. Este mecanismo de control de flujo a nivel de enlace garantiza que el remitente no envíe demasiados datos, lo que previene eficazmente el desbordamiento del búfer de la red y la pérdida de paquetes.

La ventaja de este mecanismo basado en créditos es que proporciona un método eficiente y confiable de control de flujo. Al monitorear y ajustar la transmisión de paquetes de datos en tiempo real, InfiniBand Las redes pueden garantizar una transmisión fluida de datos y al mismo tiempo evitar la congestión de la red y la degradación del rendimiento. Además, este mecanismo proporciona una mejor previsibilidad y estabilidad de la red, lo que permite que las aplicaciones utilicen los recursos de la red de manera más eficiente.

La red InfiniBand utiliza un mecanismo basado en créditos para evitar fundamentalmente problemas de desbordamiento de búfer y pérdida de paquetes a través del control de flujo a nivel de enlace, mientras que ROCE Ethernet sin pérdidas adopta un mecanismo de gestión de congestión "posterior al evento". Antes de enviar el mensaje, no negociará recursos con el receptor, sino que reenviará el mensaje directamente. Solo cuando el conmutador receptor tiene congestión en el buffer del puerto (o congestión inminente), el mensaje de gestión de la congestión se envía a través de los protocolos PFC y ECN, lo que permite que el conmutador par y la tarjeta de red par reduzcan o suspendan el envío de mensajes. Este método "post-facto" puede aliviar la influencia de la congestión hasta cierto punto, pero no se pueden evitar por completo la pérdida de paquetes y la inestabilidad de la red.

Diagrama esquemático de transmisión de datos sin pérdidas en la red infiniBand

Permítanme usar otro ejemplo para ilustrar:

El mecanismo basado en créditos de la red InfiniBand es como un hotel que admite la reserva de asientos por teléfono. Cuando quieres cenar en un restaurante, llamas al hotel con antelación para asegurarte de que hay suficientes asientos, evitando así el bochorno de no tener asiento al llegar al restaurante. Este método garantiza la experiencia gastronómica de los clientes y evita el desperdicio de recursos y la insatisfacción.

La cola de clientes después de llegar al restaurante es como el mecanismo de gestión de la congestión “post-evento” de ROCE Ethernet sin pérdidas. Quienes no hayan concertado una cita con antelación sólo podrán esperar según la situación real. Aunque los hoteles tomarán medidas para aliviar la congestión, aún pueden enfrentar el riesgo de escasez de asientos y pérdida de clientes. Aunque el mecanismo de gestión de la congestión "posterior al evento" puede abordar la situación hasta cierto punto, no puede evitar por completo la insatisfacción y las pérdidas de los clientes.

Modo de reenvío directo: permite que la red alcance una latencia más baja

Ethernet (incluye Ethernet sin pérdidas ROCE) utiliza el modo de almacenamiento y reenvío de forma predeterminada. El conmutador debe recibir por completo todo el paquete de datos y almacenarlo en la memoria caché, verificar la dirección de destino y la integridad del paquete de datos y luego reenviarlo. Este enfoque puede provocar cierta latencia, especialmente cuando se procesa una gran cantidad de paquetes.

Mientras que la tecnología del modo de reenvío de corte solo necesita leer la información del encabezado del paquete de datos, determinar el puerto de destino y luego comenzar inmediatamente a reenviar el paquete de datos cuando el conmutador recibe un paquete de datos. Esta tecnología puede reducir significativamente el tiempo de residencia de los paquetes de datos en el conmutador, reduciendo así los retrasos en la transmisión.

Los conmutadores InfiniBand utilizan el modo de reenvío de corte, lo que simplifica mucho el procesamiento de reenvío de mensajes. Sólo necesita un LID de 16 bits (proporcionado directamente por el administrador de subred) para encontrar rápidamente la ruta de reenvío. De esta manera, el retardo de reenvío se reduce a menos de 100 nanosegundos. Los conmutadores Ethernet suelen utilizar direcciones de búsqueda de tablas MAC y métodos de almacenamiento y reenvío para procesar datos. Pero como también necesitan manejar muchos servicios complejos, como IP, MPLS, QinQ, etc., el tiempo de procesamiento es relativamente largo, que puede tardar varios microsegundos o incluso más. Incluso si algunos conmutadores Ethernet utilizan tecnología de corte, el retraso de reenvío aún puede ser de más de 200 nanosegundos.

Retraso de reenvío

Permítanme usar otro ejemplo para ilustrar:

Ethernet maneja paquetes como el envío de artículos frágiles. El cartero debe tener especial cuidado al recibir el paquete y verificar su integridad para asegurarse de que no haya daños antes de enviarlo al destino. Al cartero le toma algo de tiempo hacerlo, por lo tanto, habrá un cierto retraso.

Los conmutadores InfiniBand manejan paquetes de forma más parecida al envío de artículos normales. El cartero simplemente echa un vistazo rápido a la dirección que figura en el paquete y lo reenvía rápidamente sin esperar a una inspección completa del paquete. Este método es más rápido y reduce significativamente el tiempo que el paquete pasa en el correo. offhielo, reduciendo así los retrasos en la transmisión.

Deja un comentario

Ir al Inicio