Direções de pesquisa do UItra Ethernet Consortium
O UItra Ethernet Consortium está comprometido em melhorar a tecnologia Ethernet desde a camada física, camada de link, camada de transporte e camada de software. Com a premissa de ser compatível com o ecossistema Ethernet atual, melhora o desempenho de encaminhamento da Ethernet e está comprometida em melhorar os protocolos de comunicação Ethernet e a interface do programa aplicativo. Também melhora os recursos de armazenamento, gerenciamento, estrutura de segurança e telemetria, para que a tecnologia UItra Ethernet possa atender às necessidades de rede de inteligência artificial e computação de alto desempenho.
O Ultra Ethernet Consortium identificou o tipo de rede que precisa ser focado como Rede Tipo2 (Rede Back End) e não se opõe ao seu uso em Rede Tipo1 (Rede Front End), mas não reduzirá o desempenho da rede Tipo2 porque ele precisa se adaptar ao Type1.
Redes Tipo1 e Tipo2
UEC determina métricas de desempenho para cada tipo de rede
Grupos de Trabalho da UEC
A UEC estabeleceu inicialmente quatro grupos de trabalho, nomeadamente grupos de trabalho da camada física, camada de enlace, camada de transporte e camada de software, que alcançaram resultados excelentes. Recentemente, grupos de trabalho de armazenamento, gerenciamento, compatibilidade e testes, desempenho e depuração foram estabelecidos e acabaram de começar a trabalhar. A figura abaixo mostra os grupos de trabalho da UEC:
Os quatro grupos de trabalho da UEC
Grupo de trabalho da camada física
O grupo de trabalho da camada física está comprometido em melhorar o desempenho físico, reduzir a latência e melhorar o gerenciamento da infraestrutura física Ethernet. Inclui o desenvolvimento de especificações da camada física Ethernet, características de sinais elétricos e ópticos, interfaces de aplicativos e estruturas de dados. Seu objetivo é fortalecer a base e garantir que a Ethernet possa atender aos rigorosos requisitos de Al e HPC. O atual grupo de trabalho da camada física está comprometido com a formulação de especificações PHY para 100G/Lane e 200G/Lane e determinou o tipo de mídia 100G/Lane e a taxa e tipo suportados por PHY. As especificações para 200G/Lane serão determinadas após a aprovação do IEEE P802.3dj.
O grupo de trabalho da camada física introduziu vários novos conceitos para previsão de qualidade de enlace: UCR (proporção de palavra-código incorrigível), MTBPE (tempo médio entre erros PHY) e MTTFPA (tempo médio para aceitação de pacotes falsos), dedicado a prever e medir erros físicos. qualidade do link da camada com mais precisão.
Grupo de trabalho da camada de link
O grupo de trabalho da camada de enlace está comprometido em melhorar a confiabilidade e a eficiência da transmissão da camada de enlace e em melhorar as capacidades de telemetria da camada de enlace.
As principais direções de pesquisa da camada de link são:
Confiabilidade da camada de link:
Adicione uma subcamada LLR à camada de enlace, localizada entre as subcamadas LLC e MAC CONTROL, para retransmissão de pacotes de erro ponta a ponta na camada de enlace.
Controle de fluxo baseado em crédito:
Suporta um mecanismo de controle de fluxo baseado em crédito ponta a ponta na camada de enlace para gerenciar a transmissão sem perdas de quadros entre enlaces. O mecanismo CBFC (Controle de Fluxo Baseado em Crédito) é usado para substituir o controle de fluxo PFC. O receptor envia periodicamente espaço de buffer para o peer e o remetente envia mensagens com base na prioridade da mensagem e no tamanho do buffer. O espaço de buffer também pode ser usado para seleção de roteamento adaptativo.
Controle de fluxo baseado em crédito
Melhoria na taxa de pacotes:
Está comprometida com a compactação de cabeçalhos de mensagens Ethernet para aumentar a eficiência da transmissão de quadros. Durante a evolução de longo prazo da Ethernet, os cabeçalhos das mensagens continuaram a se expandir, resultando em uma eficiência de transmissão relativamente baixa. Muitos campos não são usados em redes de computação inteligentes. Portanto, é imperativo compactar os cabeçalhos das mensagens e melhorar a eficiência da transmissão de quadros.
É necessário haver um sinalizador no cabeçalho da mensagem para indicar se a mensagem está compactada ou descompactada para que a mensagem compactada e a mensagem descompactada coexistam na rede. O remetente pode escolher se deseja compactar a mensagem sem afetar a função original.
Atualmente, existem múltiplas soluções para compactação de cabeçalhos de mensagens, que estão em discussão.
Negociação:
Estabelece um método de negociação para parâmetros e características da camada de enlace. Vários novos recursos na camada de enlace, como LLR, CBFC e PRI, exigem negociação para apoiá-los. A ideia principal é estender o LLDP e adicionar um UEC OUI para negociação de novas capacidades de camada de enlace entre dispositivos.
Grupo de trabalho da camada de transporte
O grupo de trabalho UET (camada de transporte UEC) está comprometido com a expansão de aplicativos mais desafiadora, transmissão confiável de mensagens, transmissão segura de dados e prevenção de congestionamento na rede. Seu objetivo é resolver as deficiências da transmissão RoCE e fornecer transmissão em larga escala eficiente, confiável e segura. O endpoint de transporte de destino atinge 256,000 e o número de processos suportados atinge 100,000,000.
Os principais módulos do UET são mostrados na figura abaixo:
Principais módulos do UET
O UET contém três módulos: Entrega de Pacotes, Segurança e Semântica. As funções de cada módulo são as seguintes:
- Subcamada de entrega de pacotes (PDS):
O PDS contém dois módulos: confiabilidade e gerenciamento de congestionamento.
O módulo de confiabilidade precisa cobrir três requisitos principais:
- Escalabilidade extrema
- Transmissão ordenada de mensagens
- Transmissão de mensagem não ordenada
O módulo de confiabilidade foi projetado com quatro modos de transmissão de mensagens e cada modo é usado para uma finalidade específica para atender a HPC, Al, ML e outros cenários de aplicação. Os quatro modos de transmissão de mensagens são:
Entrega confiável e ordenada (ROD):
Este modo transmite mensagens em ordem e é usado para aplicações que exigem transmissão ordenada de mensagens.
Entrega confiável e não ordenada para operações (RUD):
Este modo só pode transmitir mensagens para a camada semântica uma vez, mas pode tolerar a entrega não ordenada na rede. A camada de transporte confiável precisa detectar mensagens duplicadas para garantir que cada mensagem só possa ser transmitida uma vez à camada semântica.
Entrega confiável e não ordenada para operações idempotentes (RUDI):
Este modo é otimizado para operações de leitura e gravação de RDMA.
Entrega não confiável e não solicitada (UUD):
Mensagens não confiáveis podem conter muitas novas semânticas do UET. Os usuários de UDD não precisam de transmissão confiável e usam outros métodos de confiabilidade.
O módulo de gerenciamento de congestionamento ainda está em estudo, incluindo gerenciamento de congestionamento e balanceamento de carga, e pode realizar gerenciamento de congestionamento com base em cada FEP. O núcleo é o controle de fluxo baseado no crédito do receptor. O controle de congestionamento define o tamanho da janela e a taxa de injeção. O objetivo é reduzir a taxa e limitar as mensagens para evitar congestionamento em nós intermediários e terminais. O balanceamento de carga de caminho define qual caminho uma mensagem específica escolhe e o ECMP pode ser usado para selecionar o caminho.
- Segurança de Transporte:
A segurança de transporte é uma prioridade máxima no design do UET, com criptografia e autenticação opcionais de todas as cargas de dados e da maioria dos cabeçalhos de transmissão.
- Semântica:
A camada semântica do UET fornece operações de alto desempenho e altamente escaláveis, permitindo a implantação de AI especializada e de HPC com todos os recursos.
A camada semântica é a ponte entre o software do usuário e o PDS (message Delivery Layer). A camada semântica define uma série de
operações, como envio, recebimento, gravação, leitura, etc. A camada fornece classificação opcional, incluindo vários iniciadores opcionais e recursos de notificação de conclusão de destino.
A camada semântica fornece API de chamada sem conexão e deve suportar nativamente *CCL, MPI, OpenSHMEM e outras APIs.
Grupo de trabalho da camada de software
A camada de software promove a rápida adoção do UEC usando a API libfabric como estrutura de plano de dados através da compatibilidade com várias bibliotecas de comunicação atualmente amplamente adotadas, como *CCL, MPI e SHMEM. Ele define a interação entre vários aceleradores e FEP, incluindo APIs de aceleradores relacionados. Ele define mecanismos de plano de controle e plano de dados para switches, FEPs e Aggregation Managers (AMs) para permitir a interoperabilidade entre diferentes fornecedores de UEC. Ele atende à necessidade do UEC oferecer suporte a vários perfis de carga de trabalho.
Grupo de trabalho da camada de software
O trabalho que a camada de software precisa realizar para INC inclui:
- Defina um APl (usando linguagem C) usando a comunicação de coleção do INC (libfabric).
- Defina um mecanismo de descoberta para confirmar INC disponível offcapacidades de carga.
- Defina a interface RPC que essas bibliotecas usam para se comunicar com o Aggregation Manager (AM). Especifique a interface RPC usada para comunicação entre o switch AM e o UEC que fornece recursos INC.
- Extensão OpenConfig para configuração do FEP de dispositivos de rede (configurados por AM) para comunicação coletiva offcarregamento e monitoramento de desempenho e erros.
- Comportamento de dispositivos de rede compatíveis com INC com vários perfis de recursos. Orientar o desenvolvimento de protocolos de transmissão UEC para que a tecnologia INC possa ser facilmente aplicada à implementação de hardware.
Produtos relacionados:
- QSFP-DD-400G-SR8 400G QSFP-DD SR8 PAM4 850nm 100m MTP / MPO OM3 Módulo transceptor óptico FEC $300.00
- QSFP-DD-400G-DR4 400G QSFP-DD DR4 PAM4 1310nm 500m MTP / MPO SMF FEC Módulo transceptor óptico $550.00
- QSFP-DD-400G-SR4.2 400Gb/s QSFP-DD SR4 BiDi PAM4 850nm/910nm 100m/150m OM4/OM5 MMF MPO-12 FEC Módulo Transceptor Óptico $1000.00
- QSFP-DD-400G-FR4 400G QSFP-DD FR4 PAM4 CWDM4 Módulo transceptor ótico 2km LC SMF FEC $750.00
- Módulo transceptor óptico QSFP-DD-400G-SR4 QSFP-DD 400G SR4 PAM4 850nm 100m MTP/MPO-12 OM4 FEC $1200.00
- QSFP-DD-400G-XDR4 400G QSFP-DD XDR4 PAM4 1310nm 2km MTP / MPO-12 SMF FEC Módulo Transceptor Ótico $650.00
- QSFP-DD-800G-DR8D QSFP-DD 8x100G DR PAM4 1310nm 500m DOM Módulo Transceptor Ótico MPO-12 SMF Duplo $4500.00
- QSFP-DD-800G-SR8 800G SR8 QSFP-DD 850nm 100m OM4 MMF MPO-16 Módulo Transceptor Óptico $1600.00
- QSFP-DD-800G-DR8 800G-DR8 QSFP-DD PAM4 1310nm 500m DOM MTP/MPO-16 Módulo Transceptor Óptico SMF $4500.00
- QSFP-DD-800G-2FR4 800G QSFP-DD 2FR4 PAM4 1310nm 2km DOM Dual CS SMF Módulo Transceptor Óptico $5049.00
- QSFP-DD-800G-2FR4L QSFP-DD 2x400G FR4 PAM4 CWDM4 2km DOM Módulo transceptor óptico LC SMF duplo duplex $5049.00
- QSFP-DD-800G-FR8L QSFP-DD 800G FR8 PAM4 CWDM8 2km DOM Duplex LC SMF Módulo Transceptor Óptico $8000.00
- OSFP-800G-DR8D-FLT 800G-DR8 OSFP Flat Top PAM4 1310nm 500m DOM Módulo transceptor óptico MTP/MPO-12 SMF duplo $2000.00
- OSFP-800G-SR8D-FLT OSFP 8x100G SR8 Flat Top PAM4 850nm 100m DOM Módulo Transceptor Ótico MPO-12 MMF Duplo $1400.00
- OSFP-800G-SR8 OSFP 8x100G SR8 PAM4 850nm MTP/MPO-16 100m OM4 MMF FEC Módulo transceptor óptico $1600.00
- OSFP-800G-SR8D OSFP 8x100G SR8 PAM4 850nm 100m DOM Módulo Transceptor Ótico MPO-12 MMF Duplo $1400.00
- OSFP-800G-DR8 OSFP 8x100G DR PAM4 1310nm MPO-16 500m SMF DDM Módulo Transceptor Óptico $2000.00
- OSFP-800G-DR8D 800G-DR8 OSFP PAM4 1310nm 500m DOM Módulo Transceptor Ótico MTP/MPO-12 SMF Duplo $2000.00