Atualizações dos grupos de trabalho do UItra Ethernet Consortium

Direções de pesquisa do UItra Ethernet Consortium

O UItra Ethernet Consortium está comprometido em melhorar a tecnologia Ethernet desde a camada física, camada de link, camada de transporte e camada de software. Com a premissa de ser compatível com o ecossistema Ethernet atual, melhora o desempenho de encaminhamento da Ethernet e está comprometida em melhorar os protocolos de comunicação Ethernet e a interface do programa aplicativo. Também melhora os recursos de armazenamento, gerenciamento, estrutura de segurança e telemetria, para que a tecnologia UItra Ethernet possa atender às necessidades de rede de inteligência artificial e computação de alto desempenho.

O Ultra Ethernet Consortium identificou o tipo de rede que precisa ser focado como Rede Tipo2 (Rede Back End) e não se opõe ao seu uso em Rede Tipo1 (Rede Front End), mas não reduzirá o desempenho da rede Tipo2 porque ele precisa se adaptar ao Type1.

Redes Tipo1 e Tipo2

UEC determina métricas de desempenho para cada tipo de rede

Grupos de Trabalho da UEC

A UEC estabeleceu inicialmente quatro grupos de trabalho, nomeadamente grupos de trabalho da camada física, camada de enlace, camada de transporte e camada de software, que alcançaram resultados excelentes. Recentemente, grupos de trabalho de armazenamento, gerenciamento, compatibilidade e testes, desempenho e depuração foram estabelecidos e acabaram de começar a trabalhar. A figura abaixo mostra os grupos de trabalho da UEC:

Os quatro grupos de trabalho da UEC

Grupo de trabalho da camada física

O grupo de trabalho da camada física está comprometido em melhorar o desempenho físico, reduzir a latência e melhorar o gerenciamento da infraestrutura física Ethernet. Inclui o desenvolvimento de especificações da camada física Ethernet, características de sinais elétricos e ópticos, interfaces de aplicativos e estruturas de dados. Seu objetivo é fortalecer a base e garantir que a Ethernet possa atender aos rigorosos requisitos de Al e HPC. O atual grupo de trabalho da camada física está comprometido com a formulação de especificações PHY para 100G/Lane e 200G/Lane e determinou o tipo de mídia 100G/Lane e a taxa e tipo suportados por PHY. As especificações para 200G/Lane serão determinadas após a aprovação do IEEE P802.3dj.

O grupo de trabalho da camada física introduziu vários novos conceitos para previsão de qualidade de enlace: UCR (proporção de palavra-código incorrigível), MTBPE (tempo médio entre erros PHY) e MTTFPA (tempo médio para aceitação de pacotes falsos), dedicado a prever e medir erros físicos. qualidade do link da camada com mais precisão.

O grupo de trabalho da camada de enlace está comprometido em melhorar a confiabilidade e a eficiência da transmissão da camada de enlace e em melhorar as capacidades de telemetria da camada de enlace.

As principais direções de pesquisa da camada de link são:

Confiabilidade da camada de link:

Adicione uma subcamada LLR à camada de enlace, localizada entre as subcamadas LLC e MAC CONTROL, para retransmissão de pacotes de erro ponta a ponta na camada de enlace.

Controle de fluxo baseado em crédito:

Suporta um mecanismo de controle de fluxo baseado em crédito ponta a ponta na camada de enlace para gerenciar a transmissão sem perdas de quadros entre enlaces. O mecanismo CBFC (Controle de Fluxo Baseado em Crédito) é usado para substituir o controle de fluxo PFC. O receptor envia periodicamente espaço de buffer para o peer e o remetente envia mensagens com base na prioridade da mensagem e no tamanho do buffer. O espaço de buffer também pode ser usado para seleção de roteamento adaptativo.

Controle de fluxo baseado em crédito

Controle de fluxo baseado em crédito

Melhoria na taxa de pacotes:

Está comprometida com a compactação de cabeçalhos de mensagens Ethernet para aumentar a eficiência da transmissão de quadros. Durante a evolução de longo prazo da Ethernet, os cabeçalhos das mensagens continuaram a se expandir, resultando em uma eficiência de transmissão relativamente baixa. Muitos campos não são usados ​​em redes de computação inteligentes. Portanto, é imperativo compactar os cabeçalhos das mensagens e melhorar a eficiência da transmissão de quadros.

É necessário haver um sinalizador no cabeçalho da mensagem para indicar se a mensagem está compactada ou descompactada para que a mensagem compactada e a mensagem descompactada coexistam na rede. O remetente pode escolher se deseja compactar a mensagem sem afetar a função original.

Atualmente, existem múltiplas soluções para compactação de cabeçalhos de mensagens, que estão em discussão.

Negociação:

Estabelece um método de negociação para parâmetros e características da camada de enlace. Vários novos recursos na camada de enlace, como LLR, CBFC e PRI, exigem negociação para apoiá-los. A ideia principal é estender o LLDP e adicionar um UEC OUI para negociação de novas capacidades de camada de enlace entre dispositivos.

Grupo de trabalho da camada de transporte

O grupo de trabalho UET (camada de transporte UEC) está comprometido com a expansão de aplicativos mais desafiadora, transmissão confiável de mensagens, transmissão segura de dados e prevenção de congestionamento na rede. Seu objetivo é resolver as deficiências da transmissão RoCE e fornecer transmissão em larga escala eficiente, confiável e segura. O endpoint de transporte de destino atinge 256,000 e o número de processos suportados atinge 100,000,000.

Os principais módulos do UET são mostrados na figura abaixo:

Principais módulos do UET

O UET contém três módulos: Entrega de Pacotes, Segurança e Semântica. As funções de cada módulo são as seguintes:

  • Subcamada de entrega de pacotes (PDS):

O PDS contém dois módulos: confiabilidade e gerenciamento de congestionamento.

O módulo de confiabilidade precisa cobrir três requisitos principais:

  1. Escalabilidade extrema
  2. Transmissão ordenada de mensagens
  3. Transmissão de mensagem não ordenada

O módulo de confiabilidade foi projetado com quatro modos de transmissão de mensagens e cada modo é usado para uma finalidade específica para atender a HPC, Al, ML e outros cenários de aplicação. Os quatro modos de transmissão de mensagens são:

Entrega confiável e ordenada (ROD):

Este modo transmite mensagens em ordem e é usado para aplicações que exigem transmissão ordenada de mensagens.

Entrega confiável e não ordenada para operações (RUD):

Este modo só pode transmitir mensagens para a camada semântica uma vez, mas pode tolerar a entrega não ordenada na rede. A camada de transporte confiável precisa detectar mensagens duplicadas para garantir que cada mensagem só possa ser transmitida uma vez à camada semântica.

Entrega confiável e não ordenada para operações idempotentes (RUDI):

Este modo é otimizado para operações de leitura e gravação de RDMA.

Entrega não confiável e não solicitada (UUD):

Mensagens não confiáveis ​​podem conter muitas novas semânticas do UET. Os usuários de UDD não precisam de transmissão confiável e usam outros métodos de confiabilidade.

O módulo de gerenciamento de congestionamento ainda está em estudo, incluindo gerenciamento de congestionamento e balanceamento de carga, e pode realizar gerenciamento de congestionamento com base em cada FEP. O núcleo é o controle de fluxo baseado no crédito do receptor. O controle de congestionamento define o tamanho da janela e a taxa de injeção. O objetivo é reduzir a taxa e limitar as mensagens para evitar congestionamento em nós intermediários e terminais. O balanceamento de carga de caminho define qual caminho uma mensagem específica escolhe e o ECMP pode ser usado para selecionar o caminho.

  • Segurança de Transporte:

A segurança de transporte é uma prioridade máxima no design do UET, com criptografia e autenticação opcionais de todas as cargas de dados e da maioria dos cabeçalhos de transmissão.

  • Semântica:

A camada semântica do UET fornece operações de alto desempenho e altamente escaláveis, permitindo a implantação de AI especializada e de HPC com todos os recursos.

A camada semântica é a ponte entre o software do usuário e o PDS (message Delivery Layer). A camada semântica define uma série de
operações, como envio, recebimento, gravação, leitura, etc. A camada fornece classificação opcional, incluindo vários iniciadores opcionais e recursos de notificação de conclusão de destino.

A camada semântica fornece API de chamada sem conexão e deve suportar nativamente *CCL, MPI, OpenSHMEM e outras APIs.

Grupo de trabalho da camada de software

A camada de software promove a rápida adoção do UEC usando a API libfabric como estrutura de plano de dados através da compatibilidade com várias bibliotecas de comunicação atualmente amplamente adotadas, como *CCL, MPI e SHMEM. Ele define a interação entre vários aceleradores e FEP, incluindo APIs de aceleradores relacionados. Ele define mecanismos de plano de controle e plano de dados para switches, FEPs e Aggregation Managers (AMs) para permitir a interoperabilidade entre diferentes fornecedores de UEC. Ele atende à necessidade do UEC oferecer suporte a vários perfis de carga de trabalho.

Grupo de trabalho da camada de software

O trabalho que a camada de software precisa realizar para INC inclui:

  • Defina um APl (usando linguagem C) usando a comunicação de coleção do INC (libfabric).
  • Defina um mecanismo de descoberta para confirmar INC disponível offcapacidades de carga.
  • Defina a interface RPC que essas bibliotecas usam para se comunicar com o Aggregation Manager (AM). Especifique a interface RPC usada para comunicação entre o switch AM e o UEC que fornece recursos INC.
  • Extensão OpenConfig para configuração do FEP de dispositivos de rede (configurados por AM) para comunicação coletiva offcarregamento e monitoramento de desempenho e erros.
  • Comportamento de dispositivos de rede compatíveis com INC com vários perfis de recursos. Orientar o desenvolvimento de protocolos de transmissão UEC para que a tecnologia INC possa ser facilmente aplicada à implementação de hardware.

Deixe um comentário

Voltar ao Topo