UItra 이더넷 컨소시엄 워킹 그룹 업데이트

UItra 이더넷 컨소시엄 연구 방향

UItra 이더넷 컨소시엄은 물리 계층, 링크 계층, 전송 계층 및 소프트웨어 계층에서 이더넷 기술을 개선하기 위해 최선을 다하고 있습니다. 현재 이더넷 생태계와의 호환성을 전제로 이더넷의 포워딩 성능을 향상시키고 이더넷 통신 프로토콜 및 응용 프로그램 인터페이스 개선에 최선을 다하고 있습니다. 또한 저장, 관리, 보안 구조 및 원격 측정 기능을 향상시켜 UItra 이더넷 기술이 인공 지능 및 고성능 컴퓨팅의 네트워크 요구 사항을 충족할 수 있도록 합니다.

울트라 이더넷 컨소시엄에서는 중점적으로 다루어야 할 네트워크 유형을 Type2 네트워크(Back End Network)로 파악하고 Type1 네트워크(Front End Network)에서의 사용을 반대하지는 않지만 Type2의 네트워크 성능을 저하시키지는 않을 것으로 예상합니다. Type1에 ​​적응해야 합니다.

Type1 및 Type2 네트워크

UEC는 각 네트워크 유형에 대한 성능 지표를 결정합니다.

UEC 실무 그룹

UEC는 처음에 물리 계층, 링크 계층, 전송 계층, 소프트웨어 계층 작업 그룹이라는 XNUMX개의 작업 그룹을 구성하여 뛰어난 성과를 거두었습니다. 최근에는 저장, 관리, 호환성 및 테스트, 성능 및 디버깅 작업 그룹이 설립되어 이제 막 작업을 시작했습니다. 아래 그림은 UEC의 실무 그룹을 보여줍니다.

UEC의 XNUMX개 실무 그룹

물리계층 워킹그룹

물리 계층 실무 그룹은 물리적 성능을 개선하고 대기 시간을 줄이며 이더넷 물리적 인프라 관리를 개선하기 위해 최선을 다하고 있습니다. 여기에는 이더넷 물리 계층 사양, 전기 및 광 신호 특성, 애플리케이션 인터페이스 및 데이터 구조의 개발이 포함됩니다. 그 목표는 기반을 더욱 강화하고 이더넷이 AI 및 HPC의 엄격한 요구 사항을 충족할 수 있도록 하는 것입니다. 현재 물리 계층 작업 그룹은 100G/Lane 및 200G/Lane에 대한 PHY 사양을 공식화하는 데 전념하고 있으며 100G/Lane 미디어 유형과 PHY 지원 속도 및 유형을 결정했습니다. 200G/Lane에 대한 사양은 IEEE P802.3djis 승인 후에 결정됩니다.

물리 계층 실무 그룹은 링크 품질 예측을 위한 몇 가지 새로운 개념, 즉 UCR(수정 불가능한 코드워드 비율), MTBPE(PHY 오류 간 평균 시간), MTTFPA(잘못된 패킷 수용 평균 시간)를 도입했습니다. 레이어 링크 품질을 더 정확하게

링크 레이어 작업 그룹은 링크 레이어 전송의 신뢰성과 효율성을 개선하고 링크 레이어 원격 측정 기능을 향상시키는 데 전념하고 있습니다.

링크 레이어의 주요 연구 방향은 다음과 같습니다.

링크 계층 신뢰성:

링크 계층에서 종단 간 오류 패킷 재전송을 위해 LLC와 MAC Control 하위 계층 사이에 있는 LLR 하위 계층을 링크 계층에 추가합니다.

크레딧 기반 흐름 제어:

링크 간 프레임의 무손실 전송을 관리하기 위해 링크 계층에서 엔드투엔드 크레딧 기반 흐름 제어 메커니즘을 지원합니다. CBFC(Credit-Based Flow Control) 메커니즘은 PFC 흐름 제어를 대체하는 데 사용됩니다. 수신자는 주기적으로 버퍼 공간을 피어에게 보내고, 송신자는 메시지 우선순위와 버퍼 크기에 따라 메시지를 보냅니다. 버퍼 공간은 적응형 라우팅 선택에도 사용될 수 있습니다.

크레딧 기반 흐름 제어

크레딧 기반 흐름 제어

패킷 속도 개선:

프레임 전송 효율성을 높이기 위해 이더넷 메시지 헤더를 압축하는 데 전념합니다. 이더넷이 장기적으로 발전하는 동안 메시지 헤더는 계속해서 확장되어 전송 효율성이 상대적으로 낮아졌습니다. 지능형 컴퓨팅 네트워크에서는 많은 필드가 사용되지 않습니다. 따라서 메시지 헤더를 압축하고 프레임 전송 효율을 높이는 것이 필수적입니다.

압축된 메시지와 압축되지 않은 메시지가 네트워크에 공존하려면 메시지가 압축되었는지 또는 압축 해제되었는지를 나타내는 플래그가 메시지 헤더에 있어야 합니다. 발신자는 원래 기능에 영향을 주지 않고 메시지를 압축할지 여부를 선택할 수 있습니다.

현재 논의 중인 메시지 헤더 압축에 대한 여러 가지 솔루션이 있습니다.

협상:

링크 레이어 매개변수와 특성에 대한 협상 방법을 설정합니다. LLR, CBFC, PRI 등 링크 계층의 몇 가지 새로운 기능을 지원하려면 협상이 필요합니다. 주요 아이디어는 장치 간 새로운 링크 계층 기능 협상을 위해 LLDP를 확장하고 UEC OUI를 추가하는 것입니다.

전송 계층 작업 그룹

UET(UEC 전송 계층) 워킹 그룹은 가장 까다로운 애플리케이션 확장, 안정적인 메시지 전송, 안전한 데이터 전송 및 네트워크 혼잡 방지에 ​​전념하고 있습니다. RoCE 전송의 단점을 해결하고 효율적이고 안정적이며 안전한 대규모 전송을 제공하는 것이 목표입니다. 대상 전송 엔드포인트는 256,000개에 도달하고 지원되는 프로세스 수는 100,000,000개에 도달합니다.

UET의 주요 모듈은 아래 그림에 나와 있습니다.

UET의 주요 모듈

UET에는 패킷 전달, 보안 및 의미론의 세 가지 모듈이 포함되어 있습니다. 각 모듈의 기능은 다음과 같습니다.

  • 패킷 전달 하위 계층(PDS):

PDS에는 신뢰성과 혼잡 관리라는 두 가지 모듈이 포함되어 있습니다.

신뢰성 모듈은 세 가지 주요 요구 사항을 충족해야 합니다.

  1. 뛰어난 확장 성
  2. 질서있는 메시지 전송
  3. 순서 없는 메시지 전송

신뢰성 모듈은 XNUMX가지 메시지 전송 모드로 설계되었으며 각 모드는 HPC, Al, ML 및 기타 애플리케이션 시나리오를 충족하기 위한 특정 목적으로 사용됩니다. 네 가지 메시지 전송 모드는 다음과 같습니다.

ROD(신뢰할 수 있는 주문 배송):

순서대로 메시지를 전송하는 모드로, 순서대로 메시지를 전송해야 하는 용도에 사용됩니다.

안정적이고 주문되지 않은 작업 전달(RUD):

이 모드는 메시지를 의미 계층에 한 번만 전송할 수 있지만 네트워크에서 순서 없는 전달을 허용할 수 있습니다. 신뢰할 수 있는 전송 계층은 각 메시지가 의미 계층에 한 번만 전송될 수 있도록 중복 메시지를 감지해야 합니다.

멱등성 작업을 위한 안정적이고 순서 없는 전달(RUDI):

이 모드는 RDMA의 읽기 및 쓰기 작업에 최적화되어 있습니다.

신뢰할 수 없는 주문되지 않은 배송(UUD):

신뢰할 수 없는 메시지에는 UET의 많은 새로운 의미가 포함될 수 있습니다. UDD 사용자는 안정적인 전송이 필요하지 않으며 다른 신뢰성 있는 방법을 사용합니다.

혼잡관리, 로드밸런싱 등을 포함하는 혼잡관리 모듈은 아직 연구중이며, 각 FEP를 기반으로 혼잡관리를 수행할 수 있다. 핵심은 수신자의 신용에 따른 흐름 제어입니다. 혼잡 제어는 창 크기와 주입 속도를 정의합니다. 목표는 중간 노드와 엔드포인트의 정체를 방지하기 위해 속도를 줄이고 메시지를 제한하는 것입니다. 경로 로드 밸런싱은 특정 메시지가 어떤 경로를 선택할지 정의하며 ECMP를 사용하여 경로를 선택할 수 있습니다.

  • 운송 보안:

전송 보안은 모든 데이터 페이로드와 대부분의 전송 헤더에 대한 선택적 암호화 및 인증을 통해 UET 설계의 최우선 순위입니다.

  • 의미론:

UET 의미 체계 계층은 고성능 및 확장성이 뛰어난 작업을 제공하여 특수 AI 및 모든 기능을 갖춘 HPC 배포를 가능하게 합니다.

의미 계층은 사용자 소프트웨어와 PDS(메시지 전달 계층) 사이의 브리지입니다. 의미 계층은 일련의
전송, 수신, 쓰기, 읽기 등과 같은 작업. 계층은 다양한 선택적 개시자 및 대상 완료 알림 기능을 포함하여 선택적 정렬을 제공합니다.

의미 계층은 비연결 호출 API를 제공하며 기본적으로 *CCL, MPI, OpenSHMEM 및 기타 API를 지원해야 합니다.

소프트웨어 계층 워킹그룹

소프트웨어 계층은 *CCL, MPI, SHMEM 등 현재 널리 채택되고 있는 다양한 통신 라이브러리와의 호환성을 통해 libfabric API를 데이터 플레인 프레임워크로 사용함으로써 UEC의 신속한 채택을 촉진합니다. 관련 가속기 API를 포함하여 다양한 가속기와 FEP 간의 상호 작용을 정의합니다. 이는 서로 다른 UEC 공급업체 간의 상호 운용성을 허용하기 위해 스위치, FEP 및 AM(집계 관리자)에 대한 제어 평면 및 데이터 평면 메커니즘을 정의합니다. UEC가 여러 워크로드 프로필을 지원해야 한다는 필요성을 해결합니다.

소프트웨어 계층 워킹 그룹

INC를 위해 소프트웨어 계층이 수행해야 하는 작업은 다음과 같습니다.

  • INC의 컬렉션 통신(libfabric)을 사용하여 APl(C 언어 사용)을 정의합니다.
  • 사용 가능한 INC를 확인하기 위한 검색 메커니즘 정의 off로드 기능.
  • 이러한 라이브러리가 AM(Aggregation Manager)과 통신하는 데 사용하는 RPC 인터페이스를 정의합니다. AM과 INC 리소스를 제공하는 UEC 스위치 간의 통신에 사용되는 RPC 인터페이스를 지정합니다.
  • 집단 통신을 위해 네트워크 장치(AM에서 구성)의 FEP를 구성하기 위한 OpenConfig 확장 off성능과 오류를 로드하고 모니터링합니다.
  • 여러 기능 프로필을 갖춘 INC 호환 네트워크 장치의 동작. INC 기술을 하드웨어 구현에 쉽게 적용할 수 있도록 UEC 전송 프로토콜 개발을 안내합니다.

코멘트 남김

위쪽으로 스크롤