800G/400G AI 데이터센터 제품 아키텍처

AI가 400G/800G 광모듈 시장의 성장을 주도하다

30년 2022월 100일 미국 인공지능(AI) 연구 기업 오픈AI(OpenAI)가 챗봇 모델인 ChatGPT를 출시했는데, 28일 만에 2023만 명 이상, 두 달 만에 10.3억 명 이상의 사용자를 유치하며 가장 빠른 성장세를 보이고 있다. 역사상 소비자 애플리케이션. 27년 29월 XNUMX일, OpenAI는 투자 후 가치 평가 XNUMX억~XNUMX억 달러로 XNUMX억 달러의 자금 조달을 완료하여 세계에서 가장 빠르게 성장하는 유니콘이 되었습니다.

AI 기술이 발전함에 따라 빅모델, 빅데이터, 빅컴퓨팅 파워가 점점 AIGC 애플리케이션의 핵심 제약사항이 되고 있습니다. 빅 모델과 데이터 세트는 AIGC 개발을 위한 소프트웨어 기반이며 컴퓨팅 성능은 가장 중요한 인프라입니다. AI는 주로 병렬 컴퓨팅을 기반으로 하며 코어 프로세서는 주로 GPU입니다. 하지만 GPU 성능 외에도 통신 요소도 슈퍼컴퓨팅의 병목 현상이 될 것입니다. 링크에 네트워크 정체가 있는 한 데이터 대기 시간이 발생합니다. 따라서 기본 데이터 전송 속도 및 대기 시간 요구 사항에 대한 AI 서버는 매우 까다롭고 이에 맞는 고속 광 모듈이 필요하므로 AI 서버는 800G 광 모듈에 대한 수요가 높습니다.

AI 네트워크 대역폭 병목 현상을 해결하려면 데이터센터 네트워크 아키텍처를 바꿔야 한다.

데이터 센터 네트워크 아키텍처

AI 대형 모델 훈련이 점차 다양한 분야에 적용됨에 따라 HPC에 적합한 기존 네트워크는 더 이상 대형 모델 클러스터 훈련의 대역폭 및 대기 시간 요구 사항을 충족할 수 없습니다. 대규모 모델 분산 훈련에는 GPU 간 통신이 필요하며, 이로 인해 AI/ML 데이터 센터의 동서 트래픽이 증가하고 트래픽 패턴이 기존 클라우드 컴퓨팅과 다릅니다. AI 데이터는 단기적이고 대용량이므로 기존 클라우드 컴퓨팅 네트워크 아키텍처에서는 네트워크 지연이 발생하고 훈련 속도가 저하됩니다. 전통적인 트리 네트워크 토폴로지에서 대역폭은 레이어별로 수렴되며 트리 루트의 네트워크 대역폭은 각 리프의 모든 대역폭을 합한 것보다 훨씬 작습니다. 뚱뚱한 나무는 실제 나무와 비슷하며 뿌리에 가까울수록 가지가 두꺼워집니다. 즉, 잎에서 뿌리까지 네트워크 대역폭이 수렴되지 않으므로 네트워크 효율성이 향상되고 훈련 속도가 빨라질 수 있습니다. 이는 비차단 네트워크를 지원하는 팻 트리 아키텍처의 기초입니다. 수렴이 없기 때문에 업링크 및 다운링크 속도의 일관성을 보장하기 위해 더 많은 광 포트가 필요하며, 이로 인해 광 모듈 수가 늘어납니다.

스위치 칩이 112G 전기 인터페이스로 업그레이드되면 해당 400G/800G 모듈 애플리케이션이 열립니다. 서로 다른 AI 데이터 센터의 토폴로지 아키텍처가 크게 다르기 때문에 AI가 구동하는 광 모듈에 대한 수요는 일반적인 상황을 기반으로 하는 것으로 추정됩니다. GPT형 애플리케이션이 월간 활성 사용자 1억 명에 도달하면 69.4개의 A100이 필요한 것으로 추산된다. A100 2개가 광모듈 800개 수요에 해당한다고 가정하면 약 800만개의 400G 광모듈 수요에 해당한다. 실제 애플리케이션에서는 스위치 단에서 서버 단까지 XNUMXG가 두 개로 나뉘는 경우가 많고, 하위 계층은 XNUMXG이다. 업그레이드 중 800G 400G 수요는 필연적으로 늘어날 것이다.

북미 광모듈 시장의 관점에서 볼 때, 향후 몇 년은 기본적으로 두 부분으로 나누어집니다. 한 부분은 전통적인 데이터 센터 수요이고 다른 부분은 AI 부상으로 인한 새로운 수요입니다. 2024년부터 2025년까지 AI에 대한 새로운 수요가 기존 데이터센터 수요를 넘어설 것으로 예상된다.

국내 광모듈 시장 관점에서 보면, 200G/400G 배포는 여전히 주류가 될 것이며 일정 기간 동안 지속될 것입니다. 현재 국내 수요는 400G 800G는 급격히 증가하지 않았습니다. 한편, 기존 데이터 센터에 대한 수요는 상대적으로 정체되어 있어 성장률이 특별히 뚜렷하지 않습니다. 반면, 통신 분야의 수요는 여전히 느린 발전 추세를 보이고 있으며 기복이 없습니다. 따라서 400년 800G와 2024G의 성장은 슈퍼컴퓨팅에 따른 수요 증가에서 비롯될 것이며, CPO와 플러그형 모듈은 앞으로도 오랫동안 공존할 것이다.

항구 선적

출처 : Dell'oro 2022.10

선적

출처: 라이트카운팅 2022.5

데이터센터 인터넷 요금 업그레이드의 진화

진화 경로가 나누어져 있으며, 다양한 선택지가 공존하고 있습니다. 사용자는 비즈니스 요구 사항/네트워크 아키텍처/배포 시간에 따라 선택할 수 있습니다.

진화
데이터 센터 인터넷 요금

400G/800G 제품의 일반적인 애플리케이션

400G/800G DAC/ACC

사례 1: Quantum-2 Infiniband 스위치 연결 또는 Quantum-2 IB 스위치를 DGX-H100에 연결

Quantum-2 IB 스위치 연결 또는 Quantum-2 IB 스위치를 DGX-H100에 연결

사례 2: Quantum-2 Infiniband 스위치를 분기 애플리케이션으로 전환

사례 2: Quantum-2 IB를 분기 애플리케이션으로 전환

400G SR4/800G SR8 광 트랜시버

사례 3: Quantum-2 Infiniband 스위치를 2개의 ConnectX-7 400G NIC로 전환

사례 3: Quantum-2 IB 스위치를 2개의 ConnectX-7 400G NIC로 전환

800G OSFP SR8 광 트랜시버 모듈은 400nm 파장을 사용하는 다중 모드 광섬유를 통한 850G InfiniBand NDR 링크용으로 설계되었습니다. 모듈에는 각각 MTP/MPO-4 커넥터를 사용하는 100채널 4G-PAM12 광 변조 포트 800개가 있습니다. 아래 비디오에서는 브레이크아웃 광섬유 케이블을 사용하여 다른 장치에 연결하는 방법과 InfiniBand 또는 이더넷을 기반으로 스위치 프로토콜을 구성하는 방법을 보여줍니다. 또한 높은 대역폭, 낮은 전력 소비 및 핫 플러그 ​​기능과 같은 8G OSFP SRXNUMX 모듈의 주요 기능과 이점에 대해 알아봅니다.

FiberMall 400G/800G 신제품 출시

FiberMall 출시 800G QSFP-DD SR8, 800G OSFP SR8, 400G QSFP112 SR4 및 400G OSFP-RHS SR4 광 트랜시버 및 AOC 케이블. 이 제품 라인은 고성능 112Gbps VCSEL 레이저 및 7nm DSP를 특징으로 하며 채널당 112Gbps PAM4 신호의 전기 호스트 인터페이스와 CMIS 4.0을 지원합니다.

아이 다이어그램 및 민감도 메트릭

채널당 TDECQ가 3dB 미만입니다. OMA RXsen 감도는 -5.2dBm @ 2.4E-4 Pre-FEC 53.125GBd를 충족합니다.

아이 다이어그램 및 민감도 메트릭

전송 거리

400G OSFP SR4는 30미터(OM3 MMF) 및 50미터(OM4 MMF)를 지원합니다.

800G OSFP SR8는 60미터(OM3 MMF) 및 100미터(OM4 MMF)를 지원합니다.

패키지 종류

400G/800G 광 모듈은 QSFP-DD와 OSFP를 모두 지원합니다.

전력 소비 설계

800G 광 모듈/AOC의 전력 소비는 14가지 온도 테스트에서 400W 미만이고, 8G 광 모듈/AOC의 전력 소비는 XNUMXW 미만입니다.

이 시리즈의 전체 제품 포트폴리오는 다음과 같습니다.

800G(8×112G) 멀티모드 제품군

  • 800G OSFP SR8 (이중 MPO12/APC 또는 MPO16/APC)
  • 800G QSFP-DD AOC
  • 800G QSFP-DD SR8(MPO16/APC)

400G(4×112G) 다중 모드 제품 라인

FiberMall 최초의 800G 활성 구리 케이블, 800G OSFP ACC, 고속 데이터 센터 및 AI 고성능 컴퓨팅 애플리케이션에 전원을 공급합니다.

FiberMall의 800G OSFP DAC/ACC OSFP MSA 및 IEEE802.3ck 사양을 준수하고 16쌍의 구리 케이블을 사용하여 8GB/s에서 112채널 양방향 전송을 지원하고 이전 버전과의 호환성을 달성합니다. 800G OSFP DAC 최대 지원 길이가 2m인 것에 비해 ACC 전송 거리는 4~5m를 지원하며 일반적인 단거리 상호 연결 케이블 요구 사항을 충족할 수 있으며 제품 특징은 다음과 같습니다.

800G OSFP ACC

44GHZ에서 탁월한 SI 성능과 우수한 일관성을 제공합니다.

44GHZ에서 탁월한 SI 성능과 우수한 일관성을 제공합니다.
  • 800G 네트워크 테스터에서 KP4-FEC를 켜면 테스트는 IEEE 자동 협상 및 링크 교육 요구 사항을 충족하며 Post-FEC BER<1E-15 및 FEC 마진은 27%보다 좋으며 FEC 프레임 손실 비율은 0입니다. 전체 과정.
  • 이 제품은 일반 전력 소비가 약 2.5W이고 지연 시간이 20ns 미만인 Re-Driver 솔루션을 채택합니다. 균등화 및 신호 대 잡음비 균형은 매우 중요하며 전력 소비 및 지연 측면에서 Re-Timer 솔루션보다 훨씬 뛰어납니다.
  • 혁신적인 생산 공정을 채택하여 신뢰성이 좋으며 800G OSFP ACC 26AWG 4m의 무게는 약 600g에 불과합니다.

FiberMall은 다양한 400G/800G DAC/ACC/AOC/광 트랜시버 모듈을 출시했습니다. 언제든지 문의하세요!

코멘트 남김

위쪽으로 스크롤