AI 칩부터 궁극의 CPO 포지셔닝 경쟁까지: NVIDIA vs. Broadcom 기술 로드맵 대결

인공지능(AI)과 머신러닝이 주도하는 시대에 전 세계 데이터 트래픽은 기하급수적으로 증가하고 있습니다. 데이터 센터 서버와 스위치는 200G 및 400G 연결에서 800G, 1.6T, 그리고 잠재적으로 3.2T 속도로 빠르게 전환되고 있습니다.

시장조사기관 트렌드포스(TrendForce)는 400G를 초과하는 광 트랜시버 모듈의 전 세계 출하량이 2023년 6.4만 대, 2024년 약 20.4만 대, 2025년 31.9만 대를 넘어 전년 대비 56.5% 성장할 것으로 전망했습니다. AI 서버 수요는 800G 및 1.6T 모듈의 확장을 지속적으로 촉진하는 반면, 기존 서버 업그레이드는 400G 광 트랜시버 요구 사항.

추가 조사에 따르면 2026년 1.6T 광 모듈 수요는 예상치를 크게 상회할 것으로 예상되며, 총 출하량은 11만 대에 이를 것으로 예상됩니다. 주요 성장 동력으로는 NVIDIA와 Google의 적극적인 구매와 Meta, Microsoft, AWS의 적극적인 지원이 있습니다.

높은 대역폭, 낮은 손실, 그리고 장거리 기능을 갖춘 광통신은 랙 내부 및 랙 간 상호 연결을 위한 주요 솔루션으로 자리매김하고 있으며, 광 트랜시버 모듈은 데이터 센터 연결의 핵심 구성 요소로 자리매김하고 있습니다. TrendForce는 향후 AI 서버 데이터 전송에 방대한 양의 고속 광 트랜시버 모듈이 필요할 것이라고 강조합니다. 이러한 모듈은 전기 신호를 광 신호로 변환하여 광섬유로 전송하고, 수신된 광 신호를 다시 전기 신호로 변환합니다.

01 광트랜시버 모듈, 광통신, 실리콘 포토닉스의 관계는 무엇인가?

원래 그림의 처음 두 다이어그램을 기준으로 현재 시장에 출시된 플러그형 광 트랜시버는 최대 속도를 달성합니다. 800G다음 단계에서는 ASIC 칩 패키지 주변에 설치된 광학 엔진(Optical Engine, OE)을 사용하는데, 이를 On-Board Optics(OBO)라고 하며 최대 1.6T의 전송을 지원합니다.

업계는 광 부품을 ASIC과 함께 패키징하는 Co-Packaged Optics(CPO) 기술로의 발전을 목표로 합니다. 이 기술은 3.2T를 초과하는 최대 12.8T의 속도를 구현합니다. 궁극적인 목표는 12.8T 이상의 전송 속도로 완전한 광 네트워크 수준의 성능을 구현하는 "광 I/O"입니다.

그림을 자세히 살펴보면 광통신 모듈(이전에는 플러그형이었으며 노란색 블록으로 표시됨)이 ASIC에 점점 더 가까이 배치되어 있음을 알 수 있습니다. 이러한 근접성은 전기 신호 경로를 단축하여 더 높은 대역폭을 가능하게 합니다. 실리콘 포토닉스 공정 기술은 광 부품을 칩에 직접 통합합니다.

현재 시중에 나와 있는 플러그형 광 트랜시버는 최대 800G의 속도를 달성합니다.

02 광통신 수요 폭발적 증가: 업계, 3가지 서버 아키텍처 확장에 집중

AI 애플리케이션 붐으로 고속 광통신 수요가 급격히 증가했습니다. 서버는 주로 스케일업(수직적 확장)과 스케일아웃(수평적 확장)을 강조하며, 각각 고유한 전송 요구와 기술적 과제를 해결합니다. 최근 NVIDIA는 "스케일어크로스(Scale-Across)" 개념을 도입하여 업계의 고려 사항에 새로운 차원을 더했습니다.

확장

스케일업(Scale-Up)은 일반적으로 전송 거리가 10미터 미만인 고속 랙 내부 상호 연결(그림의 노란색 부분)에 중점을 둡니다. 초저지연성 요건은 광-전기 변환으로 인한 지연 및 전력 소모를 방지하기 위해 "구리 상호 연결"을 선호합니다. 현재 솔루션에는 NVIDIA의 NVLink(독점 아키텍처)와 AMD 등이 주도하는 개방형 표준인 UALink가 있습니다.

특히 NVIDIA는 올해 NVLink Fusion을 출시하여 NVLink 기술을 외부 칩 공급업체에 처음으로 공개했습니다. 이를 통해 NVLink는 단일 서버 노드에서 랙 스케일 아키텍처로 확장될 수 있으며, 이는 UALink와의 경쟁에 대응하기 위한 것으로 보입니다.

전통적으로 스케일아웃(Scale-Out)에 집중해 온 브로드컴(Broadcom)이 이더넷을 통해 스케일업(Scale-Up) 시장에 진출하고 있습니다. 브로드컴은 최근 스케일업 이더넷(SUE) 표준을 준수하는 여러 칩을 출시했습니다. 이러한 발전은 향후 엔비디아와 브로드컴 간의 경쟁 구도를 형성할 토대를 마련하며, 이에 대해서는 추후 자세히 설명하겠습니다.

확장형

스케일아웃(Scale-Out)은 서버(그림의 파란색 부분) 간 대규모 병렬 컴퓨팅을 지원하여 높은 처리량 데이터 처리와 무한한 확장성을 제공합니다. 광 통신이 이 분야에서 주도적인 역할을 하며, InfiniBand와 이더넷을 포함한 주요 상호 연결 기술이 광 모듈 시장을 주도하고 있습니다.

InfiniBand와 이더넷은 두 개의 주요 진영으로 나뉜다. 전자는 NVIDIA와 Microsoft가 선호하는 반면, 후자는 Broadcom, Google, AWS가 선호한다.

InfiniBand의 리더십은 2019년 엔비디아가 엔드투엔드 이더넷 및 InfiniBand 지능형 상호연결 공급업체로 인수한 멜라녹스에서 비롯되었습니다. 최근 중국은 엔비디아가 이 인수에서 독점 금지법을 위반했다고 판결했습니다. 엔비디아는 다양한 InfiniBand 제품뿐만 아니라 NVIDIA Spectrum-X와 같은 이더넷 솔루션도 제공하며 두 시장을 모두 장악하고 있습니다.

반대 진영(인텔, AMD, 브로드컴 등)은 2023년 7월 향상된 이더넷 전송 스택을 개발하기 위해 Ultra Ethernet Consortium(UEC)을 결성하여 InfiniBand에 도전했습니다.

TrendForce의 분석가인 Chu Yu-chao는 Scale-Out이 주도하는 광통신 모듈 시장이 미래 데이터 전송의 핵심 전장이라고 말했습니다.

규모에 따른

새로운 솔루션으로 NVIDIA는 수 킬로미터가 넘는 장거리 데이터 센터 간 연결을 위한 "Scale-Across"를 제안했습니다. 여러 데이터 센터를 연결하기 위해 이더넷 기반 Spectrum-XGS 이더넷을 출시했습니다.

Spectrum-XGS는 AI 컴퓨팅을 위한 스케일업 및 스케일아웃을 넘어 세 번째 핵심 요소로 기능합니다. Spectrum-XGS는 Spectrum-X 이더넷의 성능과 확장성을 확장하여 분산된 데이터 센터를 상호 연결하고, 대용량 데이터 세트를 AI 모델로 스트리밍하며, 센터 내 GPU 간 통신을 조정합니다.

이 솔루션은 Scale-Out과 크로스 도메인 확장을 결합하여 거리에 따라 부하 분산과 알고리즘을 유연하게 조정하며 Scale-Across에 맞춰 조정합니다.

NVIDIA 창립자 겸 CEO인 젠슨 황은 "스케일업 및 스케일아웃 기능을 기반으로 스케일어크로스를 추가하여 도시, 국가, 대륙 전반에 걸쳐 데이터 센터를 연결하고 대규모 슈퍼 AI 팩토리를 구축할 수 있습니다."라고 밝혔습니다.

업계 동향에 따르면 스케일업(Scale-Up)과 스케일아웃(Scale-Out)은 경쟁 영역으로, 엔비디아(NVIDIA)와 브로드컴(Broadcom)이 시장 점유율을 두고 경쟁하고 있습니다. 엔비디아의 스케일어크로스(Scale-Across)는 수 킬로미터에서 수천 킬로미터에 달하는 데이터 센터 간 전송을 목표로 합니다. 브로드컴은 이와 유사한 솔루션을 제공합니다.

03 AI 칩 CPO 포지셔닝 전쟁: NVIDIA와 Broadcom은 정확히 무엇을 놓고 경쟁하고 있을까?

엔비디아 대 브로드컴

광통신과 3가지 데이터 센터 확장 아키텍처를 이해하면 시장이 AMD뿐만 아니라 AI 칩 선두주자인 NVIDIA와 통신 칩 거대 기업인 Broadcom 간의 경쟁에도 주목하고 있다는 것을 알 수 있습니다.

AI 산업의 경쟁은 이제 칩 수준을 넘어 시스템 수준 솔루션으로 확대되었습니다.

브로드컴과 엔비디아의 첫 번째 접점은 "맞춤형 AI 칩"(ASIC)입니다. 엔비디아 GPU는 가격이 비싸기 때문에 구글, 메타, 아마존, 마이크로소프트와 같은 클라우드 서비스 제공업체(CSP)는 자체 AI 칩을 개발하며, 주로 브로드컴과 협력하여 ASIC 전문 기술을 확보합니다.

주요 CSP 자체 개발 칩

CSP구글AWS메타Microsoft
프로덕트TPU v6 트릴리움트레니엄 v2、트레니엄 v3MTIA、MTIA v2마이아、마이아 v2
공동 패키지 파트너Broadcom 、 United Developers (TPU v7e)Marvell(Trainium v2) 、 ChipCore-KY(Trainium v3)브로드 컴크리에이티브 인텐트(Maia v2) 、마벨(Maia v2 Advanced Edition)

두 번째로 더 중요한 교차점은 "네트워크 연결 기술"입니다.

Broadcom은 NVLink와 CUDA를 활용하여 Scale-Up 분야에서 올해 Tomahawk Ultra 네트워크 스위치 칩을 출시하여 시장에 진출하고 NVLink의 지배력에 도전할 예정입니다.

토마호크 울트라는 브로드컴의 스케일업 이더넷(SUE) 이니셔티브의 일환으로, NVSwitch의 대안으로 자리매김했습니다. TSMC의 5nm 공정으로 제조된 NVLink 스위치보다 4배 더 많은 칩을 연결합니다.

Broadcom은 UALink 컨소시엄에 참여하고 있지만 이더넷 기반 SUE를 홍보하고 있으며, 이로 인해 NVLink에 대한 UALink와의 경쟁-협력 역학에 대한 의문이 제기되고 있습니다.

브로드컴에 대응하기 위해 엔비디아는 NVFusion을 출시하여 미디어텍, 마벨, 아스테라 랩스와 같은 파트너들과 NVLink 생태계를 통한 맞춤형 AI 칩 개발을 위한 협업을 시작했습니다. 이러한 준개방형 접근 방식은 맞춤형 솔루션을 제공하는 동시에 생태계를 강화합니다.

엔비디아 NV링크

스케일 아웃(Scale-Out) 분야에서는 이더넷 분야의 베테랑인 Broadcom이 Tomahawk 6과 Jericho4와 같은 제품으로 시장을 장악하고 있으며, 스케일 아웃과 장거리를 타깃으로 삼고 있습니다.

엔비디아는 더 넓은 스케일아웃(Scale-Out) 커버리지를 위해 퀀텀 인피니밴드(Quantum InfiniBand) 스위치와 스펙트럼 이더넷(Spectrum Ethernet) 플랫폼으로 대응합니다. 인피니밴드는 개방형이지만, 엔비디아의 멜라녹스 인수로 인해 생태계가 크게 좌우되어 고객의 유연성이 제한됩니다.

브로드컴-토마호크-울트라-및-토마호크-6-스케일

Broadcom의 이미지에 따르면, 세 가지 제품이 두 가지 서버 확장 아키텍처에 걸쳐 있습니다.

장거리 Scale-Across의 경우, 선두는 불확실하지만 NVIDIA는 Spectrum-XGS로 선두를 달리고 있습니다. 이 솔루션은 효율적인 장거리 데이터 이동을 위해 새로운 네트워크 알고리즘을 사용하여 기존 솔루션을 보완합니다. 스케일업과 스케일아웃.

Broadcom의 Jericho4는 Scale-Across를 준수하며, 무손실 RoCE 전송을 통해 100km 이상의 사이트 간 연결을 처리합니다. 이는 이전 세대 용량의 4배에 달하는 수치입니다. Tomahawk 시리즈는 1km(약 0.6마일) 미만의 데이터 센터 내부 랙 연결을 처리합니다.

확장 아키텍처NVIDIA브로드 컴AMD
확장장애물 해결: NVLink(폐쇄형 아키텍처) 、 NVFusion(반폐쇄형)UALink(개방형 아키텍처) 、 SUEUALink(개방형 아키텍처)
 솔루션 계획: NVLink 플랫폼, NVSwitch 플랫폼, NVFusion 솔루션 구성토마호크 울트라、토마호크 6(TH6)Infinity Fabric(이미 UALink에 통합됨)
확장형장애물 해결: InfiniBand 장애、기존 이더넷 제품UEC(이더넷 장애물)UEC
 솔루션 계획: Quantum InfiniBand 플랫폼, Spectrum-X/ Spectrum Z, Too-네트워크 스위칭 플랫폼토마호크 6、제리코4 
규모에 따른솔루션 계획: 스펙트럼-XGS여리고4 

04 NVIDIA와 Broadcom의 CPO 솔루션?

네트워크 전송 경쟁이 치열해짐에 따라 광 네트워크 경쟁도 심화될 것입니다. NVIDIA와 Broadcom은 CPO 광통신 혁신을 추진하고 있으며, TSMC와 GlobalFoundries는 관련 공정을 개발하고 있습니다.

엔비디아의 전략은 광 인터커넥트를 추가 모듈이 아닌 SoC의 일부로 간주합니다. 올해 GTC에서 엔비디아는 Quantum-X Photonics InfiniBand 스위치(연말 출시)와 Spectrum-X Photonics Ethernet 스위치(2026년 출시)를 공개했습니다.

두 플랫폼 모두 TSMC의 SoIC-X 패키징 기반 COUPE를 사용하며, 65nm 광자 집적 회로(PIC)와 전자 집적 회로(EIC)를 통합했습니다. 이는 효율성과 확장성을 위한 플랫폼 통합을 강조합니다.

브로드컴은 제3자 고객을 위한 포괄적이고 확장 가능한 공급망 솔루션에 중점을 두고 있습니다. CPO 부문의 성공은 반도체-광학 통합 분야의 심층적인 전문성에서 비롯됩니다.

브로드컴은 3세대 200G/레인 CPO를 출시했습니다. 65nm PIC와 7nm EIC를 사용한 3D 칩 적층 기술을 사용합니다.

그림에서 볼 수 있듯이, 광 송수신 모듈은 레이저 다이오드(광원), 변조기(전기-광 변환), 그리고 광 검출기라는 핵심 구성 요소로 구성됩니다. 변조기는 차선별 속도를 결정합니다.

광자 엔진 모듈의 내부 구성 요소

구성 요소 이름함수
광검출기(PD, Photodetector)광신호를 수신합니다.
도파관(Waveguide)빛이 전파될 수 있는 경로를 제공합니다.
광 변조기(Optical Modulator)전기 신호 입력 조건 하에서 전기 신호를 광 신호로 변환합니다.
트랜스임피던스 증폭기(TIA, Transimpedance Amplifier)전류 신호를 증폭하고 동시에 전류 신호를 전압으로 변환합니다.
드라이버 IC(Driver IC)광 변조기에 필요한 전기 신호를 제공합니다.
스위치(Switch)라우팅, 전기 신호 전환을 처리하고 어떤 트랙에서 출력할지 할당합니다.

NVIDIA는 소형이지만 오류와 온도에 민감하여 통합에 어려움이 있는 Micro-Ring Modulators(MRM)를 선택했습니다.

Broadcom은 MRM을 개발하는 동안 성숙한 Mach-Zehnder Modulator(MZM)를 사용하고, 3nm 공정 시험을 달성하고 칩 스태킹을 통해 CPO를 선도하고 있습니다.

광자공학의 핵심은 변조기입니다

AI 추론이 확대됨에 따라, 관심은 "컴퓨팅 파워 경쟁"에서 "데이터 전송 속도"로 옮겨가고 있습니다. 브로드컴의 네트워크/스위치 중심 전략과 엔비디아의 엔드투엔드 솔루션 중 어느 쪽이 효율성과 지연 시간 장벽을 돌파할지가 차기 AI 경쟁의 선두 주자가 될 것입니다.

위쪽으로 스크롤