От чипов ИИ до решающей битвы за позиционирование CPO: противостояние технологических планов NVIDIA и Broadcom

В эпоху искусственного интеллекта (ИИ) и машинного обучения глобальный трафик данных растёт экспоненциально. Серверы и коммутаторы центров обработки данных быстро переходят с подключений 200G и 400G на скорости 800G, 1.6T и, возможно, даже 3.2T.

Аналитическая компания TrendForce прогнозирует, что мировые поставки оптических приёмопередающих модулей, превышающих 400G, достигнут 6.4 млн единиц в 2023 году, около 20.4 млн в 2024 году и превысят 31.9 млн к 2025 году, что отражает годовой рост на 56.5%. Спрос на ИИ-серверы продолжает стимулировать расширение рынка модулей 800G и 1.6T, в то время как модернизация традиционных серверов стимулирует Оптический трансивер 400G запросам наших потенциальных клиентов.

Дальнейшие исследования показывают, что спрос на оптические модули 1.6 Тл в 2026 году значительно превысит ожидания, а общий объём поставок, по прогнозам, достигнет 11 миллионов единиц. Основными драйверами роста являются активные закупки со стороны NVIDIA и Google, а также вклады Meta, Microsoft и AWS.

Оптическая связь, благодаря своей высокой пропускной способности, низким потерям и возможности передачи данных на большие расстояния, всё чаще становится основным решением для внутри- и межстоечных соединений, позиционируя оптические приёмопередающие модули как критически важные компоненты связи в центрах обработки данных. TrendForce подчёркивает, что в будущем для передачи данных на серверах искусственного интеллекта потребуется огромное количество высокоскоростных оптических приёмопередающих модулей. Эти модули преобразуют электрические сигналы в оптические для передачи по оптоволокну и обратно преобразуют полученные оптические сигналы в электрические.

01 Какова взаимосвязь между оптическими приемопередающими модулями, оптической связью и кремниевой фотоникой?

На основании первых двух диаграмм на исходном рисунке, современные подключаемые оптические приемопередатчики на рынке достигают скоростей до 800G. Следующий этап включает в себя оптические двигатели (Optical Engine, OE), установленные вокруг корпусов микросхем ASIC, известных как бортовая оптика (OBO), поддерживающая передачу данных со скоростью до 1.6 Тл.

Отрасль стремится перейти к технологии Co-Packaged Optics (CPO), где оптические компоненты размещаются в корпусах ASIC. Эта технология обеспечивает скорости от 3.2 до 12.8 Тбит/с. Конечная цель — «оптический ввод-вывод», достижение полноценных возможностей оптических сетей со скоростями передачи данных свыше 12.8 Тбит/с.

При внимательном рассмотрении рисунка видно, что оптический модуль связи (ранее подключаемый, показан жёлтым блоком) располагается всё ближе к ASIC. Такое расположение сокращает пути прохождения электрических сигналов, обеспечивая более высокую пропускную способность. Технология кремниевой фотоники позволяет интегрировать оптические компоненты непосредственно в кристаллы.

Современные подключаемые оптические трансиверы на рынке достигают скорости до 800G

02 Взрывной рост спроса на оптические коммуникации: отрасль фокусируется на трех расширениях серверной архитектуры

Рост популярности приложений искусственного интеллекта (ИИ) значительно увеличил спрос на высокоскоростную оптическую связь. В серверах особое внимание уделяется вертикальному (Scale Up) и горизонтальному (Scale Out) масштабированию, каждый из которых решает различные задачи передачи данных и технические задачи. Недавно NVIDIA представила концепцию «Scale-Across», добавив новое измерение в отраслевые концепции.

Увеличить масштаб

Масштабирование ориентировано на высокоскоростные внутристоечные соединения (жёлтый участок на рисунке) с дальностью передачи данных, как правило, менее 10 метров. Требования к сверхнизкой задержке благоприятствуют использованию «медных соединений», позволяющих избежать задержек и энергопотребления, связанных с оптико-электрическими преобразованиями. В настоящее время решения включают NVLink от NVIDIA (собственная архитектура) и открытый стандарт UALink, разработанный AMD и другими компаниями.

В частности, в этом году NVIDIA запустила NVLink Fusion, впервые открыв технологию NVLink для внешних поставщиков чипов. Это расширяет возможности NVLink с односерверных узлов до стоечных архитектур, возможно, в ответ на конкуренцию со стороны UALink.

Компания Broadcom, традиционно ориентированная на масштабирование вширь, выходит на рынок масштабирования вширь через Ethernet. Недавно компания представила несколько чипов, совместимых со стандартами масштабирования вширь (Scale-Up Ethernet, SUE). Эта разработка закладывает основу для будущей конкуренции между NVIDIA и Broadcom, о которой мы поговорим далее.

Масштабирование

Масштабируемость обеспечивает масштабные параллельные вычисления на нескольких серверах (синяя область на рисунке), обеспечивая высокую пропускную способность данных и неограниченную масштабируемость. Здесь доминирует оптическая связь, а ключевые технологии межсоединений, включая InfiniBand и Ethernet, являются движущей силой рынка оптических модулей.

InfiniBand и Ethernet образуют два основных лагеря: первый предпочитают NVIDIA и Microsoft, второй — Broadcom, Google и AWS.

Лидерство InfiniBand основано на компании Mellanox, приобретённой NVIDIA в 2019 году в качестве поставщика сквозных Ethernet-решений и интеллектуальных соединений InfiniBand. Недавно Китай постановил, что NVIDIA нарушила антимонопольное законодательство в связи с этим приобретением. NVIDIA предлагает множество продуктов InfiniBand, а также Ethernet-решения, такие как NVIDIA Spectrum-X, охватывая оба рынка.

Противоположный лагерь — Intel, AMD, Broadcom и другие — в июле 2023 года сформировал консорциум Ultra Ethernet (UEC) для разработки усовершенствованных стеков передачи Ethernet, бросив вызов InfiniBand.

Аналитик TrendForce Чу Юй-чао утверждает, что рынок оптических модулей связи, движимый технологией Scale-Out, представляет собой основное поле битвы за будущую передачу данных.

Масштаб-в-ширине

В качестве нового решения NVIDIA предложила технологию «Scale-Across» для соединений между центрами обработки данных на большие расстояния, превышающие несколько километров. Компания выпустила Spectrum-XGS Ethernet на базе Ethernet для соединения нескольких центров обработки данных.

Spectrum-XGS выступает в качестве третьего столпа, помимо вертикального и горизонтального масштабирования вычислений на базе ИИ. Он расширяет производительность и масштабируемость Spectrum-X Ethernet, соединяя распределённые центры обработки данных, передавая большие наборы данных в модели ИИ и координируя взаимодействие между графическими процессорами внутри центров.

Это решение сочетает в себе масштабирование вширь с кросс-доменным расширением, гибко настраивая балансировку нагрузки и алгоритмы на основе расстояния, что соответствует масштабированию вширь.

Основатель и генеральный директор NVIDIA Дженсен Хуанг заявил: «Основываясь на возможностях масштабирования вверх и вниз, мы добавляем масштабирование в поперечном направлении для соединения центров обработки данных в городах, странах и континентах, создавая огромные суперфабрики ИИ».

Тенденции отрасли показывают, что вертикальное и горизонтальное масштабирование — это спорные территории, где NVIDIA и Broadcom борются за долю рынка. Технология NVIDIA Scale-Across ориентирована на передачу данных между центрами обработки данных на расстояния от нескольких километров до тысяч километров. Broadcom предлагает аналогичные решения.

03 Передача ИИ-чипов в войну позиционирования CPO: за что именно конкурируют NVIDIA и Broadcom?

NVIDIA против Broadcom

Понимание оптической связи и трех архитектур расширения центров обработки данных проясняет, что рынок следит не только за AMD, но и за соперничеством между лидером на рынке ИИ-чипов NVIDIA и гигантом коммуникационных чипов Broadcom.

Конкуренция в отрасли искусственного интеллекта теперь выходит за рамки чипов и охватывает решения на системном уровне.

Первая область пересечения Broadcom и NVIDIA — это «специальные микросхемы ИИ» (ASIC). Поскольку графические процессоры NVIDIA дороги, поставщики облачных услуг (CSP), такие как Google, Meta, Amazon и Microsoft, разрабатывают собственные микросхемы ИИ, сотрудничая преимущественно с Broadcom в сфере ASIC.

Основные микросхемы собственной разработки CSP

CSPGoogleAWSМетаMicrosoft
ПродуктTPU v6 ТриллиумTrainium v2 、 Trainium v3MTIA 、 MTIA v2Maia 、 Maia v2
Партнер по совместной работеBroadcom, United Developers (TPU v7e)Marvell (Trainium v2) 、 ChipCore-KY (Trainium v3)BroadcomCreative Intent (Maia v2) 、 Marvell (Maia v2 Advanced Edition)

Вторым, более важным пересечением являются «технологии сетевого подключения».

В рамках Scale-Up, под защитой NVLink и CUDA, в этом году Broadcom выпускает сетевой коммутатор Tomahawk Ultra, чтобы выйти на рынок и бросить вызов доминированию NVLink.

Tomahawk Ultra является частью инициативы Broadcom Scale-Up Ethernet (SUE) и позиционируется как альтернатива NVSwitch. Он подключает в четыре раза больше чипов, чем NVLink Switch, изготовленный по 5-нм техпроцессу TSMC.

Broadcom участвует в консорциуме UALink, но продвигает SUE на базе Ethernet, что вызывает вопросы относительно динамики ее конкуренции и сотрудничества с UALink против NVLink.

В ответ на Broadcom NVIDIA представила платформу NVFusion, открыв сотрудничество с такими партнёрами, как MediaTek, Marvell и Astera Labs, для разработки собственных ИИ-чипов через экосистему NVLink. Этот полуоткрытый подход укрепляет экосистему, предлагая при этом возможности кастомизации.

NVIDIA NVLINK

В области горизонтального масштабирования лидирует ветеран Ethernet-технологий Broadcom с такими продуктами, как Tomahawk 6 и Jericho4, нацеленными на горизонтальное масштабирование и большие расстояния.

NVIDIA предлагает коммутаторы Quantum InfiniBand и платформы Spectrum Ethernet для более широкого горизонтального охвата. Несмотря на открытость InfiniBand, его экосистема в значительной степени контролируется приобретённой NVIDIA компанией Mellanox, что ограничивает гибкость для клиентов.

Broadcom-Tomahawk-Ultra-and-Tomahawk-6-scaled

Согласно изображению Broadcom, три продукта охватывают две архитектуры расширения сервера.

В области масштабирования на большие расстояния лидерство неясно, но NVIDIA лидирует со Spectrum-XGS. Она использует новые сетевые алгоритмы для эффективной передачи данных на большие расстояния, дополняя Масштабирование вверх и вниз.

Jericho4 от Broadcom совместим с Scale-Across, обеспечивая передачу данных между площадками на расстояние более 100 км с передачей данных RoCE без потерь, что в четыре раза превышает возможности предыдущего поколения. Серия Tomahawk обеспечивает передачу данных внутри стоечных соединений в центрах обработки данных на расстояние менее 1 км (около 0.6 мили).

Архитектура расширенияNVIDIABroadcomAMD
Увеличить масштабРешение препятствий: NVLink (закрытая архитектура) 、 NVFusion (полузакрытая архитектура)UALink (открытая архитектура) 、 SUEUALink (открытая архитектура)
 Схема решения: Платформа NVLink, Платформа NVSwitch, Схема решения NVFusionTomahawk Ultra 、 Tomahawk 6 (TH6)Infinity Fabric (уже интегрирована в UALink)
МасштабированиеРешение препятствий: Препятствие InfiniBand 、 Существующие продукты EthernetUEC (препятствие Ethernet)УЭК
 Схема решения: Платформа Quantum InfiniBand, Spectrum-X/ Spectrum Z, Платформа коммутации Too-networkTomahawk 6 、 Jericho4 
Масштаб-в-ширинеСхема решения: Spectrum-XGSИерихон4 

04 Решения NVIDIA и Broadcom CPO?

По мере обострения борьбы за сетевую передачу данных конкуренция в оптических сетях будет обостряться. NVIDIA и Broadcom стремятся к инновациям в области оптической связи CPO, а TSMC и GlobalFoundries разрабатывают соответствующие процессы.

Стратегия NVIDIA рассматривает оптические межсоединения как часть SoC, а не как дополнительные модули. На конференции GTC этого года компания представила коммутаторы Quantum-X Photonics InfiniBand (выпуск в конце года) и коммутаторы Spectrum-X Photonics Ethernet (выпуск в 2026 году).

Обе платформы используют процессоры COUPE от TSMC в корпусе SoIC-X, интегрирующие 65-нм фотонные интегральные схемы (PIC) и электронные интегральные схемы (EIC). Это обеспечивает интеграцию платформ для повышения эффективности и масштабируемости.

Компания Broadcom специализируется на комплексных масштабируемых решениях для управления цепочками поставок для сторонних клиентов. Успех компании в области CPO обусловлен глубокими знаниями в области интеграции полупроводников и оптических технологий.

Компания Broadcom выпустила CPO третьего поколения со скоростью 200 Гбит/с. В нём используется 3D-структура чипов: 65-нм PIC и 7-нм EIC.

Как показано на рисунке, оптические приёмопередающие модули состоят из ключевых компонентов: лазерных диодов (источников света), модуляторов (преобразователей электрического сигнала в оптический) и фотодетекторов. Модуляторы определяют скорость движения по каждой полосе.

Внутренние компоненты модулей фотонных двигателей

Название компонентаФункция
Фотодетектор (ФД, Фотодетектор)Принимает оптические сигналы.
Волновод (Волновод)Обеспечивает пути распространения света.
Оптический модулятор (Оптический модулятор)В условиях подачи электрического сигнала преобразует электрические сигналы в оптические.
Трансимпедансный усилитель (TIA, трансимпедансный усилитель)Усиливает токовые сигналы и одновременно преобразует токовые сигналы в напряжение.
Драйвер ИС (драйвер ИС)Обеспечивает электрические сигналы, необходимые оптическому модулятору.
Переключатель (Переключатель)Управляет маршрутизацией, переключением электрических сигналов и определяет, с какой дорожки производить вывод.

NVIDIA выбирает микрокольцевые модуляторы (MRM) — компактные, но чувствительные к ошибкам и температуре, что создает проблемы при интеграции.

Broadcom использует проверенные временем модуляторы Маха-Цендера (MZM) при разработке MRM, реализуя испытания 3-нм процесса и лидируя в области CPO за счет стекирования кристаллов.

В основе фотоники лежит модулятор

На фоне расширения возможностей искусственного интеллекта фокус смещается с «гонки за вычислительную мощность» на «скорость передачи данных». Что превзойдет ожидания в преодолении барьеров эффективности и задержек — сетевые решения Broadcom и коммутации или комплексные решения NVIDIA. Это определит следующего лидера соревнований в области искусственного интеллекта.

Наверх