Аппаратное обеспечение для вычислений на основе искусственного интеллекта: ConnectX-8 SuperNIC

Обзор продукта

ConnectX-8 SuperNIC — это интеллектуальная сетевая интерфейсная карта NVIDIA седьмого поколения, разработанная для вычислительных кластеров ИИ следующего поколения, крупномасштабных центров обработки данных и сценариев высокопроизводительных вычислений (HPC). Она глубоко интегрирует возможности ускорения сети и разгрузки вычислений, обеспечивая сверхскоростную поддержку 400GbE/800GbE. Благодаря разгрузке протоколов на аппаратном уровне и совместной оптимизации GPU-NIC она значительно снижает задержку сети и повышает эффективность пропускной способности, предлагая сверхнизкую задержку и возможности передачи данных по сети без потерь для обучения ИИ, вывода и сценариев распределенного хранения.

ConnectX-8 SuperNIC

Программные протоколы и функции ускорения

ConnectX-8 SuperNIC оптимизирует производительность сети полного стека за счет тесного взаимодействия программного стека протоколов и механизма аппаратного ускорения:

Поддержка протокола

  • RDMA/RoCEv2: на основе конвергентного Ethernet для удаленного прямого доступа к памяти, обеспечивающего передачу данных без копирования с задержкой всего в доли микросекунды.
  • Технология GPUDirect: поддерживает GPUDirect RDMA и GPUDirect Storage, обеспечивая прямое взаимодействие данных между графическим процессором и хранилищем/сетевой картой, минуя центральный процессор.
  • NVIDIA SHARPv3: агрегированное аппаратное ускорение связи с поддержкой AllReduce, Broadcast и других операций для повышения эффективности обучения ИИ.
  • Аппаратная разгрузка TLS/IPsec: поддерживает полное шифрование и дешифрование трафика без потери производительности.

Программная экосистема

  1. DOCA 2.0 (архитектура инфраструктуры центра обработки данных на кристалле): предоставляет среду разработки на основе API, поддерживающую определяемые пользователем функции ускорения плоскости данных (например, совместную оркестровку DPU).
  2. Глубокая интеграция с экосистемой CUDA: оптимизирует эффективность межузловой связи между несколькими GPU с помощью библиотеки NCCL.
Программные протоколы и функции ускорения

Архитектура оборудования и проектирование подключений

Host Interface

PCIe 5.0 x16, теоретическая пропускная способность 128 ГБ/с, полностью раскрывающая производительность сети 400G/800G.

Сетевой интерфейс

Поддерживает однопортовый 800GbE OSFP112 или двухпортовый 400GbE QSFP112 гибкие конфигурации.

Обратная совместимость со скоростями 200GbE/100GbE, адаптация к существующей инфраструктуре.

Встроенный в чип механизм ускорения

Интегрирует специализированные микросхемы ASIC, поддерживающие управление таблицами потоков, контроль перегрузки (DCQCN), проверку пакетов и другие виды полной аппаратной разгрузки.

400G QSFP112

Сетевая архитектура и возможности подключения

ConnectX-8 SuperNIC поддерживает многоуровневую архитектуру сетей CLOS, создавая высокоскоростные, неблокируемые вычислительные кластеры ИИ.

Соединение с одним узлом

На каждом сервере установлено 1–2 сетевых адаптера ConnectX-8, соединенных с хостом через PCIe 5.0.

Каждый порт подключается непосредственно к коммутатору Leaf через оптоволоконный кабель QSFP-DD, образуя двойное резервирование восходящего канала.

Кластерная сеть

  1. Leaf Switch: серия NVIDIA Quantum-3 (800G) или серия Spectrum-4 (400G), поддерживающая RoCEv2 и адаптивную маршрутизацию.
  2. Spine Switch: полностью взаимосвязан с leaf-коммутаторами через высокоскоростные порты 800G, обеспечивая неблокируемую полосу пропускания.
  3. Архитектура «позвоночник-лист»
  4. Прямое сетевое взаимодействие графических процессоров: многоузловые графические процессоры обеспечивают прямой доступ к межузловой памяти через RDMA, образуя распределенный учебный кластер.
Сетевая архитектура и возможности подключения

Выбор оптических модулей и волокна

Оптические модули

Сценарии 800G: OSFP112 800G-SR8/VR8 (многомодовый, 100 м) / 800G-DR8 (одномодовый, 500 м).

ОСФП-800G-DR8D

Сценарии 400G: QSFP112 400G-VR4/SR4/DR4.

Типы волокна:

КСФП112 400Г СР4

Многомодовый (MMF): OM5/OM4 (850 нм, поддержка 400G-SR8 до 100 м).

Одномодовый (SMF): OS2 (1310 нм/1550 нм, поддерживает передачу на расстояние более 10 км).

Типы волокон
спецификация продукта

Совместимые коммутаторы и сотрудничество в экосистеме

Коммутаторы NVIDIA:

Квант-3: InfiniBand 800 Гбит / с коммутатор с поддержкой ускорения агрегированной связи SHARPv3.

Spectrum-4: коммутатор Ethernet 400G с поддержкой RoCEv2 и интеллектуального планирования трафика.

Коммутаторы сторонних производителей:

Arista 7800R3 (800G), Cisco Nexus 92300YC (400G): обеспечьте поддержку балансировки нагрузки RoCEv2 и ECMP.

Совместимые коммутаторы и сотрудничество в экосистеме

Оставьте комментарий

Наверх