DGX A100 напоминает типичный домашний компьютер и может быть разделен на пять основных аппаратных модулей:

- Модуль вентиляторов. Расположенный спереди модуль вентиляторов состоит из восьми вентиляторов, что соответствует стандартной конфигурации 8U, используемой в традиционных серверах.
- Жесткие диски: DGX A100 расположен под передним модулем вентиляторов и содержит восемь жестких дисков емкостью 3.84 ТБ, что обеспечивает общую емкость внутреннего хранилища 30 ТБ.
- Лоток для платы графического процессора. В задней части сервера AI собираются вместе критически важные компоненты. Лоток для платы графического процессора является сердцем системы и отличает серверы искусственного интеллекта от обычных. В архитектуре DGX A100 лоток для платы графического процессора включает компоненты графического процессора, платы модулей и компоненты NVSwitch, каждый из которых включает в себя различные типы печатных плат.
- Лоток для материнской платы ЦП: эта часть служит основным компонентом для всех серверов, включая как обычные, так и серверы AI. Он содержит материнскую плату ЦП, системную память, сетевые карты и коммутаторы PCIE. Материнская плата ЦП и системная память существенно влияют на общее использование печатной платы.
- Модуль питания: Задняя часть DGX A100 также оснащена шестью модулями питания, внутри которых используются толстые медные печатные платы.
С функциональной точки зрения мы можем разделить расчет стоимости печатной платы для серверов AI на три части:


Компоненты платы графического процессора
Общая стоимость 12,000 52 долларов США, несущие платы (48%) и печатные платы (XNUMX%). Плата графического процессора состоит из четырех основных компонентов: держателей графического процессора, NVSwitch, модулей ускорителей OCP (OAM) и базовых плат модулей (UBB).

Носители графических процессоров: графические процессоры NVIDIA A100 и DRAM используют передовую технологию упаковки 2.5D/3D. Несущие платы размером от 70x70 мм до 100x100 мм и имеющие от 14 до 16 слоев напрямую соответствуют количеству графических процессоров. Учитывая конфигурацию DGX A100 с 8 графическими процессорами, для каждого сервера искусственного интеллекта требуется 8 несущих плат графических процессоров. Отраслевые исследования показывают, что стоимость одной несущей платы графического процессора составляет примерно 100 долларов США (что эквивалентно 650 юаням), в результате чего общая стоимость одного сервера составляет 5,200 долларов США.

NVSwitch: NVSwitch, основанный на стандарте NVLink, облегчает связь между графическими процессорами. Носители для NVSwitch аналогичны носителям для графических процессоров, но с более простыми производственными требованиями. Их ключевая роль — обеспечение высокоскоростной передачи данных. Исследования показывают, что стоимость одного NVSwitch составляет около 30 долларов США (195 юаней). Для DGX A100 с 6 NVSwitch общая стоимость составляет 1,170 долларов США.

OAM (модуль ускорителя OCP): OAM, также известные как модули ускорителя графического процессора, содержат чипы графического процессора. Количество OAM напрямую соответствует количеству графических процессоров (8 в случае DGX A100). Учитывая размеры, аналогичные размерам версии PCIE (267.7 x 111.15 мм), расчетная площадь OAM составляет примерно 0.03 квадратных метра. Для OAM требуются специальные типы печатных плат из-за высокоскоростной передачи сигнала. Версия DGX A100 SXM включает 20 слоев, материал CCL со сверхнизкими потерями и 4-слойную технологию HDI, в результате чего цена за единицу составляет 12,000 14 долларов США за квадратный метр. Версия PCIE использует 4 слоев, материал CCL со сверхнизкими потерями и высокой Tg FR7,000, соответствующая цена за единицу составляет 100 долларов США за квадратный метр. В целом стоимость единицы OAM в высокопроизводительном сервере искусственного интеллекта (сконфигурированном как DGX A2,880) составляет XNUMX долларов США.

UBB (базовая плата): UBB — это печатные платы, используемые для монтажа всей платформы графического процессора. Для каждого сервера AI требуется один UBB. Основываясь на спецификациях DGX A100 и отраслевых исследованиях, мы оцениваем площадь UBB примерно в 0.30 квадратных метра. В этих платах используются 26-слойные печатные платы со сквозными отверстиями и материалом CCL со сверхнизкими потерями, в результате чего цена за единицу составляет 10,000 3,000 долларов США за квадратный метр. Общая стоимость UBB на сервер составляет XNUMX долларов США.
Плата графического процессора NVIDIA DGX A100 состоит из четырех основных частей: держателей графического процессора, NVSwitch, модулей ускорителей OCP (OAM) и базовых плат модулей (UBB). В совокупности эти компоненты занимают общую площадь печатной платы 0.624 квадратных метра, что соответствует стоимости одного сервера в 12,250 XNUMX долларов США. Конкретно:
Поставщики графических процессоров вносят 6,370 долларов США (52% от общей стоимости).
Компоненты уровня печатной платы составляют 5,880 долларов США (48% от общей стоимости).
Компоненты материнской платы процессора
В состав материнской платы ЦП входят держатели ЦП, материнские платы ЦП и функциональные дополнительные платы. Эти аксессуары включают в себя системные карты памяти, сетевые карты, карты расширения и платы драйверов ОС системы хранения данных. Вот разбивка:

Носители ЦП. По характеристикам они аналогичны носителям графических процессоров, ориентировочная стоимость каждого носителя ЦП составляет 100 долларов США. Если DGX A100 оснащен двумя процессорами, общая стоимость одного сервера составляет примерно 2 долларов США.
Материнская плата ЦП: отвечает за размещение микросхемы ЦП, микросхемы PCIE Switch, модуля TPM и различных функциональных дополнительных плат. Материнская плата ЦП соответствует конструкции 64-ядерного ЦП AMD Rome и стандарту шины PCIE 4.0. В нем используется 10-12 слоев материала CCL с низкими потерями и конструкция со сквозными отверстиями. Ориентировочная площадь материнской платы ЦП составляет 0.38 квадратных метра, в результате чего стоимость одного сервера составляет 1,140 долларов США.
Функциональные вспомогательные платы. Эти платы служат различным целям:
Карты памяти ЦП (32 единицы, общим объемом 2 ТБ) имеют стандартный размер примерно 0.004 квадратных метра на карту.
Сетевые карты (серия Mellanox ConnectX) выпускаются в 10 вариантах (8 однопортовых IB 200 Гбит/с и 2 двухпортовых Ethernet 200 Гбит/с). Каждая карта занимает площадь около 0.012 квадратных метра.
Райзер-карты (для расширения интерфейсов PCIE) занимают площадь примерно 0.01 кв. метра.
Платы драйверов ОС системы хранения данных (с двумя дисками M.1.92 NVMe емкостью 2 ТБ) занимают аналогичную площадь.
Общая площадь функциональных дополнительных плат составляет 0.27 квадратных метра, что соответствует стоимости примерно 405 долларов США за сервер.
Сводные данные по материнской плате ЦП: Общая площадь печатной платы материнской платы ЦП NVIDIA DGX A100 составляет 0.662 квадратных метра, а стоимость на сервер составляет примерно 2,845 долларов США. Разбивка следующая:
Компоненты операторского уровня составляют 46% от общей стоимости.
Компоненты материнской платы на уровне печатной платы составляют 40% общей стоимости.
Функциональные аксессуары на уровне печатной платы составляют 14% от общей стоимости.
Другие компоненты
Общая стоимость за единицу: 226 юаней. Помимо сборки платы графического процессора и сборки модуля ЦП, другие компоненты включают блок питания, жесткие диски и плату передней консоли управления. Согласно отраслевым исследованиям, в этих компонентах в основном используются 6–10 слоев CCL класса FR4/Mid Loss (ламинат с медным покрытием) с ценой за единицу продукции от 1000 до 1500 юаней за квадратный метр. Ссылаясь на спецификации DGX A100, мы рассчитываем использование и площадь следующим образом:
- Блок питания: Учитывая, что DGX A100 оснащен 6 блоками питания, мы оцениваем, что индивидуальная площадь печатной платы для каждого блока питания составляет 0.019 квадратных метров, исходя из характеристик серверного блока питания Delta Electronics 2200 Вт (модель DPS-2200-AB). -2) размером 73.5 х 265.0 мм.
- Жесткие диски: по нашим оценкам, учитывая 8 жестких дисков в DGX A100, площадь печатной платы каждого диска составляет 0.008 квадратных метра, что соответствует стандартным 3.5-дюймовым дискам.
- Плата передней консоли управления: эта плата в основном используется для управления внешними устройствами и размещается между 8 жесткими дисками. Основываясь на отраслевых исследованиях, мы оцениваем его площадь примерно в 0.010 квадратных метров.
Объединив сборку платы графического процессора, сборку модуля ЦП и другие компоненты, мы оцениваем, что общая площадь печатной платы DGX A100 составляет 1.474 квадратных метра, а стоимость единицы составляет 15,321 XNUMX юань. Конкретно:
Стоимость сборки платы графического процессора составляет 12,000 80 юаней за единицу, что составляет XNUMX% от общей стоимости.
Стоимость сборки модуля ЦП составляет 2,845 юаней, что составляет 19% от общей суммы.
Стоимость других компонентов составляет 226 юаней за единицу, что составляет 1% от общей стоимости.
С точки зрения классификации плат, стоимость единицы несущей платы составляет 7,670 50.1 юаней (7,651%), а доля платы уровня печатной платы составляет 49.9 XNUMX юань (XNUMX%).
Сопутствующие товары:
-
Совместимый с NVIDIA MMA4Z00-NS400 400G OSFP SR4 Flat Top PAM4 850 нм 30 м на OM3/50 м на OM4 MTP/MPO-12 Многомодовый модуль оптического трансивера FEC $650.00
-
NVIDIA MMA4Z00-NS-FLT Совместимый двухпортовый OSFP 800 Гбит/с 2x400G SR8 PAM4 850 нм 100 м DOM Двойной модуль оптического трансивера MPO-12 MMF $850.00
-
NVIDIA MMA4Z00-NS Совместимый двухпортовый OSFP 800 Гбит/с 2x400G SR8 PAM4 850 нм 100 м DOM Двойной модуль оптического трансивера MPO-12 MMF $750.00
-
NVIDIA MMS4X00-NM Совместимый двухпортовый OSFP 800 Гбит/с 2x400G PAM4 1310nm 500m DOM Dual MTP/MPO-12 SMF Модуль оптического трансивера $1100.00
-
Совместимый с NVIDIA MMS4X00-NM-FLT 800G Twin-port OSFP 2x400G Flat Top PAM4 1310nm 500m DOM Dual MTP/MPO-12 SMF Модуль оптического трансивера $1200.00
-
Совместимый с NVIDIA MMS4X00-NS400 400G OSFP DR4 Flat Top PAM4 1310nm MTP/MPO-12 500m SMF FEC Модуль оптического трансивера $800.00
-
Mellanox MMA1T00-HS, совместимый с 200G Infiniband HDR QSFP56 SR4, 850 нм, 100 м, MPO-12, модуль оптического приемопередатчика APC OM3/OM4 FEC PAM4 $200.00
-
Совместимость с NVIDIA MFP7E10-N010, 10 волокон, длина 33 м (8 футов), низкие вносимые потери, гнездо-мама Магистральный кабель MPO, полярность B, APC-APC, LSZH, многомодовый OM3 50/125 $47.00
-
Совместимый с NVIDIA MCP7Y00-N003-FLT 3 м (10 фута) 800G OSFP с двумя портами до 2x400G Flat Top OSFP InfiniBand NDR Breakout DAC $275.00
-
NVIDIA MCP7Y70-H002 Совместимость с двумя портами 2G, 7 м (400 фута), от 2x200G OSFP до 4x100G QSFP56, медный кабель прямого подключения с пассивной разводкой $155.00
-
NVIDIA MCA4J80-N003-FTF, совместимый с двумя портами 3G, 10 м (800 футов), 2x400G OSFP на 2x400G OSFP, активный медный кабель InfiniBand NDR, плоская верхняя часть на одном конце и ребристая верхняя часть на другом $600.00
-
NVIDIA MCP7Y10-N002, совместимый с двухпортовым OSFP 2G InfiniBand NDR длиной 7 м (800 фута) с 2x400G QSFP112 Breakout ЦАП $200.00