Разбор пяти ключевых компонентов AI-сервера

DGX A100 напоминает типичный домашний компьютер и может быть разделен на пять основных аппаратных модулей:

сервер
  1. Модуль вентиляторов. Расположенный спереди модуль вентиляторов состоит из восьми вентиляторов, что соответствует стандартной конфигурации 8U, используемой в традиционных серверах.
  2. Жесткие диски: DGX A100 расположен под передним модулем вентиляторов и содержит восемь жестких дисков емкостью 3.84 ТБ, что обеспечивает общую емкость внутреннего хранилища 30 ТБ.
  3. Лоток для платы графического процессора. В задней части сервера AI собираются вместе критически важные компоненты. Лоток для платы графического процессора является сердцем системы и отличает серверы искусственного интеллекта от обычных. В архитектуре DGX A100 лоток для платы графического процессора включает компоненты графического процессора, платы модулей и компоненты NVSwitch, каждый из которых включает в себя различные типы печатных плат.
  4. Лоток для материнской платы ЦП: эта часть служит основным компонентом для всех серверов, включая как обычные, так и серверы AI. Он содержит материнскую плату ЦП, системную память, сетевые карты и коммутаторы PCIE. Материнская плата ЦП и системная память существенно влияют на общее использование печатной платы.
  5. Модуль питания: Задняя часть DGX A100 также оснащена шестью модулями питания, внутри которых используются толстые медные печатные платы.

С функциональной точки зрения мы можем разделить расчет стоимости печатной платы для серверов AI на три части:

NVIDIA DGX A100
DGX A100 спереди и сзади

Компоненты платы графического процессора

Общая стоимость 12,000 52 долларов США, несущие платы (48%) и печатные платы (XNUMX%). Плата графического процессора состоит из четырех основных компонентов: держателей графического процессора, NVSwitch, модулей ускорителей OCP (OAM) и базовых плат модулей (UBB).

Компоненты платы графического процессора

Носители графических процессоров: графические процессоры NVIDIA A100 и DRAM используют передовую технологию упаковки 2.5D/3D. Несущие платы размером от 70x70 мм до 100x100 мм и имеющие от 14 до 16 слоев напрямую соответствуют количеству графических процессоров. Учитывая конфигурацию DGX A100 с 8 графическими процессорами, для каждого сервера искусственного интеллекта требуется 8 несущих плат графических процессоров. Отраслевые исследования показывают, что стоимость одной несущей платы графического процессора составляет примерно 100 долларов США (что эквивалентно 650 юаням), в результате чего общая стоимость одного сервера составляет 5,200 долларов США.

2.5 3D-упаковка и носитель

NVSwitch: NVSwitch, основанный на стандарте NVLink, облегчает связь между графическими процессорами. Носители для NVSwitch аналогичны носителям для графических процессоров, но с более простыми производственными требованиями. Их ключевая роль — обеспечение высокоскоростной передачи данных. Исследования показывают, что стоимость одного NVSwitch составляет около 30 долларов США (195 юаней). Для DGX A100 с 6 NVSwitch общая стоимость составляет 1,170 долларов США.

нвсвитч

OAM (модуль ускорителя OCP): OAM, также известные как модули ускорителя графического процессора, содержат чипы графического процессора. Количество OAM напрямую соответствует количеству графических процессоров (8 в случае DGX A100). Учитывая размеры, аналогичные размерам версии PCIE (267.7 x 111.15 мм), расчетная площадь OAM составляет примерно 0.03 квадратных метра. Для OAM требуются специальные типы печатных плат из-за высокоскоростной передачи сигнала. Версия DGX A100 SXM включает 20 слоев, материал CCL со сверхнизкими потерями и 4-слойную технологию HDI, в результате чего цена за единицу составляет 12,000 14 долларов США за квадратный метр. Версия PCIE использует 4 слоев, материал CCL со сверхнизкими потерями и высокой Tg FR7,000, соответствующая цена за единицу составляет 100 долларов США за квадратный метр. В целом стоимость единицы OAM в высокопроизводительном сервере искусственного интеллекта (сконфигурированном как DGX A2,880) составляет XNUMX долларов США.

Модуль ускорителя OCP

UBB (базовая плата): UBB — это печатные платы, используемые для монтажа всей платформы графического процессора. Для каждого сервера AI требуется один UBB. Основываясь на спецификациях DGX A100 и отраслевых исследованиях, мы оцениваем площадь UBB примерно в 0.30 квадратных метра. В этих платах используются 26-слойные печатные платы со сквозными отверстиями и материалом CCL со сверхнизкими потерями, в результате чего цена за единицу составляет 10,000 3,000 долларов США за квадратный метр. Общая стоимость UBB на сервер составляет XNUMX долларов США.

Плата графического процессора NVIDIA DGX A100 состоит из четырех основных частей: держателей графического процессора, NVSwitch, модулей ускорителей OCP (OAM) и базовых плат модулей (UBB). В совокупности эти компоненты занимают общую площадь печатной платы 0.624 квадратных метра, что соответствует стоимости одного сервера в 12,250 XNUMX долларов США. Конкретно:

Поставщики графических процессоров вносят 6,370 долларов США (52% от общей стоимости).

Компоненты уровня печатной платы составляют 5,880 долларов США (48% от общей стоимости).

Компоненты материнской платы процессора

В состав материнской платы ЦП входят держатели ЦП, материнские платы ЦП и функциональные дополнительные платы. Эти аксессуары включают в себя системные карты памяти, сетевые карты, карты расширения и платы драйверов ОС системы хранения данных. Вот разбивка:

Материнская плата процессора DGX A100

Носители ЦП. По характеристикам они аналогичны носителям графических процессоров, ориентировочная стоимость каждого носителя ЦП составляет 100 долларов США. Если DGX A100 оснащен двумя процессорами, общая стоимость одного сервера составляет примерно 2 долларов США.

Материнская плата ЦП: отвечает за размещение микросхемы ЦП, микросхемы PCIE Switch, модуля TPM и различных функциональных дополнительных плат. Материнская плата ЦП соответствует конструкции 64-ядерного ЦП AMD Rome и стандарту шины PCIE 4.0. В нем используется 10-12 слоев материала CCL с низкими потерями и конструкция со сквозными отверстиями. Ориентировочная площадь материнской платы ЦП составляет 0.38 квадратных метра, в результате чего стоимость одного сервера составляет 1,140 долларов США.

Функциональные вспомогательные платы. Эти платы служат различным целям:

Карты памяти ЦП (32 единицы, общим объемом 2 ТБ) имеют стандартный размер примерно 0.004 квадратных метра на карту.

Сетевые карты (серия Mellanox ConnectX) выпускаются в 10 вариантах (8 однопортовых IB 200 Гбит/с и 2 двухпортовых Ethernet 200 Гбит/с). Каждая карта занимает площадь около 0.012 квадратных метра.

Райзер-карты (для расширения интерфейсов PCIE) занимают площадь примерно 0.01 кв. метра.

Платы драйверов ОС системы хранения данных (с двумя дисками M.1.92 NVMe емкостью 2 ТБ) занимают аналогичную площадь.

Общая площадь функциональных дополнительных плат составляет 0.27 квадратных метра, что соответствует стоимости примерно 405 долларов США за сервер.

Сводные данные по материнской плате ЦП: Общая площадь печатной платы материнской платы ЦП NVIDIA DGX A100 составляет 0.662 квадратных метра, а стоимость на сервер составляет примерно 2,845 долларов США. Разбивка следующая:

Компоненты операторского уровня составляют 46% от общей стоимости.

Компоненты материнской платы на уровне печатной платы составляют 40% общей стоимости.

Функциональные аксессуары на уровне печатной платы составляют 14% от общей стоимости.

Другие компоненты

Общая стоимость за единицу: 226 юаней. Помимо сборки платы графического процессора и сборки модуля ЦП, другие компоненты включают блок питания, жесткие диски и плату передней консоли управления. Согласно отраслевым исследованиям, в этих компонентах в основном используются 6–10 слоев CCL класса FR4/Mid Loss (ламинат с медным покрытием) с ценой за единицу продукции от 1000 до 1500 юаней за квадратный метр. Ссылаясь на спецификации DGX A100, мы рассчитываем использование и площадь следующим образом:

  • Блок питания: Учитывая, что DGX A100 оснащен 6 блоками питания, мы оцениваем, что индивидуальная площадь печатной платы для каждого блока питания составляет 0.019 квадратных метров, исходя из характеристик серверного блока питания Delta Electronics 2200 Вт (модель DPS-2200-AB). -2) размером 73.5 х 265.0 мм.
  • Жесткие диски: по нашим оценкам, учитывая 8 жестких дисков в DGX A100, площадь печатной платы каждого диска составляет 0.008 квадратных метра, что соответствует стандартным 3.5-дюймовым дискам.
  • Плата передней консоли управления: эта плата в основном используется для управления внешними устройствами и размещается между 8 жесткими дисками. Основываясь на отраслевых исследованиях, мы оцениваем его площадь примерно в 0.010 квадратных метров.

Объединив сборку платы графического процессора, сборку модуля ЦП и другие компоненты, мы оцениваем, что общая площадь печатной платы DGX A100 составляет 1.474 квадратных метра, а стоимость единицы составляет 15,321 XNUMX юань. Конкретно:

Стоимость сборки платы графического процессора составляет 12,000 80 юаней за единицу, что составляет XNUMX% от общей стоимости.

Стоимость сборки модуля ЦП составляет 2,845 юаней, что составляет 19% от общей суммы.

Стоимость других компонентов составляет 226 юаней за единицу, что составляет 1% от общей стоимости.

С точки зрения классификации плат, стоимость единицы несущей платы составляет 7,670 50.1 юаней (7,651%), а доля платы уровня печатной платы составляет 49.9 XNUMX юань (XNUMX%).

Оставьте комментарий

Наверх