Подробное описание конструкции пластины жидкостного охлаждения NVIDIA GB200: усовершенствованное жидкостное охлаждение для чипов ИИ

Чипы ИИ нового поколения, такие как NVIDIA GB200, расширяют границы производительности. Но эта колоссальная мощь имеет свою цену: колоссальное тепловыделение. Один чип GB200 потребляет до 2700 Вт. С такой высокой мощностью в столь компактном корпусе традиционные системы воздушного охлаждения просто не справляются. Единственный способ обеспечить охлаждение этих чипов — использовать передовую технологию жидкостного охлаждения.

small_nvidia-gb200-server-interior
Чипы ИИ следующего поколения

Цифры, лежащие в основе проблемы охлаждения GB200

Чтобы найти решение, нужно сначала разобраться в сути проблемы. Тепло, выделяемое GB200, не просто высокое — оно чрезвычайно концентрированное. Это называется плотностью теплового потока.

Чип генерирует тепловой поток, превышающий 50 Вт/см², что эквивалентно выделению 50 Вт тепла на площади размером с небольшой ноготь. В некоторых зонах с высокой температурой тепловой поток может достигать 150 Вт/см². Если его не контролировать, это тепло может быстро повредить чип. Поэтому температура чипа (Tc) обычно должна поддерживаться ниже 40 °C, в то время как для самого графического процессора требуются ещё более строгие ограничения — ниже 30 °C.

Для достижения этих показателей необходима система охлаждения с двумя ключевыми характеристиками:

  1. Чрезвычайно низкое тепловое сопротивление (менее 0.03°C/Вт). Это означает, что охлаждающая пластина может эффективно отводить тепло от чипа.
  2. Низкое гидравлическое сопротивление (не более 20 кПа). Это обеспечивает беспрепятственное прохождение охлаждающей жидкости через пластину без необходимости использования мощных и энергоёмких насосов.
GB200_gpu

Внутри холодной пластины: структура и физика течения

Чтобы добиться столь впечатляющих показателей, инженеры используют специальную конструкцию, называемую микроканальной охлаждающей пластиной, которую обычно изготавливают с использованием процесса срезания ребер (также известного как процесс срезания ребер).

Микроканальная структура с использованием скошенных ребер

Охлаждающая пластина обычно изготавливается из меди, которая обладает отличным теплопроводностью (теплопроводность 385 Вт/м·К). Затем с помощью специального инструмента тонкие рёбра срезаются непосредственно с медного основания. Это образует ряд крошечных параллельных каналов.

  • Толщина ребра (t) обычно составляет ≤0.5 мм.
  • Расстояние между ребрами (P) также ≤0.5 мм.
  • Высота ребра (L) обычно составляет ≥3 мм.
Микроканальная структура с использованием скошенных ребер
плавников

Эти мизерные размеры создают огромную внутреннюю площадь поверхности, которая имеет решающее значение для поглощения тепла охлаждающей жидкостью, протекающей по каналам.

Структура микроканалов имеет решающее значение. Соотношение между высотой ребер (L) и расстоянием между ними (P) определяет характер течения жидкости.

Понимание внутренних каналов потока

То, как течёт жидкость в этих крошечных каналах, имеет решающее значение. Инженеры используют несколько ключевых формул для анализа этого процесса.

Сначала рассчитаем гидравлический диаметр канала (Dh), который представляет собой эффективный размер потока жидкости в канале. Формула:

Dh = 2(PЛ)/(П+Л)*

Поскольку высота ребра (L) значительно больше расстояния между ними (P), а отношение L/P обычно превышает 15, формула упрощается до: Dh ≈ 2P. Это говорит о том, что эффективный размер канала напрямую зависит от малого расстояния между ребрами.

Далее инженеры используют число Рейнольдса (Re) для определения типа течения:

Re = ρ * V * Dh / μ

Где ρ — плотность жидкости, V — скорость, а μ — вязкость. Для типичной охлаждающей пластины скорость потока (V) обычно менее 0.1 м/с. Расчёты показывают, что число Рейнольдса (Re) меньше 2000. Это подтверждает, что течение является устойчивым и предсказуемым, известным как ламинарное течение.

Понимание внутренних каналов потока

Как улучшить работу охлаждающей пластины

Основываясь на этих знаниях, инженеры точно знают, какие изменения необходимы для повышения производительности охлаждающей пластины. Существуют две основные цели:

  1. Уменьшить сопротивление потоку

Чтобы облегчить течение жидкости, инженеры могут:

  • Уменьшить скорость потока (V) между ребрами.
  • Укоротите длину ребер по направлению потока.
  • Увеличить конвективный теплообмен

Чтобы повысить эффективность охлаждения пластины, необходимо увеличить коэффициент теплопередачи (h). Интересно, что для этого ламинарного потока скорость (V) мало влияет на h. Поэтому есть два других варианта:

  • Увеличьте теплопроводность жидкости (k), выбрав более эффективный хладагент.
  • Уменьшить эквивалентный гидравлический диаметр (Dh), что по сути означает уменьшение размеров каналов и их большую герметичность.

Применяя эти точные принципы и расчеты, инженеры могут проектировать и точно настраивать эффективные жидкостное охлаждение Эта кропотливая работа имеет решающее значение для будущего искусственного интеллекта, позволяя таким мощным чипам, как GB200, раскрыть весь свой потенциал без перегрева.

Увеличить конвективный теплообмен

Технические характеристики пластины жидкостного охлаждения GB200

ТоварКонтент
ПлатформаGB200
ТипГрейс Блэквелл Суперчип
Архитектура2 графических процессора Blackwell + процессор Grace
TDP2700 Вт (2x1200 Вт графический процессор + 300 Вт процессор)
Размер компонента жидкостного охлаждения189.5×270.4×28.5 мм (ШxВxГ)
Вес компонента холодной пластины2.9KG
Охлаждающая жидкостьPG25
Быстрый разъемCEJN или CPC UQD04
Материал трубки жидкостного охлажденияНержавеющая сталь или EPDM
Температура на входе45 ℃
Скорость потока1.8 л / мин
Сопротивление жидкости< 20 кПа
Тепловое сопротивлениеКрайне низкий, ниже 0.03°C/Вт
Плотность теплового потокаПревышает 50 Вт/см², в некоторых районах достигает 150 Вт/см²
Предел повышения температурыТемпература чипа ниже 40°C, температура графического процессора ниже 30°C
Технические характеристики пластины жидкостного охлаждения GB200

Компания FiberMall — специализированный поставщик продуктов и решений в области оптической связи, предлагающий экономически эффективные решения для глобальных центров обработки данных, облачных вычислительных сред, корпоративных сетей, сетей доступа и беспроводных систем. FiberMall, известный своим лидерством в области сетей связи с использованием искусственного интеллекта, станет идеальным партнером, если вам нужны высококачественные и выгодные решения в области оптической связи.

Наверх