NVIDIA GB200 액체 냉각 플레이트 설계 심층 분석: AI 칩을 위한 고급 액체 냉각

NVIDIA의 GB200과 같은 차세대 AI 칩은 성능의 한계를 뛰어넘고 있습니다. 하지만 이러한 엄청난 성능에는 엄청난 발열이라는 대가가 따릅니다. GB200 칩 패키지 하나는 최대 2700W의 전력을 소비합니다. 이처럼 작은 공간에 이처럼 높은 전력을 담았기에 기존의 공랭 시스템은 감당할 수 없습니다. 이러한 칩의 냉각 성능을 유지하는 유일한 방법은 첨단 수랭 기술입니다.

small_nvidia-gb200-서버-인테리어
차세대 AI 칩

GB200 냉각 챌린지의 배경이 되는 숫자

해결책을 이해하려면 먼저 문제를 깊이 파고들어 보아야 합니다. GB200에서 생성되는 열은 단순히 높은 수준이 아니라 매우 집중되어 있습니다. 이를 열유속 밀도라고 합니다.

이 칩은 50W/cm²를 초과하는 열유속을 발생시키는데, 이는 작은 손톱 크기의 면적에 50W의 열을 발생시키는 것과 같습니다. 특정 핫스팟 영역에서는 열유속이 150W/cm²까지 치솟을 수도 ​​있습니다. 이 열을 제대로 제어하지 않으면 칩이 빠르게 손상될 수 있습니다. 따라서 칩의 온도 상승(Tc)은 일반적으로 40°C 미만으로 유지되어야 하며, GPU 자체는 30°C 미만의 더 엄격한 제한을 요구합니다.

이러한 수치를 충족하려면 두 가지 주요 기능을 갖춘 냉각 시스템이 필요합니다.

  1. 매우 낮은 열 저항(0.03°C/W 미만)을 가지고 있습니다. 이는 냉각판이 칩에서 열을 효율적으로 제거할 수 있음을 의미합니다.
  2. 낮은 유동 저항(20kPa 이하) 덕분에 냉각수는 강력하고 에너지를 많이 소모하는 펌프 없이도 플레이트를 쉽게 통과할 수 있습니다.
GB200_gpu

냉각판 내부: 구조 및 유동 물리학

이처럼 인상적인 수치를 달성하기 위해 엔지니어들은 일반적으로 스키빙 공정(스키빙 공정이라고도 함)을 사용하여 제조되는 마이크로채널 냉각판이라는 특수 설계를 사용합니다.

스키브 핀을 이용한 마이크로채널 구조

냉각판은 일반적으로 우수한 열전도체(열전도도 385W/mK)인 구리로 제작됩니다. 그런 다음 특수 공구를 사용하여 구리 베이스에서 얇은 핀을 직접 깎아냅니다. 이렇게 하면 일련의 작고 평행한 채널이 형성됩니다.

  • 핀 두께(t)는 일반적으로 ≤0.5mm입니다.
  • 핀 사이의 간격(P)도 ≤0.5mm입니다.
  • 핀 높이(L)는 일반적으로 ≥3mm입니다.
스키브 핀을 이용한 마이크로채널 구조
핀

이러한 미세한 크기는 엄청난 내부 표면적을 만들어내는데, 이는 채널을 통해 흐르는 액체 냉각수에 열을 흡수하는 데 중요합니다.

마이크로채널의 구조는 매우 중요합니다. 핀 높이(L)와 간격(P)의 관계에 따라 액체의 흐름이 결정됩니다.

내부 흐름 채널 이해

이 작은 통로를 따라 액체가 흐르는 방식은 매우 중요합니다. 엔지니어들은 이를 분석하기 위해 몇 가지 핵심 공식을 사용합니다.

먼저, 채널의 수력 직경(Dh)을 계산합니다. 이는 채널 내 유체 흐름의 유효 크기를 나타냅니다. 공식은 다음과 같습니다.

Dh = 2(PL)/(P+L)*

핀 높이(L)가 간격(P)보다 훨씬 크고 L/P 비율이 일반적으로 15 이상이기 때문에 공식은 다음과 같이 단순화됩니다. Dh ≈ 2P. 이는 효과적인 채널 크기가 핀 사이의 작은 간격과 직접적인 관련이 있음을 보여줍니다.

다음으로 엔지니어는 레이놀즈 수(Re)를 사용하여 흐름 유형을 결정합니다.

Re = ρ * V * Dh / μ

여기서 ρ는 유체 밀도, V는 속도, μ는 점성입니다. 일반적인 냉각판의 경우, 유속(V)은 일반적으로 0.1m/s 미만입니다. 계산 결과 레이놀즈 수(Re)는 2000 미만입니다. 이는 유동이 안정적이고 예측 가능하며, 층류임을 확인합니다.

내부 흐름 채널 이해

냉각판 성능을 개선하는 방법

이러한 지식을 바탕으로 엔지니어는 냉각판 성능 향상을 위해 어떤 조정이 필요한지 정확히 파악합니다. 두 가지 주요 목표는 다음과 같습니다.

  1. 흐름 저항 감소

액체의 흐름을 더 쉽게 만들기 위해 엔지니어는 다음을 수행할 수 있습니다.

  • 핀 사이의 흐름 속도(V)를 줄입니다.
  • 흐름 방향을 따라 핀의 길이를 짧게 합니다.
  • 대류 열전달 증가

판 냉각의 효과를 높이려면 열전달 계수(h)를 높여야 합니다. 흥미로운 점은 이 층류에서 속도(V)가 "h"에 거의 영향을 미치지 않는다는 것입니다. 따라서 두 가지 다른 옵션이 있습니다.

  • 더 효과적인 냉각수를 선택하여 액체의 열전도도(k)를 높입니다.
  • 동등 유압 직경(Dh)을 줄이는 것은 본질적으로 채널을 더 작고 좁게 만드는 것을 의미합니다.

이러한 정확한 원리와 계산을 적용함으로써 엔지니어는 효율적인 설계 및 미세 조정을 수행할 수 있습니다. 액체 냉각 플레이트. 이러한 꼼꼼한 작업은 GB200과 같은 강력한 칩이 과열 없이 최대 성능을 발휘할 수 있도록 보장하는 AI의 미래에 매우 중요합니다.

대류 열전달 증가

GB200 액체 냉각판 사양

항목내용
플랫폼GB200
타입그레이스 블랙웰 슈퍼칩
아키텍처2xBlackwell GPU + Grace CPU
TDP2700W(2x1200W GPU + 300W CPU)
액체 냉각 구성 요소 크기189.5×270.4×28.5mm(폭x높이x깊이)
냉각판 구성 요소 무게2.9KG
냉각수PG25
빠른 커넥터CEJN 또는 CPC UQD04
액체 냉각 튜브 재료스테인리스 스틸 또는 EPDM
입구 온도45 ℃
유량1.8LPM
유체 저항< 20kPa
열 저항매우 낮음, 0.03°C/W 이하
열유속 밀도50W/cm² 초과, 일부 지역 150W/cm² 도달
온도 상승 한계칩 온도 40°C 미만, GPU 온도 30°C 미만
GB200 액체 냉각판 사양

FiberMall은 광통신 제품 및 솔루션 전문 공급업체로, 글로벌 데이터 센터, 클라우드 컴퓨팅 환경, 기업 네트워크, 액세스 네트워크 및 무선 시스템에 비용 효율적인 솔루션을 제공하기 위해 최선을 다하고 있습니다. AI 기반 통신 네트워크 분야의 선도적인 입지를 굳건히 하고 있는 FiberMall은 고품질의 가치 중심 광통신 솔루션을 찾는 고객에게 이상적인 파트너입니다.

위쪽으로 스크롤