NVIDIA GB200 液体冷却プレート設計の詳細: AI チップ向けの高度な液体冷却

NVIDIAのGB200のような次世代AIチップは、パフォーマンスの限界を押し広げています。しかし、この途方もないパワーには、驚異的な発熱という代償が伴います。GB200チップ1個あたりの消費電力は最大2700Wにも達します。これほどの高出力をこれほどコンパクトなスペースに詰め込むには、従来の空冷システムでは到底追いつくことができません。これらのチップの冷却を維持する唯一の方法は、高度な液冷技術です。

小型NVIDIA GB200サーバー内部
次世代AIチップ

GB200冷却チャレンジの背後にある数字

解決策を理解するには、まず問題を深く掘り下げる必要があります。GB200が発する熱は単に高いだけでなく、極めて集中しています。これは熱流束密度として知られています。

チップは50W/cm²を超える熱流束を発生します。これは、小さな指の爪ほどの面積で50Wの熱を発生するのに相当します。特定のホットスポット領域では、熱流束が150W/cm²にまで急上昇することもあります。この熱を制御できない場合、チップは急速に損傷する可能性があります。そのため、チップの温度上昇(Tc)は通常40℃未満に抑える必要がありますが、GPU自体にはさらに厳しい30℃未満という制限が求められます。

これらの数値を満たすには、次の 2 つの重要な機能を備えた冷却システムが必要です。

  1. 極めて低い熱抵抗(0.03°C/W未満)。これにより、冷却プレートはチップから効率的に熱を除去できます。
  2. 低い流動抵抗(20kPa以下)。これにより、強力でエネルギーを消費するポンプを必要とせずに、冷却剤がプレートを容易に通過できるようになります。
GB200_gpu

コールドプレート内部:構造と流れの物理

これらの優れた数値を達成するために、エンジニアは、通常、スカイブフィンプロセス(スカイビングプロセスとも呼ばれる)を使用して製造される、マイクロチャネルコールドプレートと呼ばれる特殊な設計を使用します。

スカイブフィンを用いたマイクロチャネル構造

冷却プレートは通常、優れた熱伝導率(熱伝導率385W/mK)を持つ銅で作られています。その後、特殊な工具を用いて銅ベースから薄いフィンを直接削り取ります。これにより、一連の微細な平行チャネルが形成されます。

  • フィンの厚さ(t)は通常0.5mm以下です。
  • フィン間の間隔(P)も≤0.5mmです。
  • フィンの高さ(L)は通常3mm以上です。
スカイブフィンを用いたマイクロチャネル構造
フィン

これらの非常に小さな寸法によって巨大な内部表面積が生まれ、これはチャネルを流れる液体冷却剤に熱を吸収するために非常に重要です。

マイクロチャネルの構造は非常に重要です。フィンの高さ(L)と間隔(P)の関係によって、液体の流れが決まります。

内部流路の理解

これらの微細なチャネル内を液体がどのように流れるかは非常に重要です。エンジニアはいくつかの重要な公式を用いてこれを解析します。

まず、流路の水力直径(Dh)を計算します。これは、流路内の流体の流れの有効径を表します。計算式は以下のとおりです。

Dh = 2(PL)/(P+L)*

フィンの高さ(L)はフィン間隔(P)よりもはるかに大きく、L/P比は通常15を超えるため、式はDh ≈ 2Pと簡略化されます。これは、有効チャネルサイズがフィン間の微小な間隔に直接関係していることを示しています。

次に、エンジニアはレイノルズ数 (Re) を使用して流れの種類を決定します。

Re = ρ * V * Dh / μ

ここで、ρは流体の密度、Vは速度、μは粘度です。典型的なコールドプレートでは、流速(V)は通常0.1m/s未満です。計算によると、レイノルズ数(Re)は2000未満です。これは、流れが安定しており予測可能であること、つまり層流であることを示しています。

内部流路の理解

コールドプレートの性能を向上させる方法

この知識に基づいて、エンジニアは冷却プレートの性能を向上させるためにどのような調整が必要かを正確に把握できます。主な目標は2つあります。

  1. 流動抵抗を減らす

液体の流れをスムーズにするために、エンジニアは次のことができます。

  • フィン間の流速(V)を下げます。
  • 流れの方向に沿ってフィンの長さを短くします。
  • 対流熱伝達を高める

プレート冷却をより効果的にするには、熱伝達係数(h)を高める必要があります。興味深いことに、この層流では速度(V)はhにほとんど影響を与えません。そのため、他に2つの選択肢があります。

  • より効果的な冷却剤を選択して、液体の熱伝導率 (k) を高めます。
  • 等価水力直径 (Dh) を小さくします。これは基本的に、チャネルをより小さく、より狭くすることを意味します。

これらの正確な原理と計算を適用することで、エンジニアは効率的な設計と微調整を行うことができます。 液体冷却 プレート。この細心の注意を払った作業はAIの未来にとって極めて重要であり、GB200のような強力なチップが過熱することなく最大限の性能を発揮できるようにします。

対流熱伝達を高める

GB200 液体冷却プレート仕様

Itemコンテンツ
PlatformGB200
タイプグレース・ブラックウェル・スーパーチップ
アーキテクチャ2xBlackwell GPU + Grace CPU
TDP2700W (2x1200W GPU + 300W CPU)
液体冷却部品のサイズ189.5×270.4×28.5mm(幅×高さ×奥行き)
コールドプレート部品の重量2.9KG
クーラントPG25
クイックコネクタCEJNまたはCPC UQD04
液冷チューブ材質ステンレス鋼またはEPDM
入口温度45℃
注ぐ速さ1.8 LPM
流体抵抗< 20kPa
熱抵抗非常に低い、0.03°C/W未満
熱流束密度50W/cm²を超え、一部地域では150W/cm²に達する
温度上昇限界チップ温度40℃以下、GPU温度30℃以下
GB200 液体冷却プレート仕様

FiberMallは、光通信製品およびソリューションの専門プロバイダーであり、世界中のデータセンター、クラウドコンピューティング環境、エンタープライズネットワーク、アクセスネットワーク、ワイヤレスシステム向けに、コスト効率の高いソリューションを提供することに尽力しています。AI対応通信ネットワークにおけるリーダーシップで高い評価を得ているFiberMallは、高品質で価値重視の光通信ソリューションをお探しのお客様にとって理想的なパートナーです。

上へスクロール