Plongée en profondeur dans la conception de la plaque de refroidissement liquide NVIDIA GB200 : refroidissement liquide avancé pour les puces d'IA

Les puces d'IA de nouvelle génération, comme la GB200 de NVIDIA, repoussent les limites des performances. Mais cette puissance colossale a un coût : une production de chaleur colossale. Un seul boîtier GB200 consomme jusqu'à 2 700 W. Avec une telle puissance dans un espace aussi compact, les systèmes de refroidissement par air traditionnels ne peuvent tout simplement pas suivre. La seule façon de maintenir le refroidissement de ces puces est d'utiliser une technologie avancée de refroidissement liquide.

petit_serveur_nvidia-gb200-intérieur
Puces d'IA de nouvelle génération

Les chiffres derrière le défi de refroidissement GB200

Pour comprendre la solution, il faut d'abord analyser le problème. La chaleur produite par le GB200 n'est pas seulement élevée, elle est extrêmement concentrée. C'est ce qu'on appelle la densité de flux thermique.

La puce génère un flux thermique supérieur à 50 W/cm², soit l'équivalent de 50 W de chaleur dans une zone de la taille d'un petit ongle. Dans certaines zones sensibles, le flux thermique peut même atteindre 150 W/cm². Non maîtrisée, cette chaleur peut rapidement endommager la puce. Par conséquent, l'élévation de température (Tc) de la puce doit généralement être maintenue en dessous de 40 °C, tandis que le GPU lui-même exige des limites encore plus strictes, inférieures à 30 °C.

Pour atteindre ces chiffres, il faut un système de refroidissement doté de deux caractéristiques clés :

  1. Résistance thermique extrêmement faible (inférieure à 0.03 °C/W). La plaque de refroidissement peut ainsi évacuer efficacement la chaleur de la puce.
  2. Faible résistance à l'écoulement (maximum 20 kPa). Cela permet au liquide de refroidissement de traverser facilement la plaque sans nécessiter de pompes puissantes et énergivores.
GB200_gpu

À l'intérieur de la plaque froide : structure et physique des écoulements

Pour atteindre ces chiffres impressionnants, les ingénieurs utilisent une conception spéciale appelée plaque froide à microcanaux, généralement fabriquée à l'aide d'un procédé à ailettes ébarbées (également connu sous le nom de procédé de découpage).

Structure de microcanaux utilisant des ailettes biseautées

La plaque de refroidissement est généralement en cuivre, un excellent conducteur thermique (conductivité thermique de 385 W/mK). Des outils spéciaux sont ensuite utilisés pour découper directement de fines ailettes dans la base en cuivre, formant ainsi une série de minuscules canaux parallèles.

  • L'épaisseur des ailettes (t) est généralement ≤ 0.5 mm.
  • L'espacement entre les ailettes (P) est également ≤ 0.5 mm.
  • La hauteur des ailerons (L) est généralement ≥ 3 mm.
Structure de microcanaux utilisant des ailettes biseautées
ailettes

Ces dimensions minuscules créent une surface interne massive, essentielle pour absorber la chaleur dans le liquide de refroidissement circulant dans les canaux.

La structure des microcanaux est essentielle. La relation entre la hauteur (L) et l'espacement (P) des ailettes détermine l'écoulement du liquide.

Comprendre les canaux de flux internes

La façon dont le liquide s'écoule dans ces minuscules canaux est essentielle. Les ingénieurs utilisent des formules clés pour l'analyser.

Premièrement, calculez le diamètre hydraulique du canal (Dh), qui représente la taille effective de l'écoulement du fluide dans le canal. La formule est :

Dh = 2(PL)/(P+L)*

Comme la hauteur des ailettes (L) est bien supérieure à leur espacement (P), et que le rapport L/P est généralement supérieur à 15, la formule se simplifie ainsi : Dh ≈ 2P. Cela indique que la taille effective du canal est directement liée au faible espacement entre les ailettes.

Ensuite, les ingénieurs utilisent le nombre de Reynolds (Re) pour déterminer le type d’écoulement :

Re = ρ * V * Dh / μ

Où ρ est la masse volumique du fluide, V la vitesse et μ la viscosité. Pour une plaque froide classique, la vitesse d'écoulement (V) est généralement inférieure à 0.1 m/s. Les calculs montrent que le nombre de Reynolds (Re) est inférieur à 2 000. Cela confirme que l'écoulement est stable et prévisible, appelé écoulement laminaire.

Comprendre les canaux de flux internes

Comment améliorer les performances de la plaque froide

Grâce à ces connaissances, les ingénieurs savent précisément quels ajustements sont nécessaires pour améliorer les performances des plaques de refroidissement. Deux objectifs principaux sont poursuivis :

  1. Réduire la résistance à l'écoulement

Pour faciliter l’écoulement du liquide, les ingénieurs peuvent :

  • Réduire la vitesse d’écoulement (V) entre les ailettes.
  • Raccourcir la longueur des ailettes dans le sens du flux.
  • Augmenter le transfert de chaleur par convection

Pour optimiser l'efficacité du refroidissement par plaques, ils doivent augmenter le coefficient de transfert thermique (h). Une constatation intéressante est que, pour cet écoulement laminaire, la vitesse (V) a peu d'impact sur « h ». Deux autres options s'offrent donc à eux :

  • Augmentez la conductivité thermique du liquide (k) en sélectionnant un liquide de refroidissement plus efficace.
  • Réduire le diamètre hydraulique équivalent (Dh), ce qui signifie essentiellement rendre les canaux plus petits et plus étroits.

En appliquant ces principes et calculs précis, les ingénieurs peuvent concevoir et affiner des systèmes efficaces. refroidissement par liquide Ce travail minutieux est crucial pour l'avenir de l'IA, car il permet aux puces puissantes comme la GB200 d'atteindre leur plein potentiel sans surchauffe.

Augmenter le transfert de chaleur par convection

Spécifications de la plaque de refroidissement liquide GB200

Produit
PlateformeGB200
TypeSuperpuce Grace Blackwell
Architecture2 GPU Blackwell + CPU Grace
TDP2700 W (2 x 1200 W GPU + 300 W CPU)
Taille des composants de refroidissement liquide189.5 × 270.4 × 28.5 mm (L x H x P)
Poids des composants de la plaque froide2.9KG
Liquide de refroidissementPG25
connecteur rapideCEJN ou CPC UQD04
Matériau du tube de refroidissement liquideAcier inoxydable ou EPDM
Température d'entrée45 ℃
débit1.8 LPM
Résistance aux fluides< 20 kPa
Résistance thermiqueExtrêmement faible, inférieure à 0.03 °C/W
Densité du flux thermiqueDépassant 50 W/cm², atteignant 150 W/cm² dans certaines zones
Limite d'augmentation de la températureTempérature de la puce inférieure à 40 °C, température du GPU inférieure à 30 °C
Spécifications de la plaque de refroidissement liquide GB200

FiberMall est un fournisseur spécialisé de produits et solutions de communication optique, s'engageant à proposer des offres rentables aux centres de données mondiaux, aux environnements cloud, aux réseaux d'entreprise, aux réseaux d'accès et aux systèmes sans fil. Reconnu pour son leadership dans les réseaux de communication basés sur l'IA, FiberMall est le partenaire idéal si vous recherchez des solutions de communication optique de haute qualité et à valeur ajoutée.

Remonter en haut