Mergulho profundo no design da placa de resfriamento líquido NVIDIA GB200: resfriamento líquido avançado para chips de IA

Chips de IA de última geração, como o GB200 da NVIDIA, estão expandindo os limites do desempenho. Mas essa imensa potência tem um custo: uma geração de calor impressionante. Um único chip GB200 consome até 2700 W de energia. Com tamanha potência em um espaço tão compacto, os sistemas tradicionais de refrigeração a ar simplesmente não conseguem acompanhar. A única maneira de manter o resfriamento desses chips é por meio de uma tecnologia avançada de refrigeração líquida.

interior do servidor small_nvidia-gb200
Chips de IA de última geração

Os números por trás do desafio de resfriamento GB200

Para entender a solução, precisamos primeiro nos aprofundar no problema. O calor produzido pelo GB200 não é apenas alto — é extremamente concentrado. Isso é conhecido como densidade de fluxo de calor.

O chip gera um fluxo de calor superior a 50 W/cm², equivalente à produção de 50 W de calor em uma área do tamanho de uma pequena unha. Em certas áreas de alta temperatura, o fluxo de calor pode chegar a 150 W/cm². Se não for controlado, esse calor pode danificar rapidamente o chip. Portanto, o aumento de temperatura (Tc) do chip normalmente deve ser mantido abaixo de 40 °C, enquanto a própria GPU exige limites ainda mais rigorosos — abaixo de 30 °C.

Para atingir esses valores, é necessário um sistema de refrigeração com duas características principais:

  1. Resistência térmica extremamente baixa (abaixo de 0.03 °C/W). Isso significa que a placa de resfriamento pode remover calor do chip com eficiência.
  2. Baixa resistência ao fluxo (não mais que 20 kPa). Isso garante que o líquido de arrefecimento passe facilmente pela placa sem a necessidade de bombas potentes e consumidoras de energia.
GB200_gpu

Dentro da Placa Fria: Estrutura e Física do Fluxo

Para atingir esses números impressionantes, os engenheiros usam um projeto especial chamado placa fria de microcanal, normalmente fabricado usando um processo de aletas desbastadas (também conhecido como processo de desbaste).

Estrutura de microcanais usando aletas laminadas

A placa de resfriamento geralmente é feita de cobre, um excelente condutor térmico (condutividade térmica de 385 W/mK). Em seguida, ferramentas especiais são usadas para desbastar aletas finas diretamente da base de cobre. Isso forma uma série de pequenos canais paralelos.

  • A espessura da aleta (t) é geralmente ≤0.5 mm.
  • O espaçamento entre as aletas (P) também é ≤0.5 mm.
  • A altura da barbatana (L) é normalmente ≥3 mm.
Estrutura de microcanais usando aletas laminadas
barbatanas

Essas dimensões minúsculas criam uma enorme área de superfície interna, que é crucial para absorver calor no líquido refrigerante que flui pelos canais.

A estrutura dos microcanais é crucial. A relação entre a altura das aletas (L) e o espaçamento (P) determina como o líquido flui.

Compreendendo os Canais de Fluxo Interno

A maneira como o líquido flui nesses minúsculos canais é vital. Os engenheiros usam algumas fórmulas-chave para analisar isso.

Primeiro, calcule o diâmetro hidráulico do canal (Dh), que representa o tamanho efetivo do fluxo de fluido no canal. A fórmula é:

Dh = 2(PL)/(P+L)*

Como a altura da aleta (L) é muito maior que o espaçamento (P) e a relação L/P geralmente é superior a 15, a fórmula se simplifica para: Dh ≈ 2P. Isso nos diz que o tamanho efetivo do canal está diretamente relacionado ao pequeno espaçamento entre as aletas.

Em seguida, os engenheiros usam o número de Reynolds (Re) para determinar o tipo de fluxo:

Re = ρ * V * Dh / μ

Onde ρ é a densidade do fluido, V é a velocidade e μ é a viscosidade. Para uma placa fria típica, a velocidade do fluxo (V) é geralmente menor que 0.1 m/s. Os cálculos mostram que o número de Reynolds (Re) é menor que 2000. Isso confirma que o fluxo é estável e previsível, conhecido como fluxo laminar.

Compreendendo os Canais de Fluxo Interno

Como melhorar o desempenho da placa fria

Com base nesse conhecimento, os engenheiros sabem exatamente quais ajustes são necessários para aprimorar o desempenho da placa de resfriamento. Há dois objetivos principais:

  1. Reduzir a resistência ao fluxo

Para facilitar o fluxo do líquido, os engenheiros podem:

  • Reduza a velocidade do fluxo (V) entre as aletas.
  • Encurte o comprimento das aletas ao longo da direção do fluxo.
  • Aumentar a transferência de calor por convecção

Para tornar o resfriamento da placa mais eficaz, eles precisam aumentar o coeficiente de transferência de calor (h). Uma descoberta interessante é que, para esse fluxo laminar, a velocidade (V) tem pouco impacto em "h". Portanto, eles têm duas outras opções:

  • Aumente a condutividade térmica do líquido (k) selecionando um refrigerante mais eficaz.
  • Reduzir o diâmetro hidráulico equivalente (Dh), o que significa essencialmente tornar os canais menores e mais estreitos.

Ao aplicar esses princípios e cálculos precisos, os engenheiros podem projetar e ajustar sistemas eficientes refrigeração líquida placas. Esse trabalho meticuloso é crucial para o futuro da IA, garantindo que chips potentes como o GB200 possam atingir seu potencial máximo sem superaquecimento.

Aumentar a transferência de calor por convecção

Especificações da placa de resfriamento líquido GB200

itemConteúdo
PlataformaGB200
FormatoSuperchip Grace Blackwell
Plataforma2 GPUs Blackwell + CPU Grace
TDP2700 W (2 GPUs de 1200 W + CPU de 300 W)
Tamanho do componente de resfriamento líquido189.5×270.4×28.5mm (LxAxP)
Peso do componente da placa fria2.9KG
RefrigerantePG25
Conector RápidoCEJN ou CPC UQD04
Material do tubo de resfriamento líquidoAço inoxidável ou EPDM
Temperatura de entrada45 ℃
Quociente de vazão1.8 LPM
Resistência a Fluidos< 20 kPa
Resistência térmicaExtremamente baixo, abaixo de 0.03°C/W
Densidade de fluxo de calorSuperior a 50W/cm², chegando a 150W/cm² em algumas áreas
Limite de aumento de temperaturaTemperatura do chip abaixo de 40°C, temperatura da GPU abaixo de 30°C
Especificações da placa de resfriamento líquido GB200

A FiberMall é uma fornecedora especializada em produtos e soluções de comunicação óptica, comprometida em fornecer soluções econômicas para data centers globais, ambientes de computação em nuvem, redes corporativas, redes de acesso e sistemas sem fio. Reconhecida por sua liderança em redes de comunicação habilitadas por IA, a FiberMall é a parceira ideal se você busca soluções de comunicação óptica de alta qualidade e valor agregado.

Voltar ao Topo