O resfriamento líquido é eficiente o suficiente para Blackwell?

À medida que a tecnologia de IA continua a avançar, mais data centers estão se voltando para o resfriamento líquido. Comparado aos métodos tradicionais de resfriamento a ar, o resfriamento líquido — especialmente o Resfriamento Líquido Direto (DLC) — oferece eficiência de dissipação de calor significativamente maior. A condutividade térmica do líquido é de 50 a 3,000 vezes maior que a do ar, permitindo melhor gerenciamento térmico em ambientes de servidores de alta densidade que geram calor substancial. Além disso, o resfriamento líquido pode reduzir o consumo geral de energia. Pesquisas indicam que a transição de sistemas de ar para sistemas líquidos pode reduzir o uso de energia da instalação em 27% e o consumo total de energia do local em 15.5%. Outra vantagem do resfriamento líquido é sua operação mais silenciosa e menor pegada física.

Em resumo, o resfriamento líquido apresenta alta eficiência energética, operação silenciosa e vantagens de economia de espaço.

Soluções de resfriamento líquido CoolIT Systems

A CoolIT Systems (CoolIT), fundada em 2001, inicialmente projetou e distribuiu produtos de resfriamento líquido direto para a indústria de jogos de mesa. Em 2014, a empresa começou a desenvolver produtos para data centers e OEMs de servidores, e agora é considerada uma fornecedora líder de soluções de resfriamento líquido direto. Com sede em Calgary, Canadá, a CoolIT tem instalações de fabricação no Canadá e na China. Notavelmente, a CoolIT fornece suporte de resfriamento líquido para o El Capitan, considerado o supercomputador mais rápido do mundo.

CoolIT fornece suporte de refrigeração líquida para El Capitan

Recentemente, em meio a relatos de superaquecimento do Blackwell, a CoolIT Systems anunciou o lançamento do CHx1000, a Unidade de Distribuição de Refrigerante (CDU) líquido-líquido de maior densidade do mundo. Projetado especificamente para aplicações de missão crítica, o CHx1000 foi criado para resfriar a plataforma NVIDIA Blackwell e outras cargas de trabalho de IA exigentes que exigem resfriamento líquido.

Sistemas CoolIT

De acordo com o diretor de operações da CoolIT, Patrick McGinn, o CHx1000 aproveita mais de 20 anos de inovação em DLC e colaboração com os principais fabricantes de processadores e empresas de hiperescala, fornecendo 1000 kW de capacidade de resfriamento a taxas de fluxo de até 1.5 litros por minuto por quilowatt (LPM/kW) com uma temperatura de aproximação de 3 °C.

A CDU líquido-para-líquido CHx1000 resfriará inicialmente dez racks de plataforma NVIDIA GB200 NVL72 sem precedentes, fornecendo amplo desempenho para futuros chips de IA e servidores com densidades térmicas mais altas. O NVIDIA GB200 NVL72 oferece desempenho de inferência 30 vezes mais rápido e eficiência energética 25 vezes maior do que seu antecessor, tornando-o adequado para aplicações LLM de larga escala.

Projetado para manutenção em linha, o CHx1000 possui acesso frontal e traseiro e bombas, filtros e sensores substituíveis em campo sem interromper a operação. Seu design de alta confiabilidade inclui tubulação de aço inoxidável, filtros de 25 mícrons integrados e materiais molhados da mais alta qualidade. Os controles inteligentes ajustam dinamicamente o fluxo do refrigerante para a temperatura, fluxo e pressão precisos do chip. O dispositivo pode ser controlado remotamente por meio de uma tela sensível ao toque de 10 polegadas ou por meio de protocolos como Redfish, SNMP, TCP/IP e Modbus.

CHx1000

Resfriamento líquido direto Supermicro

A Supermicro lançou a solução SuperCluster, integrando GPUs NVIDIA Blackwell em uma configuração de rack com refrigeração líquida. Esta configuração melhora a densidade de computação da GPU e inclui recursos avançados, como coletores de distribuição de refrigerante vertical e placas frias aprimoradas para gerenciamento térmico ideal. O design aumenta a eficiência e reduz os custos operacionais, tornando-o adequado para implantações de IA em larga escala.

Na Computex deste ano, a SuperMicro anunciou sistemas otimizados para GPUs Blackwell da Nvidia, incluindo dispositivos 10U refrigerados a ar e 4U refrigerados a líquido para sistemas baseados em HGX B200. A empresa também está desenvolvendo um sistema HGX B100 refrigerado a ar e um rack GB200 NVL72 contendo 72 GPUs interconectadas por meio de switches Nvidia NVLink. Além disso, a SuperMicro se comprometeu a lançar sistemas baseados no Xeon 6 da Intel.

A SuperMicro se comprometeu a lançar sistemas baseados no Xeon 6 da Intel

A solução de rack refrigerado a líquido da Super-micro consiste em vários componentes projetados internamente, incluindo:

  1. Unidade de Distribuição de Refrigerante (CDU): Esta unidade inclui um sistema de bombeamento que circula o refrigerante para as placas frias que resfriam as CPUs e GPUs. A CDU da Supermicro integra dois módulos de bombeamento redundantes e hot-swappable e módulos de energia para garantir quase 100% de tempo de atividade. Ela tem uma capacidade de resfriamento de até 100 kW, permitindo uma densidade de rack muito alta. A CDU também possui uma tela sensível ao toque fácil de usar, acessível via WebUI para monitorar e controlar as operações do rack, e é integrada ao software de gerenciamento de data center Super Cloud Composer da Supermicro. O sistema de controle otimiza o consumo de energia ao mesmo tempo em que garante um resfriamento eficiente para todas as CPUs e GPUs, com estratégias anticondensação eficazes para evitar qualquer degradação do desempenho do hardware.
  2. Coolant Distribution Manifold (CDM): O CDM fornece refrigerante para cada servidor e coleta o refrigerante aquecido de volta para a CDU. Existem dois tipos de CDMs:
  3. Vertical: Colocados na parte de trás do rack, esses manifolds se conectam diretamente à CDU por meio de mangueiras. Eles fornecem refrigerante para as placas frias do sistema, com mangueiras de entrada e saída na parte de trás do rack.
  4. Horizontal: Localizados na parte frontal do rack dentro de um espaço de rack 1U, esses coletores conectam os coletores verticais na parte traseira às placas frias em sistemas na parte frontal do rack (por exemplo, SuperBlades e servidores GPU 8U).
  5. Cold Plates: Cold plates são colocadas em cima das CPUs e GPUs, com o refrigerante fluindo através de seus microcanais para resfriar os chips de forma eficiente. As cold plates da Supermicro são projetadas para minimizar pontos quentes nos chips e atingir resistência térmica ultrabaixa.
prateleira

Sistema de resfriamento líquido Lenovo Neptune

O Lenovo ThinkSystem N1380 Neptune é um sistema de resfriamento líquido vertical de sexta geração projetado para resfriar com eficiência racks de servidores de alta densidade, alcançando configurações acima de 100 kW sem exigir ar condicionado especializado. Este sistema de resfriamento direto de água morna em circuito aberto reduz significativamente o consumo de energia — 40% menor do que os métodos de resfriamento tradicionais. A expertise da Lenovo em resfriamento líquido vem da aquisição da tecnologia de servidores da IBM, estabelecendo-a como líder no campo.

A solução de resfriamento direto de água recircula água morna para resfriar sistemas de data center, mantendo todos os componentes do servidor resfriados e reduzindo a necessidade de ventiladores de sistema que consomem muita energia. O design patenteado de placa fria, otimizado para CPUs e aceleradores, maximiza a capacidade de resfriamento dos aceleradores, atualmente lidando com consumo de energia em torno de 700 W, com projetos futuros esperados para exceder 1000 W. O novo design de resfriamento de água morna (Neptune™ Warm Water Cooling) permitirá a operação sem qualquer ar condicionado especializado de data center.

Sistema de resfriamento líquido Lenovo Neptune

Deixe um comentário

Voltar ao Topo