NVIDIAGB300

Embora a Nvidia esteja enfrentando diversas pressões perto do final do ano, de acordo com fontes da cadeia de suprimentos, a Nvidia ainda planeja lançar sua plataforma de servidor de IA GB300 de próxima geração na conferência GTC, que será realizada de 17 a 20 de março de 2025.

A plataforma passou por uma série de novas atualizações, alcançando uma melhoria geral em desempenho e configuração, e se tornará uma nova ferramenta para a NVIDIA aumentar seu desempenho. Além disso, várias melhorias visam elevar o desempenho e a eficiência para atender ainda mais às crescentes necessidades da computação de IA.

Chip NVIDIA

Servidor NVIDIA GB300 totalmente atualizado

Especificamente, o servidor NVIDIA GB300 AI integra a nova GPU Blackwell Ultra série B300, com uma potência de 1400 W e uma melhoria de desempenho FP4 de placa única de 1.5 vez.

No nível HBM, comparado com a pilha de oito camadas do GB200, o GB300 usará o HBM3E com uma pilha de 12 camadas, e a capacidade será aumentada de 192 GB para 288 GB. Ele também introduzirá novas bandejas de resfriamento líquido, placas frias e peças UQD (Universal Quick Disconnect) para linhas de resfriamento líquido.

Além disso, a placa de rede óptica será atualizada de CX7 para CX8, e o transceptor óptico será atualizado de 800G para 1.6T.

Outras atualizações incluem o uso de um design de slot, a placa de computação usará LPCAMM e a bandeja de capacitância pode se tornar padrão para o gabinete GB300 NVL72, e a BBU (unidade de backup de bateria) pode ser opcional.

A cadeia de suprimentos destacou que o preço de produção em massa de um módulo BBU é de cerca de US$ 300, e estima-se que o preço total do BBU em um sistema GB300 chegará a US$ 1,500; O preço de produção de um supercapacitor é de cerca de US$ 20 a US$ 25, e um rack GB300 NVL72 requer mais de 300 capacitâncias.

No entanto, houve relatos recentes de que a Nvidia encontrou desafios na cadeia de suprimentos no desenvolvimento dos servidores GB300 e B300 AI, especialmente o problema de superaquecimento do chip 5×5 DrMOS, componente-chave, produzido pela AOS, o que pode afetar o progresso da produção em massa.

A Foxconn será a maior vencedora

Em resposta às atualizações de produtos da Nvidia, fabricantes da cadeia de suprimentos como Foxconn e Quanta agiram rapidamente e entraram na fase de P&D e design do servidor GB300 AI.

É relatado que a NVIDIA finalizou preliminarmente a configuração do pedido do servidor NVIDIA GB300 AI, com a Foxconn ainda sendo o maior fornecedor. Espera-se que os servidores NVIDIA GB300 AI estejam disponíveis no primeiro semestre de 2025, liderando seus pares globais.

Fontes do setor destacaram que, assim como a estratégia da Apple de lançar um novo iPhone todo ano, o CEO da Nvidia, Jensen Huang, anunciou anteriormente que a Nvidia também seguirá o ritmo de "lançar uma nova geração de produtos de IA todo ano". Os principais parceiros devem se mobilizar com antecedência para acompanhar o ritmo de desenvolvimento de produtos da Nvidia.

A análise da cadeia de suprimentos mostra que, além de suas vantagens altamente integradas verticalmente, o Foxconn Group também investiu pesadamente na pesquisa e desenvolvimento inicial de servidores de IA da NVIDIA. As duas partes começaram a cooperar já em 2017 e estabeleceram um relacionamento cooperativo próximo no desenvolvimento de novos produtos, desde a primeira geração de servidores de IA até os atuais GB200 e até GB300.

Tomando o servidor GB200 AI como exemplo, além da GPU e da CPU, os componentes que a Foxconn pode fornecer representam cerca de 80% a 90%.

Insiders da indústria revelaram que a Quanta e a Inventec também são parceiras importantes do servidor GB300 AI da NVIDIA. Em termos de participação de pedidos, a Quanta é a segunda maior fornecedora depois da Foxconn, enquanto a Inventec deve crescer.

O GB200 atingirá o pico de embarques em 2025

De acordo com as últimas pesquisas de mercado, as remessas de chips GB200 da Nvidia no quarto trimestre de 2024 devem ser de aproximadamente 150,000 a 200,000 unidades, e as remessas no primeiro trimestre de 2025 devem aumentar significativamente em 200% a 250%. 

No entanto, o cronograma de remessa dos gabinetes GB200 foi adiado. Como as especificações de design da solução em termos de interface de interconexão de alta velocidade e consumo de energia do design térmico são significativamente maiores do que as do mercado convencional, a cadeia de suprimentos precisa de mais tempo para ajuste e otimização. Espera-se que o pico de remessa dos gabinetes GB200 seja adiado para entre o segundo e o terceiro trimestres de 2025. 

Além disso, o valor TDP do gabinete GB200 NVL72 é tão alto quanto 140KW, e a solução de resfriamento a ar tradicional não pode mais atender às suas necessidades. Portanto, a tecnologia de resfriamento líquido se tornou uma necessidade, e as indústrias relacionadas estão intensificando seus esforços de pesquisa e desenvolvimento em componentes de resfriamento líquido para melhorar a eficiência da dissipação de calor. 

No geral, embora o volume de remessas de chips GB200 esteja crescendo rapidamente, ainda levará algum tempo para que a solução do tipo gabinete seja totalmente implementada, e espera-se que o pico de remessas ocorra em meados de 2025.

Olhando mais adiante, espera-se que o design de alto consumo de energia do GB300 promova o desenvolvimento da indústria de resfriamento líquido, da qual os fabricantes da cadeia de suprimentos relacionados podem se beneficiar.

Deixe um comentário

Voltar ao Topo