Servidores GPU vs. Servidores Universais

O mercado de servidores GPU tem estado aquecido recentemente, e alguns clientes estão se perguntando se servidores universais podem ser equipados com placas GPU. Ou se uma máquina só precisa de 1-2 placas, funciona adotar um servidor universal + placa GPU? Servidores GPU e servidores universais são a classificação atual do mercado de servidores com base em cenários de negócios. Não há distinções estritas entre os dois. Pode-se entender que servidores GPU são servidores universais otimizados para melhor suporte a GPUs. Se tivermos que fazer uma comparação simples entre os dois, podemos discuti-la a partir dos dez aspectos a seguir.

1. Eles suportam diferentes números de placas GPU

Os servidores GPU geralmente suportam pelo menos 4 placas GPU. As placas convencionais no mercado incluem 4 placas, 8 placas, 10 placas, 20 placas, etc. As placas aqui se referem a placas padrão de largura dupla. A seguir está a vista traseira de um servidor GPU para referência. Os slots de GPU de 8 placas são slot1-slot8, e os slots de GPU de 10 placas são slot0-slot9.

Vista traseira do servidor GPU

Vista traseira do servidor GPU

Servidores universais: geralmente, servidores 2U não têm mais de 4 placas, e servidores 4U não têm mais de 6 placas, o que também se refere a placas padrão de largura dupla.

2. Eles suportam diferentes tipos de placa GPU

Servidor GPU: Tem boa compatibilidade de placas. Além de largura simples e dupla, alguns modelos de fabricantes também podem suportar placas de jogo de 2.5 ou 3 larguras para o consumidor. Por exemplo, o G5208 lançado pelo Stone Group suporta a versão de ventilador de 8 placas 4090, que é uma máquina inovadora. Seus parâmetros de suporte de GPU e diagrama de estrutura são os seguintes.

Diagrama de estrutura G5208

Diagrama de estrutura G5208

Servidores universais: principalmente de largura simples e dupla, e não suportam cartões de consumo de largura tripla, principalmente devido ao seu tamanho e dissipação de calor.

3. Eles têm diferentes formas de máquina:

Servidores GPU: geralmente servidores de nó único, sendo 4U o mais comum no mercado, e servidores torre-torre, bem como servidores NVlink de ponta em configurações 5U, 6U ou 8U.

Servidores universais: geralmente em formato 2U, mas também em formato de altura 1U, 2U2 de alta densidade, 2U4, 4U8, blade ou gabinete inteiro, com formatos de produtos mais diversos.

4. Eles têm topologias diferentes de GPU e CPU

Servidor GPU: Além do PCIE direct pass-through, ele também pode ser expandido por meio do PCIE sw. Existem vários tipos de topologia, incluindo balance, common e cascade. Ele pode selecionar de forma mais flexível para diferentes cenários de negócios do cliente (treinamento, raciocínio, renderização de vídeo, etc.), conforme mostrado na figura a seguir.

Comparação de três tipos de topologia

Comparação de três tipos de topologia

Servidores universais: geralmente passagem PCIE (raramente por meio de PCIe sw) e o número de GPUs suportadas é limitado.

5. Diferentes marcas de servidores

Servidor GPU: Exceto pelos principais fabricantes que desenvolvem suas próprias plataformas (LC, H3C, CJB, LX, etc.), a maioria dos outros usa plataformas AMD (claro, outros fabricantes ODM não são excluídos, como HQ, HS, etc.).

Servidores universais: Existem dezenas deles. Exceto pelas poucas empresas de ponta que são altamente envolvidas em autodesenvolvimento, a maioria das outras empresas usa servidores montados, com o foco principal de custo-efetividade.

6. O consumo de energia de todo o servidor varia muito

Servidor GPU: O consumo de energia é relativamente alto. Tomando o servidor de oito placas 4090 como exemplo, um servidor precisa de mais de 4KW. Por exemplo, a plataforma Supermicro de 8 placas convencional no mercado geralmente usa uma fonte de alimentação 2+2 2KW (claro, também pode ser configurada para um modo de trabalho 3+1);

Servidores universais: Servidores low-end geralmente têm 500-550W, e também há servidores de 800W, 100W, 1200W e 1600W. Normalmente, poucos servidores excedem 2KW.

7. Os preços de um único servidor são diferentes

Servidor GPU: A plataforma é 2-3 vezes maior que a de um servidor universal. O preço real de envio de uma unidade pode variar de 100,000 RMB a milhões. Isso depende principalmente do preço da placa GPU. Por exemplo, para 8 placas A100, o custo da plataforma é responsável por uma proporção muito pequena.

Servidores universais: tem uma grande faixa de preço de 10,000 RMB a 20,000 RMB a centenas de milhares de RMB, mas a maioria dos preços de venda está abaixo de 100,000 RMB, e o preço médio é de cerca de 30,000 a 50,000 RMB por unidade. É por isso que todo mundo gosta de vender servidores GPU agora. Um servidor GPU custa dez vezes mais que os outros, e se dezenas de máquinas de oito placas 4090 forem vendidas, a tarefa de desempenho de vendas é basicamente alcançada.

8. Eles têm diferentes quotas de mercado globais

Voltando dois anos, os servidores GPU representavam cerca de 20-25% de todo o mercado de servidores, enquanto os servidores padrão representavam mais de 70%. Agora, o mercado de GPU está crescendo, especialmente com a construção da AIDC. Estima-se aproximadamente que as remessas de modelos de GPU excederam 30% ou 40%. De acordo com as estatísticas da IDC, a participação no mercado doméstico de servidores de aceleração excedeu 30% em 2024.

9. Eles têm diferentes cenários de negócios de servidores

Os servidores GPU são geralmente usados ​​para renderização de vídeo e processamento gráfico, treinamento de IA, raciocínio de IA ou computação HPC, enquanto os servidores padrão podem ser usados ​​em qualquer lugar, como nuvens privadas, armazenamento distribuído, nós de gerenciamento e nós de computação geral HPC, etc.

10. Eles são de diferentes urgências de requisitos de tecnologia de resfriamento líquido

Servidores GPU são “devoradores de energia” e são a chave para reduzir o índice PUE em centros de computação inteligentes. Portanto, muitos centros de computação inteligentes que estão atualmente em construção ou se preparando para serem construídos planejaram resfriamento líquido para servidores GPU (placa fria e imersão). No entanto, o risco está na garantia da placa GPU. Uma vez que a placa GPU é convertida para resfriamento líquido, isso pode afetar a garantia do fabricante original (claro, esse problema é temporário, e não está descartado que os fabricantes de GPU lancem modelos especiais de resfriamento líquido no futuro. Na verdade, a NVIDIA lançou uma GPU A100 de largura única com resfriamento líquido há dois anos). Servidores universais não são tão urgentes quanto servidores GPU em termos de resfriamento líquido e eles têm uma estrutura relativamente simples e são mais maduros do que servidores GPU em termos de conversão de placa fria de resfriamento líquido ou adaptação de imersão.

Deixe um comentário

Voltar ao Topo