Serveurs GPU vs. Serveurs universels

Le marché des serveurs GPU est en plein essor ces derniers temps et certains clients se demandent si les serveurs universels peuvent être équipés de cartes GPU. Ou si une machine n'a besoin que de 1 à 2 cartes, est-il possible d'adopter un serveur universel + une carte GPU ? Les serveurs GPU et les serveurs universels sont la classification actuelle du marché des serveurs en fonction des scénarios commerciaux. Il n'y a pas de distinction stricte entre les deux. On peut comprendre que les serveurs GPU sont des serveurs universels optimisés pour mieux prendre en charge les GPU. Si nous devons faire une simple comparaison entre les deux, nous pouvons en discuter à partir des dix aspects suivants.

1. Ils prennent en charge un nombre différent de cartes GPU

Les serveurs GPU prennent généralement en charge au moins 4 cartes GPU. Les cartes les plus courantes sur le marché comprennent 4 cartes, 8 cartes, 10 cartes, 20 cartes, etc. Les cartes ici font référence aux cartes double largeur standard. Voici la vue arrière d'un serveur GPU pour référence. Les emplacements GPU à 8 cartes sont les emplacements 1 à 8 et les emplacements GPU à 10 cartes sont les emplacements 0 à 9.

Vue arrière du serveur GPU

Vue arrière du serveur GPU

Serveurs universels : En général, les serveurs 2U n'ont pas plus de 4 cartes et les serveurs 4U n'ont pas plus de 6 cartes, ce qui fait également référence aux cartes double largeur standard.

2. Ils prennent en charge différents types de cartes GPU

Serveur GPU : Il a une bonne compatibilité avec les cartes. En plus des cartes à simple et double largeur, certains modèles de fabricants peuvent également prendre en charge les cartes de jeu grand public de 2.5 ou 3 largeurs. Par exemple, le G5208 lancé par le groupe Stone prend en charge la version 8 à ventilateur à 4090 cartes, qui est une machine innovante. Ses paramètres de prise en charge du GPU et son diagramme de structure sont les suivants.

Diagramme de structure G5208

Diagramme de structure G5208

Serveurs universels : principalement à largeur simple et à double largeur, et ne peuvent pas prendre en charge les cartes grand public à triple largeur, principalement en raison de leur taille et de leur dissipation thermique.

3. Ils ont des formes de machines différentes :

Serveurs GPU : généralement des serveurs à nœud unique, le 4U étant le plus courant sur le marché, et des serveurs tour-tour, ainsi que des serveurs NVlink haut de gamme dans des configurations 5U, 6U ou 8U.

Serveurs universels : généralement au format 2U, mais également en hauteur 1U, haute densité 2U2, 2U4, 4U8, sous forme de lame ou d'armoire complète, avec des formes de produits plus diverses.

4. Ils ont une topologie de GPU et de CPU différente

Serveur GPU : en plus du transfert direct PCIE, il peut également être étendu via le logiciel PCIE. Il existe différents types de topologie, notamment l'équilibrage, la topologie commune et la topologie en cascade. Il peut être sélectionné de manière plus flexible pour différents scénarios commerciaux des clients (formation, raisonnement, rendu vidéo, etc.), comme le montre la figure suivante.

Comparaison de trois types de topologie

Comparaison de trois types de topologie

Serveurs universels : généralement via un passthrough PCIE (rarement via un logiciel PCIe) et le nombre de GPU pris en charge est limité.

5. Différentes marques de serveurs

Serveur GPU : À l'exception des principaux fabricants qui développent leurs propres plateformes (LC, H3C, CJB, LX, etc.), la plupart des autres utilisent des plateformes AMD (bien entendu, les autres fabricants ODM ne sont pas exclus, tels que HQ, HS, etc.).

Serveurs universels : il en existe des dizaines. À l'exception des quelques entreprises les plus performantes qui se consacrent à leur propre développement, la plupart des autres entreprises utilisent des serveurs assemblés, avec pour objectif principal la rentabilité.

6. La consommation électrique de l'ensemble du serveur varie considérablement

Serveur GPU : la consommation électrique est relativement élevée. Prenons l'exemple du serveur à huit cartes 4090, un serveur nécessite plus de 4 kW. Par exemple, la plate-forme à 8 cartes Supermicro la plus répandue sur le marché utilise généralement une alimentation 2+2 de 2 kW (bien entendu, elle peut également être réglée sur un mode de fonctionnement 3+1) ;

Serveurs universels : les serveurs bas de gamme ont généralement une puissance de 500 à 550 W, et il existe également des serveurs de 800 W, 100 W, 1200 1600 W et 2 XNUMX W. En général, peu de serveurs dépassent XNUMX kW.

7. Leurs prix pour un seul serveur sont différents

Serveur GPU : la plate-forme est 2 à 3 fois supérieure à celle d'un serveur universel. Le prix d'expédition réel d'une unité peut varier de 100,000 8 RMB à des millions. Cela dépend principalement du prix de la carte GPU. Par exemple, pour 100 cartes AXNUMX, le coût de la plate-forme représente une très faible proportion.

Serveurs universels : la gamme de prix est large, de 10,000 20,000 à 100,000 30,000 RMB, voire des centaines de milliers de RMB, mais la plupart des prix de vente sont inférieurs à 50,000 4090 RMB et le prix moyen est d'environ XNUMX XNUMX à XNUMX XNUMX RMB par unité. C'est pourquoi tout le monde aime vendre des serveurs GPU maintenant. Un serveur GPU coûte dix fois plus cher que les autres, et si des dizaines de machines XNUMX à huit cartes sont vendues, la tâche de performance commerciale est pratiquement accomplie.

8. Ils ont des parts de marché globales différentes

Il y a deux ans, les serveurs GPU représentaient environ 20 à 25 % de l'ensemble du marché des serveurs, tandis que les serveurs standard représentaient plus de 70 %. Aujourd'hui, le marché des GPU est en plein essor, notamment avec la construction d'AIDC. On estime approximativement que les expéditions de modèles de GPU ont dépassé 30 % ou 40 %. Selon les statistiques d'IDC, la part de marché nationale des serveurs d'accélération a dépassé 30 % en 2024.

9. Ils ont des scénarios commerciaux différents pour les serveurs

Les serveurs GPU sont généralement utilisés pour le rendu vidéo et le traitement graphique, la formation de l'IA, le raisonnement de l'IA ou le calcul HPC, tandis que les serveurs standard peuvent être utilisés n'importe où, comme les clouds privés, le stockage distribué, les nœuds de gestion et les nœuds de calcul général HPC, etc.

10. Les exigences en matière de technologie de refroidissement liquide sont différentes en termes d'urgence

Les serveurs GPU sont des « gouffres énergétiques » et sont la clé pour réduire l'indice PUE dans les centres de calcul intelligents. C'est pourquoi de nombreux centres de calcul intelligents actuellement en construction ou en préparation ont prévu un refroidissement liquide pour les serveurs GPU (à la fois par plaque froide et par immersion). Cependant, le risque réside dans la garantie de la carte GPU. Une fois la carte GPU convertie en refroidissement liquide, cela peut affecter la garantie du fabricant d'origine (bien sûr, ce problème est temporaire et il n'est pas exclu que les fabricants de GPU lancent des modèles spéciaux de refroidissement liquide à l'avenir. En fait, NVIDIA a lancé un GPU A100 à simple largeur refroidi par liquide il y a deux ans). Les serveurs universels ne sont pas aussi urgents que les serveurs GPU en termes de refroidissement liquide et ils ont une structure relativement simple et sont plus matures que les serveurs GPU en termes de conversion de plaque froide de refroidissement liquide ou d'adaptation par immersion.

Laisser un commentaire

Remonter en haut