Décomposer les cinq composants clés d'un serveur AI

Le DGX A100 ressemble à un ordinateur domestique classique et peut être divisé en cinq modules matériels principaux :

serveur
  1. Module de ventilateur : situé à l'avant, le module de ventilateur se compose de huit ventilateurs, qui s'alignent sur la configuration 8U standard des serveurs traditionnels.
  2. Disques durs : Placé sous le module de ventilateur avant, le DGX A100 abrite huit disques durs de 3.84 To, offrant une capacité de stockage interne totale de 30 To.
  3. Plateau de la carte GPU : la section arrière du serveur AI est l'endroit où les composants critiques se réunissent. Le plateau de la carte GPU est le cœur du système et différencie les serveurs IA des serveurs classiques. Dans l'architecture DGX A100, le plateau de la carte GPU comprend des composants GPU, des cartes de module et des composants NVSwitch, qui impliquent tous différents types de PCB.
  4. Plateau de la carte mère du processeur : cette partie sert de composant principal pour tous les serveurs, y compris les serveurs standards et AI. Il contient la carte mère CPU, la mémoire système, les cartes réseau et les commutateurs PCIE. La carte mère du processeur et la mémoire système contribuent de manière significative à l'utilisation globale du PCB.
  5. Module d'alimentation : la section arrière du DGX A100 comprend également six modules d'alimentation, utilisant en interne des PCB en cuivre épais.

D'un point de vue fonctionnel, nous pouvons classer le calcul de la valeur des PCB pour les serveurs IA en trois parties :

nvidia dgx a100
DGX A100 avant et arrière

Composants de la carte GPU

Valeur totale de 12,000 52 $, cartes de support (48 %) et PCB (XNUMX %). La carte GPU se compose de quatre composants principaux : supports GPU, NVSwitch, modules d'accélérateur OCP (OAM) et cartes de base d'unité (UBB).

Composants de la carte GPU

Supports GPU : Les GPU et DRAM NVIDIA A100 utilisent une technologie avancée de packaging 2.5D/3D. Les cartes porteuses, qui mesurent 70x70 mm à 100x100 mm et comportent 14 à 16 couches, correspondent directement au nombre de GPU. Compte tenu de la configuration du DGX A100 avec 8 GPU, chaque serveur AI nécessite 8 cartes porteuses GPU. Les recherches de l'industrie indiquent que la valeur d'une seule carte de support GPU est d'environ 100 $ (équivalent à 650 ¥ RMB), ce qui donne une valeur totale de 5,200 XNUMX $ par serveur.

2.5 Emballage et support 3D

NVSwitch : NVSwitch, basé sur le standard NVLink, facilite la communication entre GPU. Les supports pour NVSwitch sont similaires à ceux des supports GPU, avec des exigences de fabrication plus simples. Leur rôle clé est de gérer le transfert de données à haut débit. Les recherches suggèrent que la valeur d'un seul NVSwitch est d'environ 30 $ (195 ¥ RMB). Pour un DGX A100 avec 6 NVSwitches, la valeur totale est de 1,170 XNUMX $.

nvswitch

OAM (OCP Accelerator Module) : les OAM, également appelés modules accélérateurs GPU, transportent les puces GPU. Le nombre d'OAM correspond directement au nombre de GPU (8 dans le cas du DGX A100). Sur la base de dimensions similaires à celles de la version PCIE (267.7 mm x 111.15 mm), la surface estimée d'un OAM est d'environ 0.03 mètre carré. Les OAM nécessitent des types de PCB spécifiques en raison de la transmission du signal à grande vitesse. Pour la version DGX A100 SXM, cela implique 20 couches, un matériau CCL à très faible perte et la technologie HDI à 4 couches, ce qui donne un prix unitaire de 12,000 14 $ par mètre carré. La version PCIE utilise 4 couches, un matériau à ultra faible perte et un matériau CCL FR7,000 à Tg élevée, avec un prix unitaire correspondant de 100 2,880 $ par mètre carré. Au total, les OAM d'un serveur IA haut de gamme (configuré comme le DGX AXNUMX) ont une valeur unitaire de XNUMX XNUMX $.

Module accélérateur OCP

UBB (Unit Baseboard) : Les UBB sont des PCB utilisés pour monter l'ensemble de la plate-forme GPU. Chaque serveur AI nécessite un UBB. Sur la base des spécifications du DGX A100 et des recherches de l'industrie, nous estimons la superficie de l'UBB à environ 0.30 mètre carré. Ces cartes utilisent des PCB traversants à 26 couches avec un matériau CCL à très faible perte, ce qui entraîne un prix unitaire de 10,000 3,000 $ par mètre carré. La valeur totale des UBB par serveur est de XNUMX XNUMX $.

La carte GPU NVIDIA DGX A100 comprend quatre parties principales : supports GPU, NVSwitch, modules d'accélérateur OCP (OAM) et cartes de base d'unité (UBB). Une fois combinés, ces composants occupent une surface totale de PCB de 0.624 mètres carrés, ce qui correspond à une valeur par serveur de 12,250 XNUMX $. Spécifiquement:

Les supports GPU contribuent à hauteur de 6,370 52 $ (XNUMX % de la valeur totale).

Les composants au niveau des PCB contribuent à hauteur de 5,880 48 $ (XNUMX % de la valeur totale).

Composants de la carte mère du processeur

L'ensemble carte mère CPU comprend des supports de CPU, des cartes mères de CPU et des cartes d'accessoires fonctionnelles. Ces accessoires comprennent les cartes mémoire système, les cartes réseau, les cartes d'extension et les cartes de pilotes du système d'exploitation de stockage. Voici la répartition :

Carte mère CPU DGX A100

Supports de processeur : les spécifications sont similaires à celles des supports de GPU, chaque support de processeur a une valeur estimée à 100 $. Avec le DGX A100 configuré avec 2 processeurs, la valeur totale par serveur est d'environ 1,300 XNUMX $.

Carte mère CPU : responsable du logement de la puce CPU, de la puce PCIE Switch, du module TPM et de diverses cartes accessoires fonctionnelles, la carte mère CPU adhère à la conception du processeur AMD Rome à 64 cœurs et à la norme de bus PCIE 4.0. Il utilise 10 à 12 couches de matériau CCL à faible perte et une conception traversante. La superficie estimée de la carte mère du processeur est de 0.38 mètre carré, ce qui représente une valeur par serveur de 1,140 XNUMX $.

Cartes d'accessoires fonctionnels : ces cartes servent à diverses fins :

Les cartes mémoire CPU (32 unités, totalisant 2 To de RAM) ont une taille standard d'environ 0.004 mètre carré par carte.

Les cartes réseau (série Mellanox ConnectX) sont disponibles en 10 variantes (8 IB à port unique 200 Gb/s et 2 Ethernet 200 Gb/s à double port). Chaque carte occupe une superficie d'environ 0.012 mètre carré.

Les cartes Riser (pour étendre les interfaces PCIE) couvrent une superficie d'environ 0.01 mètre carré.

Les cartes de pilotes du système d'exploitation de stockage (hébergeant deux disques NVMe M.1.92 de 2 To) occupent une zone similaire.

La superficie totale des cartes accessoires fonctionnelles est de 0.27 mètre carré, ce qui correspond à une valeur d'environ 405 $ par serveur.

Résumé pour la carte mère CPU : La surface totale du PCB pour l'assemblage de la carte mère CPU NVIDIA DGX A100 est de 0.662 mètres carrés, avec une valeur par serveur d'environ 2,845 XNUMX $. La répartition est la suivante :

Les composants au niveau de l'opérateur contribuent à 46 % de la valeur totale.

Les composants de la carte mère au niveau PCB contribuent à 40 % de la valeur totale.

Les composants accessoires fonctionnels au niveau PCB contribuent à 14 % de la valeur totale.

Autres composants

Valeur totale par unité 226 CNY Outre l'assemblage de la carte GPU et l'assemblage du module CPU, d'autres composants incluent l'alimentation électrique, les disques durs et la carte de la console de commande avant. Selon des recherches industrielles, ces composants utilisent principalement 6 à 10 couches de CCL (stratifié cuivré) de qualité FR4/Mid Loss avec un prix unitaire allant de 1000 1500 à 100 XNUMX CNY par mètre carré. En nous référant aux spécifications du DGX AXNUMX, nous calculons l'utilisation et la superficie comme suit :

  • Alimentation : étant donné que le DGX A100 est équipé de 6 alimentations, nous estimons que la surface PCB individuelle pour chaque alimentation est de 0.019 mètres carrés, sur la base des spécifications de l'alimentation du serveur Delta Electronics 2200 2200 W (modèle DPS-2-AB). -73.5) mesurant 265.0 x XNUMX mm.
  • Disques durs : Avec 8 disques durs dans le DGX A100, nous estimons que la surface PCB de chaque disque est de 0.008 mètres carrés, ce qui correspond aux disques standard de 3.5 pouces.
  • Carte de console de contrôle avant : Cette carte est principalement utilisée pour contrôler les périphériques externes et est placée entre les 8 disques durs. Sur la base de recherches industrielles, nous estimons sa superficie à environ 0.010 mètre carré.

En combinant l'assemblage de la carte GPU, l'assemblage du module CPU et d'autres composants, nous estimons que la surface totale du PCB pour le DGX A100 est de 1.474 mètres carrés, avec une valeur unitaire de 15,321 CNY. Spécifiquement:

L'assemblage de la carte GPU contribue à 12,000 80 CNY par unité, soit XNUMX % de la valeur totale.

L'assemblage du module CPU a une valeur unitaire de 2,845 19 CNY, soit XNUMX % du total.

Les autres composants contribuent à hauteur de 226 CNY par unité, soit 1 % de la valeur totale.

En termes de classification des cartes, le niveau des cartes de support a une valeur unitaire de 7,670 50.1 CNY (7,651 %), tandis que le niveau des cartes PCB contribue à hauteur de 49.9 XNUMX CNY (XNUMX %).

Laisser un commentaire

Remonter en haut