Quantos transceptores ópticos o ChatGPT requer?

A FiberMall extrapolou a infraestrutura de IA, incluindo transceptores ópticos que o ChatGPT traz para a mesa.

A diferença de um data center tradicional é que com o InfiniBand estrutura de árvore gorda comum à IA, mais switches são usados ​​e o número de portas upstream e downstream em cada nó é idêntico.

Topologia de datacenter tradicional e rede livre de gordura

Uma das unidades básicas correspondentes ao modelo de agrupamento AI usado pela NVIDIA é o SuperPOD.

Um SuperPOD padrão é construído com 140 servidores GPU DGX A100, HDR InfiniBand 200G NICse 170 switches NVIDIA Quantum QM8790 com 200G e 40 portas cada.

Baseado na solução NVIDIA, um SuperPOD com 170 switches, cada switch possui 40 portas, sendo que a forma mais simples é interligar 70 servidores cada, e o requisito de cabo correspondente é 40×170/2=3400, considerando a situação real de implantação até 4000 cabos. Entre eles, a proporção do cabo de cobre: ​​AOC: módulo óptico = 4:4:2, correspondente ao número de transceptores ópticos necessários = 4000 * 0.2 * 2 = 1600, ou seja, para um SuperPod, a proporção do servidor: switch : uso do módulo óptico = 140: 170: 1600 = 1: 1.2: 11.4

Um requisito semelhante aos requisitos básicos GPT4.0 requer aproximadamente 3750 servidores NVIDIA DGX A100. Os requisitos dos transceptores ópticos nesta condição estão listados na tabela a seguir.

Os requisitos do módulo óptico

De acordo com a IDC, o mercado global de servidores de IA é de US$ 15.6 bilhões em 2021 e deve chegar a US$ 35.5 bilhões até 2026. O tamanho do mercado da indústria de servidores de IA da China é de US$ 6.4 bilhões em 2021. De acordo com dados da IDC, são esperados embarques de portas 200/400G aumentar rapidamente em cenários de data center, com uma taxa composta de crescimento de 62% de 22 a 26 anos. Espera-se que as remessas globais de portas de switch ultrapassem 870 milhões em 2026, com um tamanho de mercado de mais de US$ 44 bilhões.

A FiberMall extrapola a demanda por servidores, switches e transceptores ópticos da arquitetura de data center de IA. Nesse processo de extrapolação, o FiberMall usa a proporção de 4:4:2. A utilização de módulos ópticos no data center está, em última análise, diretamente relacionada à demanda de tráfego. É provável que essa proporção exista apenas em capacidade total e ainda vale a pena estudar em profundidade como está o tráfego de serviço dentro do data center de AI.

Deixe um comentário

Voltar ao Topo