Na recente conferência CES, Jensen Huang, vestindo uma nova jaqueta, anunciou o lançamento oficial da RTX 5090.

Aqui estão os preços das GPUs da série 50.
RTX 5090: US$ 1999 / RTX 5090 D: 16,499 RMB
RTX 5080: US$ 999 / 8,299 RMB
RTX 5070 Ti: US$ 749
RTX 5070: US$ 549

A RTX 5090 e a RTX 5080 estarão disponíveis a partir de 30 de janeiro, enquanto a RTX 5070 Ti e a RTX 5070 serão lançadas em fevereiro. Os laptops da série RTX 50 serão lançados em março.
Huang também apresentou o novo superchip para data center, Grace Blackwell NVLink72, que conta com 72 GPUs Blackwell, 1.4 exaFLOPS de poder de computação e 1.3 trilhão de transistores, com o objetivo de superar os supercomputadores mais rápidos do mundo.


Além disso, o primeiro supercomputador de mesa verdadeiro do mundo, o Project Digits, foi revelado, custando apenas US$ 3000. Com ele, você pode executar modelos grandes de 200 bilhões de parâmetros diretamente na sua mesa, ocupando apenas o espaço de uma caneca de café, mas fornecendo poder de computação de nível de data center.

Equipado com o novo super chip GB10 Grace Blackwell, o Project Digits pode oferecer desempenho de até 1 PFLOPS com precisão FP4.
Huang prevê que, no futuro, todo cientista de dados, pesquisador e aluno terá um supercomputador pessoal de IA do Project Digits em sua mesa. A era da IA pertencerá a todos.

Durante a estreia da RTX 5090, o DLSS 4 também foi introduzido. Após meses de vazamentos e rumores, a nova geração de GPUs RTX Blackwell foi oficialmente revelada com os seguintes parâmetros de desempenho:
- 92 bilhões de transistores
- 4000 TOPS de poder de computação de IA
- 380 TFLOPS de desempenho de traçado de raios
- 125 TFLOPS de desempenho de shader
- 32 GB de memória GDDR7
- Largura de banda de memória de 1792 GB/s
- Até 21,760 núcleos CUDA
Vale ressaltar que o poder de computação de IA da RTX 5090 D é de apenas 2375 TOPS, mas ainda é o dobro do da 4090 D.

Com configurações tão luxuosas e o suporte de DLSS 4 e arquitetura Blackwell, o desempenho da RTX 5090 é diretamente o dobro do da RTX 4090. No entanto, isso também significa que ela tem alto consumo de energia, com uma potência total da placa de vídeo de 575 watts e uma fonte de alimentação recomendada de 1000 watts.
Uma demonstração mostrou que rodar “Cyberpunk 2077” na RTX 5090 com DLSS 4 habilitado atingiu 238 quadros por segundo, em comparação com apenas 106 quadros por segundo na RTX 4090 com DLSS 3.5 habilitado.

A RTX 5080 é duas vezes mais rápida que a RTX 4080, equipada com 16 GB de memória GDDR7, uma largura de banda de memória de 960 GB/s e 10,752 núcleos CUDA. A RTX 5070 Ti vem com 16 GB de memória GDDR7, largura de banda de 896 GB/s e 8,960 núcleos CUDA. A RTX 5070 tem 12 GB de memória GDDR7, capacidade de 672 GB/s e 6,144 núcleos CUDA. Jensen Huang até afirmou que a RTX 5070, com preço de US$ 549, fornecerá desempenho de nível RTX 4090, graças ao DLSS 4.




Além disso, Huang apresentou a GPU RTX Blackwell com uma demonstração de renderização em tempo real. Ele afirmou: "A nova geração de DLSS não apenas gera quadros, mas também prevê o futuro. Nós impulsionamos a IA com a GeForce, e agora a IA está revolucionando a GeForce." Os novos shaders neurais RTX da NVIDIA podem ser usados para compactar texturas de jogos, e as faces neurais RTX aproveitam a IA generativa para aprimorar a qualidade facial. O DLSS de última geração inclui tecnologia de geração de vários quadros, produzindo até três quadros adicionais por quadro tradicional, aumentando as taxas de quadros em até 8 vezes. O DLSS 4 também emprega Transformers em aplicativos em tempo real para aprimorar a qualidade da imagem, reduzir fantasmas e adicionar mais detalhes a cenas dinâmicas.

Vale ressaltar que a NVIDIA introduziu um novo design para a série RTX 50 Founders Edition, com ventiladores de fluxo axial duplo, uma câmara de vapor 3D e memória GDDR7. Todas as GPUs da série RTX 50 suportam PCIe Gen 5 e são equipadas com interfaces DisplayPort 2.1b, capazes de conduzir resolução de 8K a 165 Hz. Surpreendentemente, a RTX 5090 Founders Edition é uma placa de vídeo de dois slots, tornando-a adequada para gabinetes de fator de forma pequeno — uma mudança significativa em comparação com a RTX 4090.

Jim Fan, cientista sênior da NVIDIA, destacou a “essência” da apresentação de Jensen Huang sobre tecnologia gráfica. Huang explicou que as novas GPUs usam redes neurais para gerar mais de 90% dos pixels em jogos. Algoritmos tradicionais de ray tracing renderizam apenas cerca de 10% do conteúdo, semelhante a um “rascunho”, com modelos generativos preenchendo os detalhes restantes em tempo real. Senhoras e senhores, a IA é a nova geração de tecnologia gráfica.

Após a estreia das GPUs da série 50, Huang mencionou que a “lei de escala continua”:
- A primeira lei de escala é o pré-treinamento.
- A segunda lei de escala é pós-treinamento.
- A terceira lei de escala é a computação em tempo de inferência.

Essas leis de escala em evolução impulsionam a imensa demanda computacional por IA. Espantosamente, aproximadamente 15 centros de supercomputação, incluindo os da Microsoft, Meta e xAI, já estão equipados com GPUs Blackwell.

Em seguida, ele mencionou agentes de IA como um exemplo perfeito de escala durante os testes. Além disso, ele anunciou o lançamento de uma série de modelos fundamentais de licença aberta chamados Llama Nemotron, que fornecem alta precisão para várias tarefas de agentes de IA. Jensen Huang declarou: “Agentes de IA podem ser a próxima indústria de robótica, potencialmente representando uma oportunidade multitrilionária.”



Além disso, o NIM Blueprint da NVIDIA estará disponível em breve para PC. Com esses blueprints, os desenvolvedores podem criar podcasts com base em documentos PDF e gerar imagens impressionantes guiadas por cenas 3D.

Supercomputador de IA de nível desktop capaz de executar 4.05 trilhões de parâmetros LLM
Antes de concluir a conferência CES, Jensen Huang revelou um produto revolucionário — o Projeto Digits — um verdadeiro “supercomputador de mesa!” Ele foi projetado para desenvolvedores de IA, cientistas de dados, estudantes e outros profissionais envolvidos em trabalhos de IA.

Este computador compacto é o menor supercomputador de IA do mundo capaz de executar um modelo de 200 bilhões de parâmetros, com preço de US$ 3,000 (aproximadamente ¥ 21,986). Conforme demonstrado por Huang, este sistema de desktop compacto fornece imenso poder de computação enquanto ocupa um espaço mínimo na mesa — aproximadamente a largura de uma xícara de café média e aproximadamente metade de sua altura. Imagine ter um dispositivo em miniatura em sua mesa que oferece poder de computação de nível de data center. Este é o avanço revolucionário trazido pelo Projeto Digits!
O Project Digits apresenta o novo superchip GB10 Grace Blackwell, capaz de fornecer até 1 PFLOPS (petaflops) de desempenho de IA com precisão de FP4.

Este poderoso chip também inclui uma CPU Grace de 20 núcleos baseada em ARM. A CPU e a GPU são interconectadas usando a tecnologia NVIDIA NVLink C2C para comunicação de alta velocidade. Cada Project Digits é equipado com 128 GB de memória unificada de baixo consumo e altamente consistente, e até 4 TB de armazenamento NVME. Com esta configuração, os desenvolvedores podem executar modelos de até 200 bilhões de parâmetros diretamente em seus desktops. Além disso, com o chip de rede ConnectX, dois supercomputadores Project Digits podem ser interconectados para executar modelos com até 4.05 trilhões de parâmetros.

Além disso, o Project Digits vem pré-instalado com o sistema operacional básico NVIDIA DGX (baseado no Ubuntu Linux) e a pilha de software NVIDIA AI, fornecendo aos desenvolvedores um ambiente de desenvolvimento de IA plug-and-play. Os desenvolvedores podem começar rapidamente com seus projetos de IA imediatamente. Para milhões de desenvolvedores, será um produto inovador que mudará o jogo, especialmente para aqueles que precisam de recursos de computação em nuvem/data center para executar grandes modelos de IA. Este supercomputador de IA de desktop tem uma ampla gama de aplicações, incluindo experimentação e prototipagem de modelos de IA, ajuste fino e inferência de modelos (para teste ou avaliação de modelos) e serviços de inferência de IA local (como chatbots ou assistentes de inteligência de código). Além disso, os cientistas de dados podem utilizar o sistema para executar o NVIDIA RAPIDS, lidando com eficiência com fluxos de trabalho de ciência de dados em larga escala diretamente em seus desktops.

Com o suporte abrangente da pilha de tecnologia de IA da NVIDIA (frameworks, ferramentas, APIs), o Project Digits se torna uma plataforma de desenvolvimento ideal para aplicativos de computação de ponta, particularmente em campos de robótica e VLM (modelos de visão-linguagem). O advento do Project Digits marca uma nova era na computação de IA pessoal. Ele permite que desenvolvedores em todo o mundo executem modelos de IA em larga escala em seus desktops, complementando os recursos de computação em nuvem existentes e aprimorando significativamente a eficiência do desenvolvimento de IA.
A Nova Era da IA Física: Modelo de Mundo de Código Aberto
Após a introdução da IA inteligente, Jensen Huang agora direcionou a conversa para a “IA Física”. Em sua visão, “a próxima fronteira para a IA é a IA Física”. O princípio de grandes modelos é gerar saída, um token por vez, com base em prompts. Se esse contexto se tornar o ambiente do mundo real e o prompt se tornar uma solicitação, o modelo precisa mudar de gerar “tokens de conteúdo” para gerar “tokens de ação”. O que precisamos agora é criar um “modelo de mundo” eficaz em vez de modelos de linguagem baseados em GPT.

Este “modelo de mundo” deve entender a linguagem do mundo, compreender a dinâmica física, como gravidade e atrito, compreender relações geométricas e espaciais, entender a causalidade e reconhecer a permanência física.
Na CES, Jensen Huang anunciou uma plataforma revolucionária de desenvolvimento de modelos fundamentais do mundo chamada Cosmos, com o objetivo de entender o mundo físico. Treinado em um conjunto de dados de 20 milhões de horas, o Cosmos pode pegar texto, imagens e vídeos como entrada e gerar estados e vídeos do mundo virtual. A plataforma inclui vários módulos funcionais, como modelos de difusão, modelos autorregressivos e tokenizadores de vídeo, permitindo que os desenvolvedores escolham com base em necessidades específicas. Notavelmente, Jensen Huang anunciou que o Cosmos, em sua totalidade, incluindo Nano, Super e Ultra, será de código aberto e estará disponível para download.

Além disso, o Cosmos pode ser integrado ao Omniverse para fornecer um multigerador fisicamente realista, o que significa que tudo no mundo da simulação física pode ser gerado de uma só vez pelo Cosmos.

Jensen Huang também mencionou três tipos de computadores: um DGX para treinamento de IA, um AGX para implantação de IA e uma combinação de Omniverse e Cosmos. Ao conectar os dois primeiros, precisamos de um gêmeo digital. Huang acredita que, “No futuro, cada fábrica terá um gêmeo digital, e você pode combinar Omniverse e Cosmos para gerar vários cenários futuros.”





Veículos e robôs autônomos
Criar veículos autônomos, como robôs, requer esses três computadores. A partir de agora, com 100 milhões de carros produzidos anualmente e bilhões de carros no mundo todo, eles gradualmente se tornarão sistemas de direção altamente automatizados e totalmente autônomos. Jensen Huang prevê que esta se tornará a primeira indústria de robôs de um trilhão de dólares. Ele também apresentou o processador automotivo de última geração, Thor, que ostenta um aumento de 20 vezes no desempenho de processamento em comparação com seu antecessor, Orin, e serve como um processador de robô de uso geral.


Então, o que Omniverse e Cosmos podem fazer no contexto da direção autônoma? Eles podem gerar cenários de direção infinitos, acelerando o desenvolvimento da direção autônoma em cenários com caudas curtas e dados não coletáveis.

Após isso, Jensen Huang convocou todos os robôs para o palco e anunciou a chegada do “momento ChatGPT para robôs de uso geral”. Ele declarou: “Atualmente, existem três tipos de robôs: IA inteligente, veículos autônomos e máquinas. Se tivermos a tecnologia para resolver esses três problemas, a era dos robôs estará próxima”. Ao concluir a coletiva de imprensa, Huang resumiu que agora há três novos sistemas Blackwell em produção: o supercomputador Grace Blackwell NVLink72, um modelo fundamental para IA física, e três tipos de robôs desenvolvidos no campo da IA inteligente.

Produtos relacionados:
-
Compatível com NVIDIA MMA4Z00-NS400 400G OSFP SR4 Flat Top PAM4 850nm 30m em OM3/50m em OM4 MTP/MPO-12 Multimode FEC Optical Transceiver Module $650.00
-
Compatível com NVIDIA MMA4Z00-NS-FLT 800Gb/s Porta dupla OSFP 2x400G SR8 PAM4 850nm 100m DOM Módulo transceptor óptico MPO-12 MMF duplo $850.00
-
Compatível com NVIDIA MMA4Z00-NS 800Gb/s Porta dupla OSFP 2x400G SR8 PAM4 850nm 100m DOM Módulo transceptor óptico MPO-12 MMF duplo $750.00
-
Compatível com NVIDIA MMS4X00-NM 800Gb/s Porta dupla OSFP 2x400G PAM4 1310nm 500m DOM Módulo transceptor óptico MTP/MPO-12 SMF duplo $1100.00
-
Compatível com NVIDIA MMS4X00-NM-FLT 800G Twin-port OSFP 2x400G Flat Top PAM4 1310nm 500m DOM Módulo transceptor óptico MTP/MPO-12 SMF duplo $1200.00
-
Compatível com NVIDIA MMS4X00-NS400 400G OSFP DR4 Flat Top PAM4 1310nm MTP/MPO-12 500m SMF FEC Módulo transceptor óptico $800.00
-
Mellanox MMA1T00-HS compatível com 200G Infiniband HDR QSFP56 SR4 850nm 100m MPO-12 APC OM3/OM4 FEC PAM4 Módulo transceptor óptico $200.00
-
NVIDIA MFP7E10-N010 compatível com 10 m (33 pés) 8 fibras baixa perda de inserção fêmea para fêmea MPO cabo tronco polaridade B APC para APC LSZH multimodo OM3 50/125 $47.00
-
Compatível com NVIDIA MCP7Y00-N003-FLT 3m (10 pés) 800G OSFP de porta dupla a 2x400G OSFP plano superior InfiniBand NDR Breakout DAC $275.00
-
NVIDIA MCP7Y70-H002 compatível com 2m (7 pés) 400G Twin-port 2x200G OSFP para 4x100G QSFP56 Passivo Breakout Direct Attach Cabo de cobre $155.00
-
NVIDIA MCA4J80-N003-FTF compatível com 3m (10 pés) 800G de porta dupla 2x400G OSFP a 2x400G OSFP InfiniBand NDR cabo de cobre ativo, parte superior plana em uma extremidade e parte superior com aletas na outra $600.00
-
NVIDIA MCP7Y10-N002 compatível com 2m (7 pés) 800G InfiniBand NDR OSFP de porta dupla para 2x400G QSFP112 Breakout DAC $200.00