O CEO da NVIDIA, Jensen Huang, revelou o menor supercomputador de IA do mundo

Na recente conferência CES, Jensen Huang, vestindo uma nova jaqueta, anunciou o lançamento oficial da RTX 5090.

o lançamento oficial da RTX 5090

Aqui estão os preços das GPUs da série 50.

RTX 5090: US$ 1999 / RTX 5090 D: 16,499 RMB

RTX 5080: US$ 999 / 8,299 RMB

RTX 5070 Ti: US$ 749

RTX 5070: US$ 549

Aqui estão os preços das GPUs da série 50.

A RTX 5090 e a RTX 5080 estarão disponíveis a partir de 30 de janeiro, enquanto a RTX 5070 Ti e a RTX 5070 serão lançadas em fevereiro. Os laptops da série RTX 50 serão lançados em março.

Huang também apresentou o novo superchip para data center, Grace Blackwell NVLink72, que conta com 72 GPUs Blackwell, 1.4 exaFLOPS de poder de computação e 1.3 trilhão de transistores, com o objetivo de superar os supercomputadores mais rápidos do mundo.

Huang também apresentou o novo superchip do data center
Graça Blackwell NVLink72

Além disso, o primeiro supercomputador de mesa verdadeiro do mundo, o Project Digits, foi revelado, custando apenas US$ 3000. Com ele, você pode executar modelos grandes de 200 bilhões de parâmetros diretamente na sua mesa, ocupando apenas o espaço de uma caneca de café, mas fornecendo poder de computação de nível de data center.

projeto-dígitos

Equipado com o novo super chip GB10 Grace Blackwell, o Project Digits pode oferecer desempenho de até 1 PFLOPS com precisão FP4.

Huang prevê que, no futuro, todo cientista de dados, pesquisador e aluno terá um supercomputador pessoal de IA do Project Digits em sua mesa. A era da IA ​​pertencerá a todos.

Equipado com o novo super chip GB10 Grace Blackwell,

Durante a estreia da RTX 5090, o DLSS 4 também foi introduzido. Após meses de vazamentos e rumores, a nova geração de GPUs RTX Blackwell foi oficialmente revelada com os seguintes parâmetros de desempenho:

  • 92 bilhões de transistores
  • 4000 TOPS de poder de computação de IA
  • 380 TFLOPS de desempenho de traçado de raios
  • 125 TFLOPS de desempenho de shader
  • 32 GB de memória GDDR7
  • Largura de banda de memória de 1792 GB/s
  • Até 21,760 núcleos CUDA

Vale ressaltar que o poder de computação de IA da RTX 5090 D é de apenas 2375 TOPS, mas ainda é o dobro do da 4090 D.

Vale a pena notar que o poder de computação de IA da RTX 5090 D é de apenas 2375 TOPS, mas ainda é o dobro do 4090 D

Com configurações tão luxuosas e o suporte de DLSS 4 e arquitetura Blackwell, o desempenho da RTX 5090 é diretamente o dobro do da RTX 4090. No entanto, isso também significa que ela tem alto consumo de energia, com uma potência total da placa de vídeo de 575 watts e uma fonte de alimentação recomendada de 1000 watts.

Uma demonstração mostrou que rodar “Cyberpunk 2077” na RTX 5090 com DLSS 4 habilitado atingiu 238 quadros por segundo, em comparação com apenas 106 quadros por segundo na RTX 4090 com DLSS 3.5 habilitado.

Cyberpunk 2077 na RTX 5090

A RTX 5080 é duas vezes mais rápida que a RTX 4080, equipada com 16 GB de memória GDDR7, uma largura de banda de memória de 960 GB/s e 10,752 núcleos CUDA. A RTX 5070 Ti vem com 16 GB de memória GDDR7, largura de banda de 896 GB/s e 8,960 núcleos CUDA. A RTX 5070 tem 12 GB de memória GDDR7, capacidade de 672 GB/s e 6,144 núcleos CUDA. Jensen Huang até afirmou que a RTX 5070, com preço de US$ 549, fornecerá desempenho de nível RTX 4090, graças ao DLSS 4.

RTX 5090
RTX 5080
RTX 5070 Ti
RTX 5070

Além disso, Huang apresentou a GPU RTX Blackwell com uma demonstração de renderização em tempo real. Ele afirmou: "A nova geração de DLSS não apenas gera quadros, mas também prevê o futuro. Nós impulsionamos a IA com a GeForce, e agora a IA está revolucionando a GeForce." Os novos shaders neurais RTX da NVIDIA podem ser usados ​​para compactar texturas de jogos, e as faces neurais RTX aproveitam a IA generativa para aprimorar a qualidade facial. O DLSS de última geração inclui tecnologia de geração de vários quadros, produzindo até três quadros adicionais por quadro tradicional, aumentando as taxas de quadros em até 8 vezes. O DLSS 4 também emprega Transformers em aplicativos em tempo real para aprimorar a qualidade da imagem, reduzir fantasmas e adicionar mais detalhes a cenas dinâmicas.

Huang apresentou a GPU RTX Blackwell com uma demonstração de renderização em tempo real

Vale ressaltar que a NVIDIA introduziu um novo design para a série RTX 50 Founders Edition, com ventiladores de fluxo axial duplo, uma câmara de vapor 3D e memória GDDR7. Todas as GPUs da série RTX 50 suportam PCIe Gen 5 e são equipadas com interfaces DisplayPort 2.1b, capazes de conduzir resolução de 8K a 165 Hz. Surpreendentemente, a RTX 5090 Founders Edition é uma placa de vídeo de dois slots, tornando-a adequada para gabinetes de fator de forma pequeno — uma mudança significativa em comparação com a RTX 4090.

A NVIDIA apresentou um novo design para a série RTX 50

Jim Fan, cientista sênior da NVIDIA, destacou a “essência” da apresentação de Jensen Huang sobre tecnologia gráfica. Huang explicou que as novas GPUs usam redes neurais para gerar mais de 90% dos pixels em jogos. Algoritmos tradicionais de ray tracing renderizam apenas cerca de 10% do conteúdo, semelhante a um “rascunho”, com modelos generativos preenchendo os detalhes restantes em tempo real. Senhoras e senhores, a IA é a nova geração de tecnologia gráfica.

Jim Fan, cientista sênior da NVIDIA

Após a estreia das GPUs da série 50, Huang mencionou que a “lei de escala continua”:

  • A primeira lei de escala é o pré-treinamento.
  • A segunda lei de escala é pós-treinamento.
  • A terceira lei de escala é a computação em tempo de inferência.
Após a estreia das GPUs da série 50

Essas leis de escala em evolução impulsionam a imensa demanda computacional por IA. Espantosamente, aproximadamente 15 centros de supercomputação, incluindo os da Microsoft, Meta e xAI, já estão equipados com GPUs Blackwell.

Blackwell Em plena produção

Em seguida, ele mencionou agentes de IA como um exemplo perfeito de escala durante os testes. Além disso, ele anunciou o lançamento de uma série de modelos fundamentais de licença aberta chamados Llama Nemotron, que fornecem alta precisão para várias tarefas de agentes de IA. Jensen Huang declarou: “Agentes de IA podem ser a próxima indústria de robótica, potencialmente representando uma oportunidade multitrilionária.”

Agentes de IA podem ser a próxima indústria de robótica
escala de tempo de teste de IA de agente
nvidia liama

Além disso, o NIM Blueprint da NVIDIA estará disponível em breve para PC. Com esses blueprints, os desenvolvedores podem criar podcasts com base em documentos PDF e gerar imagens impressionantes guiadas por cenas 3D.

Projeto NIM da NVIDIA

Supercomputador de IA de nível desktop capaz de executar 4.05 trilhões de parâmetros LLM

Antes de concluir a conferência CES, Jensen Huang revelou um produto revolucionário — o Projeto Digits — um verdadeiro “supercomputador de mesa!” Ele foi projetado para desenvolvedores de IA, cientistas de dados, estudantes e outros profissionais envolvidos em trabalhos de IA.

Supercomputador de IA de nível desktop capaz de executar 4.05 trilhões de parâmetros LLM

Este computador compacto é o menor supercomputador de IA do mundo capaz de executar um modelo de 200 bilhões de parâmetros, com preço de US$ 3,000 (aproximadamente ¥ 21,986). Conforme demonstrado por Huang, este sistema de desktop compacto fornece imenso poder de computação enquanto ocupa um espaço mínimo na mesa — aproximadamente a largura de uma xícara de café média e aproximadamente metade de sua altura. Imagine ter um dispositivo em miniatura em sua mesa que oferece poder de computação de nível de data center. Este é o avanço revolucionário trazido pelo Projeto Digits!

O Project Digits apresenta o novo superchip GB10 Grace Blackwell, capaz de fornecer até 1 PFLOPS (petaflops) de desempenho de IA com precisão de FP4.

O Projeto Digits apresenta o novo superchip GB10 Grace Blackwell

Este poderoso chip também inclui uma CPU Grace de 20 núcleos baseada em ARM. A CPU e a GPU são interconectadas usando a tecnologia NVIDIA NVLink C2C para comunicação de alta velocidade. Cada Project Digits é equipado com 128 GB de memória unificada de baixo consumo e altamente consistente, e até 4 TB de armazenamento NVME. Com esta configuração, os desenvolvedores podem executar modelos de até 200 bilhões de parâmetros diretamente em seus desktops. Além disso, com o chip de rede ConnectX, dois supercomputadores Project Digits podem ser interconectados para executar modelos com até 4.05 trilhões de parâmetros.

CPU Grace de 20 núcleos baseada em ARM

Além disso, o Project Digits vem pré-instalado com o sistema operacional básico NVIDIA DGX (baseado no Ubuntu Linux) e a pilha de software NVIDIA AI, fornecendo aos desenvolvedores um ambiente de desenvolvimento de IA plug-and-play. Os desenvolvedores podem começar rapidamente com seus projetos de IA imediatamente. Para milhões de desenvolvedores, será um produto inovador que mudará o jogo, especialmente para aqueles que precisam de recursos de computação em nuvem/data center para executar grandes modelos de IA. Este supercomputador de IA de desktop tem uma ampla gama de aplicações, incluindo experimentação e prototipagem de modelos de IA, ajuste fino e inferência de modelos (para teste ou avaliação de modelos) e serviços de inferência de IA local (como chatbots ou assistentes de inteligência de código). Além disso, os cientistas de dados podem utilizar o sistema para executar o NVIDIA RAPIDS, lidando com eficiência com fluxos de trabalho de ciência de dados em larga escala diretamente em seus desktops.

O Project Digits vem pré-instalado com o sistema operacional básico NVIDIA DGX

Com o suporte abrangente da pilha de tecnologia de IA da NVIDIA (frameworks, ferramentas, APIs), o Project Digits se torna uma plataforma de desenvolvimento ideal para aplicativos de computação de ponta, particularmente em campos de robótica e VLM (modelos de visão-linguagem). O advento do Project Digits marca uma nova era na computação de IA pessoal. Ele permite que desenvolvedores em todo o mundo executem modelos de IA em larga escala em seus desktops, complementando os recursos de computação em nuvem existentes e aprimorando significativamente a eficiência do desenvolvimento de IA.

A Nova Era da IA ​​Física: Modelo de Mundo de Código Aberto

Após a introdução da IA ​​inteligente, Jensen Huang agora direcionou a conversa para a “IA Física”. Em sua visão, “a próxima fronteira para a IA é a IA Física”. O princípio de grandes modelos é gerar saída, um token por vez, com base em prompts. Se esse contexto se tornar o ambiente do mundo real e o prompt se tornar uma solicitação, o modelo precisa mudar de gerar “tokens de conteúdo” para gerar “tokens de ação”. O que precisamos agora é criar um “modelo de mundo” eficaz em vez de modelos de linguagem baseados em GPT.

Modelo de mundo de código aberto

Este “modelo de mundo” deve entender a linguagem do mundo, compreender a dinâmica física, como gravidade e atrito, compreender relações geométricas e espaciais, entender a causalidade e reconhecer a permanência física.

Na CES, Jensen Huang anunciou uma plataforma revolucionária de desenvolvimento de modelos fundamentais do mundo chamada Cosmos, com o objetivo de entender o mundo físico. Treinado em um conjunto de dados de 20 milhões de horas, o Cosmos pode pegar texto, imagens e vídeos como entrada e gerar estados e vídeos do mundo virtual. A plataforma inclui vários módulos funcionais, como modelos de difusão, modelos autorregressivos e tokenizadores de vídeo, permitindo que os desenvolvedores escolham com base em necessidades específicas. Notavelmente, Jensen Huang anunciou que o Cosmos, em sua totalidade, incluindo Nano, Super e Ultra, será de código aberto e estará disponível para download.

uma plataforma revolucionária de desenvolvimento de modelos fundamentais do mundo

Além disso, o Cosmos pode ser integrado ao Omniverse para fornecer um multigerador fisicamente realista, o que significa que tudo no mundo da simulação física pode ser gerado de uma só vez pelo Cosmos.

O Cosmos pode ser integrado ao Omniverse para fornecer um multigerador fisicamente realista

Jensen Huang também mencionou três tipos de computadores: um DGX para treinamento de IA, um AGX para implantação de IA e uma combinação de Omniverse e Cosmos. Ao conectar os dois primeiros, precisamos de um gêmeo digital. Huang acredita que, “No futuro, cada fábrica terá um gêmeo digital, e você pode combinar Omniverse e Cosmos para gerar vários cenários futuros.”

Omniverso e Cosmos
simulador mundial
mega planta de instalação robótica digital twin
omniverso
armazém de próxima geração

Veículos e robôs autônomos

Criar veículos autônomos, como robôs, requer esses três computadores. A partir de agora, com 100 milhões de carros produzidos anualmente e bilhões de carros no mundo todo, eles gradualmente se tornarão sistemas de direção altamente automatizados e totalmente autônomos. Jensen Huang prevê que esta se tornará a primeira indústria de robôs de um trilhão de dólares. Ele também apresentou o processador automotivo de última geração, Thor, que ostenta um aumento de 20 vezes no desempenho de processamento em comparação com seu antecessor, Orin, e serve como um processador de robô de uso geral.

Veículos e robôs autônomos
Thor

Então, o que Omniverse e Cosmos podem fazer no contexto da direção autônoma? Eles podem gerar cenários de direção infinitos, acelerando o desenvolvimento da direção autônoma em cenários com caudas curtas e dados não coletáveis.

gerar cenários de condução infinitos

Após isso, Jensen Huang convocou todos os robôs para o palco e anunciou a chegada do “momento ChatGPT para robôs de uso geral”. Ele declarou: “Atualmente, existem três tipos de robôs: IA inteligente, veículos autônomos e máquinas. Se tivermos a tecnologia para resolver esses três problemas, a era dos robôs estará próxima”. Ao concluir a coletiva de imprensa, Huang resumiu que agora há três novos sistemas Blackwell em produção: o supercomputador Grace Blackwell NVLink72, um modelo fundamental para IA física, e três tipos de robôs desenvolvidos no campo da IA ​​inteligente.

Jensen Huang convocou todos os robôs para o palco

Deixe um comentário

Voltar ao Topo