Siga o Times Brasil - Licenciado Exclusivo CNBC no
O que é a “Era da Inferência” que pode redefinir o futuro da IA
Publicado 18/03/2026 • 16:20 | Atualizado há 2 meses
Ações da Cisco disparam 17% após salto em pedidos de IA, apesar de corte de 4 mil empregos
CEO da Allegiant defende modelo de baixo custo após conclusão da compra da Sun Country
Juros dos Treasuries recuam após inflação acima do esperado nos EUA
SoftBank registra ganho de US$ 46 bilhões com aposta bilionária na OpenAI
CEO da Nvidia se junta à viagem de Trump à China após ligação do presidente dos EUA
Publicado 18/03/2026 • 16:20 | Atualizado há 2 meses
KEY POINTS
Foto: Freepik.
Inteligência Artificial (IA)
Na última segunda-feira (16), a NVIDIA anunciou uma série de novos produtos para acompanhar a Era da Inferência. No contexto da inteligência artificial (IA), esse termo diz respeito ao “processo de executar um modelo de IA para realizar uma tarefa específica”, como descreve o d-Matrix.
Durante o evento GTC 2026, a big tech lançou o Nvidia Groq 3 LPX, uma plataforma para comportar 72 servidores de última geração do Vera Rubin – nomenclatura dada em homenagem à astrônoma de mesmo nome. Em geral, a tecnologia se diferencia por:
Mas, o que o novo produto da NVIDIA realmente significa para o mercado?
Leia também: SXSW: tecnologia avança, mas storytelling reforça o que nos faz humanos
Na prática, apesar do termo pouco usual, inferência de IA diz respeito às consultas que os agentes e chat bots fazem quando usuários perguntam em plataformas como ChatGPT, Gemini, Copilot e outros. A título de exemplo, a d-Matrix ilustra que, no cotidiano, a inferência de IA acontece ao:
Entretanto, essa atividade custava caro e consumia muita energia. Segundo a d-Matrix, a inferência de IA é o processo que acontece após o treinamento do modelo e da etapa de refinamento, quando a ferramenta já recebeu os dados e está pronta para uso.
Em casos de tecnologias de IA mais simples, exige-se menos recursos, como uma única placa de vídeo ou placa aceleradora. Na verdade, o que muda é a natureza dos dados – imagens, voz e outros.
Ou seja, modelos de IA generativa exigem maior inferência de dados, podendo chegar até na casa dos trilhões de parâmetros. Sendo assim, seriam necessários mais recursos, o que exigiria mais dinheiro e energia.
No dia a dia, o usuário sente esses obstáculos pelo alto custo de acessar a tecnologia e maior lentidão na geração de respostas. Logo, essas questões eram grandes gargalos na indústria de IA, que ainda trabalha para escalar essas tecnologias.
Agora, a novidade da NVIDIA pode ser a primeira a superar essas barreiras.
Leia também: Ações de empresas de IA da China disparam após Nvidia chamar OpenClaw de “próximo ChatGPT”
O destaque do Nvidia Groq 3 LPX se deve, principalmente, ao novo chip LPU – sigla para Language Processing Unit em inglês, que em português se traduz como ‘unidade de processamento de linguagem’.
Desenvolvido pela startup Groq, o chip atenderá tecnologias baseadas em grandes Modelos de Linguagem (LLMs). Com ele, a inferência de IA será acelerada e gerará tokens mais rápido. A maior velocidade permitirá que as placas de vídeo (GPUs) tenham um desempenho mais leve e rápido – permitindo, inclusive, treinar LLMs com maior eficiência.
Ou seja, otimizou-se a capacidade dos chips. Entretanto, o gargalo será obter a quantidade suficiente de chips para continuar desenvolvendo GPUs desse nível.
Antes deste lançamento, as GPUs da Nvidia não eram consideradas ideais para inferência, justamente devido ao alto consumo de energia e memória insuficiente. No dia a dia, os modelos de LLMs penavam para abrir os conjuntos de dados utilizados para treiná-los.
“Este é o futuro da IA. É para cá que a IA quer ir”, disse Jensen Huang, CEO da NVIDIA. “Ela foi projetada para inferência, para essa carga de trabalho específica. E é essa carga de trabalho que impulsiona as fábricas de IA”, disse o executivo no GTC 2026.
🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais
🔷 TV SINAL ABERTO: parabólicas canal 562
🔷 ONLINE: www.timesbrasil.com.br | YouTube
🔷 FAST Channels: Samsung TV Plus, LG Channels, TCL Channels, Pluto TV, Roku, Soul TV, Zapping | Novos Streamings
Mais lidas
1
BC multa Banco Topázio em R$ 16,2 milhões, veta operações com cripto e põe outras instituições no radar
2
Linha do tempo: como os sócios da Naskar abandonaram a sede e sumiram com o dinheiro de investidores
3
Rombo contábil de R$ 5 bilhões na Aegea afeta Itaúsa e adia planos de IPO
4
Como gigantes do e-commerce pressionaram o Elo7? Entenda o que aconteceu
5
Ex-jogador de vôlei e ex-ESPN está entre sócios da Naskar, fintech que sumiu com quase R$ 1 bilhão de clientes