Siga o Times Brasil - Licenciado Exclusivo CNBC no
O que é a “Era da Inferência” que pode redefinir o futuro da IA
Publicado 18/03/2026 • 16:20 | Atualizado há 2 horas
França está pronta para ajudar os Estados Unidos a garantir a segurança do Estreito de Ormuz
Ações de empresas de IA da China disparam após Nvidia chamar OpenClaw de “próximo ChatGPT”
Morgan Stanley prevê calote de 8% no crédito privado, nível próximo ao pico da Covid
Ex-CEO da Uber rebatiza empresa como Atoms e amplia atuação para mineração e transporte
Apple adquire MotionVFX, empresa de plugins e templates para Final Cut Pro
Publicado 18/03/2026 • 16:20 | Atualizado há 2 horas
KEY POINTS
Foto: Freepik.
O que é a Era da Inferência e por que ela deve dominar futuro da IA?
Na última segunda-feira (16), a NVIDIA anunciou uma série de novos produtos para acompanhar a Era da Inferência. No contexto da inteligência artificial (IA), esse termo diz respeito ao “processo de executar um modelo de IA para realizar uma tarefa específica”, como descreve o d-Matrix.
Durante o evento GTC 2026, a big tech lançou o Nvidia Groq 3 LPX, uma plataforma para comportar 72 servidores de última geração do Vera Rubin – nomenclatura dada em homenagem à astrônoma de mesmo nome. Em geral, a tecnologia se diferencia por:
Mas, o que o novo produto da NVIDIA realmente significa para o mercado?
Leia também: SXSW: tecnologia avança, mas storytelling reforça o que nos faz humanos
Na prática, apesar do termo pouco usual, inferência de IA diz respeito às consultas que os agentes e chat bots fazem quando usuários perguntam em plataformas como ChatGPT, Gemini, Copilot e outros. A título de exemplo, a d-Matrix ilustra que, no cotidiano, a inferência de IA acontece ao:
Entretanto, essa atividade custava caro e consumia muita energia. Segundo a d-Matrix, a inferência de IA é o processo que acontece após o treinamento do modelo e da etapa de refinamento, quando a ferramenta já recebeu os dados e está pronta para uso.
Em casos de tecnologias de IA mais simples, exige-se menos recursos, como uma única placa de vídeo ou placa aceleradora. Na verdade, o que muda é a natureza dos dados – imagens, voz e outros.
Ou seja, modelos de IA generativa exigem maior inferência de dados, podendo chegar até na casa dos trilhões de parâmetros. Sendo assim, seriam necessários mais recursos, o que exigiria mais dinheiro e energia.
No dia a dia, o usuário sente esses obstáculos pelo alto custo de acessar a tecnologia e maior lentidão na geração de respostas. Logo, essas questões eram grandes gargalos na indústria de IA, que ainda trabalha para escalar essas tecnologias.
Agora, a novidade da NVIDIA pode ser a primeira a superar essas barreiras.
Leia também: Ações de empresas de IA da China disparam após Nvidia chamar OpenClaw de “próximo ChatGPT”
O destaque do Nvidia Groq 3 LPX se deve, principalmente, ao novo chip LPU – sigla para Language Processing Unit em inglês, que em português se traduz como ‘unidade de processamento de linguagem’.
Desenvolvido pela startup Groq, o chip atenderá tecnologias baseadas em grandes Modelos de Linguagem (LLMs). Com ele, a inferência de IA será acelerada e gerará tokens mais rápido. A maior velocidade permitirá que as placas de vídeo (GPUs) tenham um desempenho mais leve e rápido – permitindo, inclusive, treinar LLMs com maior eficiência.
Ou seja, otimizou-se a capacidade dos chips. Entretanto, o gargalo será obter a quantidade suficiente de chips para continuar desenvolvendo GPUs desse nível.
Antes deste lançamento, as GPUs da Nvidia não eram consideradas ideais para inferência, justamente devido ao alto consumo de energia e memória insuficiente. No dia a dia, os modelos de LLMs penavam para abrir os conjuntos de dados utilizados para treiná-los.
“Este é o futuro da IA. É para cá que a IA quer ir”, disse Jensen Huang, CEO da NVIDIA. “Ela foi projetada para inferência, para essa carga de trabalho específica. E é essa carga de trabalho que impulsiona as fábricas de IA”, disse o executivo no GTC 2026.
🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais
🔷 TV SINAL ABERTO: parabólicas canal 562
🔷 ONLINE: www.timesbrasil.com.br | YouTube
🔷 FAST Channels: Samsung TV Plus, LG Channels, TCL Channels, Pluto TV, Roku, Soul TV, Zapping | Novos Streamings
Mais lidas
1
‘Empresa que descumprir tabela do frete será proibida de contratar novos fretes’, diz ministro; veja empresas que não cumprem piso mínimo
2
Após anos de atritos, Nubank é aceito na Febraban e passa a integrar núcleo do setor bancário
3
Grupo 3corações compra Yoki e Kitano da General Mills por R$ 800 milhões
4
A geladeira em miniatura é o novo Labubu
5
Cunhada de Hugo Motta fez empréstimo de R$ 22 milhões com Banco Master, diz jornal