Siga o Times Brasil - Licenciado Exclusivo CNBC no
OpenAI lança três novos modelos de voz que funcionam em tempo real
Publicado 08/05/2026 • 08:48 | Atualizado há 1 mês
GM mira em nova química de baterias para impulsionar seus negócios de data centers com IA e armazenamento de energia
IPO da SpaceX: preço está definido, mas distribuição das ações para investidores de varejo ainda é incerta
CEO da Vinted vê mudança “fundamental” em consumo; empresa de produtos usados alcança US$ 9 bilhões
Ações asiáticas ligadas a semicondutores sobem após recuperação de concorrentes nos EUA
OpenAI protocola confidencialmente seu pedido de IPO, preparando Wall Street para uma estreia estrondosa na área de IA
Publicado 08/05/2026 • 08:48 | Atualizado há 1 mês
KEY POINTS
Jonathan Raa/NurPhoto
OpenAI
A OpenAI apresentou três novos modelos de voz que funcionam em tempo real enquanto o usuário fala, com o objetivo de agilizar a realização de tarefas, traduzir conversas e discursos e fornecer transcrições.
Os modelos GPT-Realtime foram projetados para que os desenvolvedores criem novas “aplicações de voz” que ofereçam experiências de áudio em tempo real, em vez de reagir às solicitações dos usuários.
Para a empresa, trata-se de um avanço na interação com agentes, que exige que eles compreendam o contexto da conversa que mantêm com as pessoas a todo momento, para se adaptarem às mudanças que possam surgir. Para isso, ela lançou três novos modelos de voz, pertencentes à família GPT-Realtime, conforme informado em um comunicado.
Leia também: EXCLUSIVO CNBC: Agentes de IA vão mudar modelo de cobrança do software, diz chairman da OpenAI
O GPT-Realtime-2 oferece um raciocínio no nível do GPT-5 para gerenciar solicitações mais complexas (como analisar uma solicitação, acionar ferramentas ou gerenciar correções ou interrupções) enquanto acompanha a conversa natural.
A este modelo junta-se o GPT-Realtime-Translate, de tradução em tempo real, que traduz a fala de mais de 70 idiomas de entrada para 13 idiomas de saída, mantendo o ritmo do usuário. A OpenAI o desenvolveu para “criar experiências de voz multilíngues ao vivo” em atendimento ao cliente, educação, eventos ou mídia, entre outros.
Também o GPT-Realtime-Whisper, um novo sistema de conversão de voz em texto em tempo real com baixa latência, que transcreve a fala enquanto o usuário está falando.
“Os modelos que estamos lançando transformam o áudio em tempo real, passando de um simples sistema de pergunta e resposta para interfaces de voz que realmente podem realizar tarefas: ouvir, raciocinar, traduzir, transcrever e agir à medida que uma conversa se desenvolve”, afirmou a empresa.
Leia mais: Análise: Disputa entre Musk e OpenAI é guerra por mercado e poder na IA
Siga o Times Brasil no Google e receba as principais notícias do Brasil e do Mundo.
Seguir no Google🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais
🔷 TV SINAL ABERTO: parabólicas canal 562
🔷 ONLINE: www.timesbrasil.com.br | YouTube
🔷 FAST Channels: Samsung TV Plus, LG Channels, TCL Channels, Pluto TV, Roku, Soul TV, Zapping | Novos Streamings
Mais lidas
1
Anthropic lança o Claude Fable 5, sua inteligência artificial mais poderosa
2
Sem ganhador, Mega-Sena acumula e próximo sorteio pagará R$ 8 milhões
3
iFood expõe milhões de brasileiros a golpistas e omite fato das autoridades de proteção de dados
4
Naskar troca de dono pela segunda vez, app segue fora do ar e investidores sem o dinheiro
5
99 inicia fase de testes de seu serviço de compras na Grande SP, sem data para estreia completa