CEO da Cerebras diz que projeções foram mal interpretadas após tombo das ações

Balanço da Micron e novo ETF alavancado elevam expectativa de volatilidade no mercado

Zoox, da Amazon, apresenta versão redesenhada de robotáxi e se prepara para expansão nos EUA

Congresso dos EUA analisa projeto de lei que obriga empresas de tecnologia a arcar com custos de energia de data centers de IA

OpenAI lança chip próprio e avança no controle da infraestrutura de I.A.

Tecnologia & Inovação

OpenAI lança três novos modelos de voz que funcionam em tempo real

Publicado 08/05/2026 • 08:48 | Atualizado há 2 meses

KEY POINTS

A OpenAI apresentou três novos modelos de voz que funcionam em tempo real enquanto o usuário fala, com o objetivo de agilizar a realização de tarefas, traduzir conversas e discursos e fornecer transcrições.
Os modelos GPT-Realtime foram projetados para que os desenvolvedores criem novas "aplicações de voz" que ofereçam experiências de áudio em tempo real, em vez de reagir às solicitações dos usuários.
Para a empresa, trata-se de um avanço na interação com agentes, que exige que eles compreendam o contexto da conversa que mantêm com as pessoas a todo momento.

Jonathan Raa/NurPhoto

OpenAI

A OpenAI apresentou três novos modelos de voz que funcionam em tempo real enquanto o usuário fala, com o objetivo de agilizar a realização de tarefas, traduzir conversas e discursos e fornecer transcrições.

Os modelos GPT-Realtime foram projetados para que os desenvolvedores criem novas “aplicações de voz” que ofereçam experiências de áudio em tempo real, em vez de reagir às solicitações dos usuários.

Para a empresa, trata-se de um avanço na interação com agentes, que exige que eles compreendam o contexto da conversa que mantêm com as pessoas a todo momento, para se adaptarem às mudanças que possam surgir. Para isso, ela lançou três novos modelos de voz, pertencentes à família GPT-Realtime, conforme informado em um comunicado.

O GPT-Realtime-2 oferece um raciocínio no nível do GPT-5 para gerenciar solicitações mais complexas (como analisar uma solicitação, acionar ferramentas ou gerenciar correções ou interrupções) enquanto acompanha a conversa natural.

Siga o Times | CNBC no Google e receba as principais notícias do Brasil e do Mundo.

Siga o Times | CNBC

A este modelo junta-se o GPT-Realtime-Translate, de tradução em tempo real, que traduz a fala de mais de 70 idiomas de entrada para 13 idiomas de saída, mantendo o ritmo do usuário. A OpenAI o desenvolveu para “criar experiências de voz multilíngues ao vivo” em atendimento ao cliente, educação, eventos ou mídia, entre outros.

Também o GPT-Realtime-Whisper, um novo sistema de conversão de voz em texto em tempo real com baixa latência, que transcreve a fala enquanto o usuário está falando.

“Os modelos que estamos lançando transformam o áudio em tempo real, passando de um simples sistema de pergunta e resposta para interfaces de voz que realmente podem realizar tarefas: ouvir, raciocinar, traduzir, transcrever e agir à medida que uma conversa se desenvolve”, afirmou a empresa.

📌 ONDE ASSISTIR AO MAIOR CANAL DE NEGÓCIOS DO MUNDO NO BRASIL:

🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais

🔷 TV SINAL ABERTO: parabólicas canal 562

🔷 ONLINE: www.timesbrasil.com.br | YouTube

🔷 FAST Channels: Samsung TV Plus, LG Channels, TCL Channels, Pluto TV, Roku, Soul TV, Zapping | Novos Streamings