CNBC
JPMorgan.

CNBCJamie Dimon alerta que JP Morgan pode repensar nova sede em Londres caso Starmer deixe cargo de premiê do Reino Unido

Tecnologia & Inovação

OpenAI lança três novos modelos de voz que funcionam em tempo real

Publicado 08/05/2026 • 08:48 | Atualizado há 5 dias

KEY POINTS

  • A OpenAI apresentou três novos modelos de voz que funcionam em tempo real enquanto o usuário fala, com o objetivo de agilizar a realização de tarefas, traduzir conversas e discursos e fornecer transcrições.
  • Os modelos GPT-Realtime foram projetados para que os desenvolvedores criem novas "aplicações de voz" que ofereçam experiências de áudio em tempo real, em vez de reagir às solicitações dos usuários.
  • Para a empresa, trata-se de um avanço na interação com agentes, que exige que eles compreendam o contexto da conversa que mantêm com as pessoas a todo momento.

Jonathan Raa/NurPhoto

OpenAI

A OpenAI apresentou três novos modelos de voz que funcionam em tempo real enquanto o usuário fala, com o objetivo de agilizar a realização de tarefas, traduzir conversas e discursos e fornecer transcrições.

Os modelos GPT-Realtime foram projetados para que os desenvolvedores criem novas “aplicações de voz” que ofereçam experiências de áudio em tempo real, em vez de reagir às solicitações dos usuários.

Para a empresa, trata-se de um avanço na interação com agentes, que exige que eles compreendam o contexto da conversa que mantêm com as pessoas a todo momento, para se adaptarem às mudanças que possam surgir. Para isso, ela lançou três novos modelos de voz, pertencentes à família GPT-Realtime, conforme informado em um comunicado.

Leia também: EXCLUSIVO CNBC: Agentes de IA vão mudar modelo de cobrança do software, diz chairman da OpenAI

O GPT-Realtime-2 oferece um raciocínio no nível do GPT-5 para gerenciar solicitações mais complexas (como analisar uma solicitação, acionar ferramentas ou gerenciar correções ou interrupções) enquanto acompanha a conversa natural.

A este modelo junta-se o GPT-Realtime-Translate, de tradução em tempo real, que traduz a fala de mais de 70 idiomas de entrada para 13 idiomas de saída, mantendo o ritmo do usuário. A OpenAI o desenvolveu para “criar experiências de voz multilíngues ao vivo” em atendimento ao cliente, educação, eventos ou mídia, entre outros.

Também o GPT-Realtime-Whisper, um novo sistema de conversão de voz em texto em tempo real com baixa latência, que transcreve a fala enquanto o usuário está falando.

“Os modelos que estamos lançando transformam o áudio em tempo real, passando de um simples sistema de pergunta e resposta para interfaces de voz que realmente podem realizar tarefas: ouvir, raciocinar, traduzir, transcrever e agir à medida que uma conversa se desenvolve”, afirmou a empresa.

Leia mais: Análise: Disputa entre Musk e OpenAI é guerra por mercado e poder na IA

📌 ONDE ASSISTIR AO MAIOR CANAL DE NEGÓCIOS DO MUNDO NO BRASIL:


🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais

🔷 TV SINAL ABERTO: parabólicas canal 562

🔷 ONLINE: www.timesbrasil.com.br | YouTube

🔷 FAST Channels: Samsung TV Plus, LG Channels, TCL Channels, Pluto TV, Roku, Soul TV, Zapping | Novos Streamings

Siga o Times Brasil - Licenciado Exclusivo CNBC no

MAIS EM Tecnologia & Inovação