Siga o Times Brasil - Licenciado Exclusivo CNBC no
OpenAI diz que novo modelo de IA pode ‘pensar com imagens’, entendendo diagramas e esboços
Publicado 16/04/2025 • 16:00 | Atualizado há 12 meses
Ed Bastian, CEO da Delta, anuncia corte “significativo” na expansão e prevê ganho de US$ 300 milhões com refinaria própria
Ações da Apple desabam após relato de atraso no iPhone dobrável
EUA violaram o acordo de cessar-fogo, diz presidente do parlamento iraniano
Petróleo cai abaixo de US$ 100 após Irã concordar com passagem segura pelo estreito de Ormuz durante cessar-fogo
Ações da ASML caem após proposta dos EUA de restringir exportações atingir um mercado chinês já fragilizado
Publicado 16/04/2025 • 16:00 | Atualizado há 12 meses
KEY POINTS
Sede da OpenAI
Divulgação/OpenAI.
A OpenAI lançou seu mais recente modelo de inteligência artificial, que, segundo a empresa, é capaz de “pensar com imagens”, ou seja, pode entender e analisar esboços e diagramas feitos pelo usuário, mesmo que sejam de baixa qualidade.
O novo modelo principal de raciocínio da OpenAI é chamado de o3, e a empresa lançou simultaneamente um modelo menor chamado o4-mini. O lançamento segue a estreia em setembro do primeiro modelo de raciocínio da OpenAI, o o1, que focava em resolver problemas complexos e deliberar sobre suas respostas em várias etapas.
Com o o3, usuários podem enviar imagens de quadros brancos, esboços e outras imagens para que a IA as analise e discuta. Os modelos também podem girar, dar zoom e usar outras ferramentas de edição de imagem.
Desde a introdução do chatbot viral ChatGPT no final de 2022, a OpenAI tem atualizado rapidamente seus modelos para ir além do texto e incluir imagens, voz e vídeos. A empresa está correndo para se manter à frente na “corrida” da inteligência artificial generativa, onde enfrenta forte concorrência de rivais, como Google, Anthropic e a xAI, de Elon Musk.
“Pela primeira vez, nossos modelos de raciocínio podem usar de forma independente todas as ferramentas do ChatGPT — navegação na web, Python, entendimento de imagens e geração de imagens”, escreveu a OpenAI. “Isso os ajuda a resolver problemas complexos e de múltiplas etapas de maneira mais eficaz e a dar passos reais em direção à atuação independente”.
A empresa, avaliada em US$ 300 bilhões (aproximadamente R$ 1,76 trilhão, na cotação atual) em uma rodada de financiamento no mês passado, disse que o o3 e o o4-mini são seus primeiros modelos de IA que podem “pensar com imagens”. Isso significa que “eles não apenas veem uma imagem, mas podem integrar informações visuais diretamente na cadeia de raciocínio”, segundo a OpenAI.
No mês passado, a OpenAI lançou um recurso de geração de imagens que viralizou online por sua capacidade de produzir imagens de anime no estilo do Studio Ghibli.
A OpenAI disse que seu modelo o3 é especialmente ajustado para matemática, programação, ciência e entendimento de imagens, enquanto o o4-mini opera mais rápido e a um custo menor. Ambos os modelos estão disponíveis a partir desta quarta-feira (16) para os clientes do ChatGPT Plus, Pro e Team.
A comunidade de usuários da OpenAI brinca há muito tempo sobre os nomes estranhos ou confusos de seus modelos de IA. O CEO Sam Altman entrou na brincadeira esta semana, escrevendo em um post na rede social X: “que tal consertarmos o nome dos nossos modelos até este verão e todo mundo ganha mais alguns meses para brincar com a gente (o que merecemos muito) até lá?”.
A empresa também informou que ambos os modelos foram “testados sob o programa de segurança mais rigoroso até hoje” e vinculou ao seu “framework de preparação”, atualizado no início desta semana.
A OpenAI tem sido criticada recentemente por mudanças em suas precauções e processos de segurança. Ela afirmou nesta semana que detém o direito de “mudar seus requisitos de segurança se ‘outro desenvolvedor de IA de fronteira lançar um sistema de alto risco sem salvaguardas comparáveis'”.
Ao mudar suas políticas nesta semana, a OpenAI escreveu que não exigiria mais testes de segurança para certos modelos já ajustados. A empresa também evitou divulgar um “cartão de modelo” — ou um relatório contendo informações sobre testes de segurança realizados antes do lançamento de um modelo — para seu modelo GPT-4.1. Em fevereiro, a OpenAI lançou a ferramenta de agente de IA Deep Research semanas antes de publicar seu cartão de sistema.
A OpenAI não respondeu imediatamente a um pedido de comentário.
📌 ONDE ASSISTIR AO MAIOR CANAL DE NEGÓCIOS DO MUNDO NO BRASIL:
🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais
🔷 TV SINAL ABERTO: parabólicas canal 562
🔷 ONLINE: www.timesbrasil.com.br | YouTube
🔷 FAST Channels: Samsung TV Plus, TCL Channels, Pluto TV, Soul TV, Zapping | Novos Streamings
Este conteúdo foi fornecido pela CNBC Internacional e a responsabilidade exclusiva pela tradução para o português é do Times Brasil.
Mais lidas
1
Imposto de Renda 2026: idosos acima de 70 anos são obrigados a declarar?
2
Tesouro Reserva: 5 pontos para entender o novo título público
3
O que sabemos sobre o Mythos da Anthropic, modelo de IA mais poderoso do mundo que não será lançado por motivos de cibersegurança
4
Com ataques ao Líbano ainda ocorrendo, Irã ameaça romper cessar-fogo e mantém Estreito de Ormuz fechado para petroleiros
5
Brent despenca 16% na manhã do dia após cessar-fogo temporário e abertura em Ormuz