Siga o Times Brasil - Licenciado Exclusivo CNBC no
OpenAI diz que novo modelo de IA pode ‘pensar com imagens’, entendendo diagramas e esboços
Publicado 16/04/2025 • 16:00 | Atualizado há 5 meses
EXCLUSIVO CNBC: Tim Cook explica por que a Apple investe bilhões na fábrica de vidro da Corning nos EUA
EXCLUSIVO CNBC: saiba como será o investimento de US$ 600 bilhões que a Apple vai fazer nos EUA para evitar tarifaço
Passagens aéreas: a dica número 1 para levantar voo sem derrubar seu orçamento
O tiro que saiu pela culatra: café, banana e até brinquedos ficam mais caros nos EUA por causa do tarifaço
China desafia montadoras europeias em seu próprio território; Brasil tenta equilibrar proteção e investimento
Publicado 16/04/2025 • 16:00 | Atualizado há 5 meses
KEY POINTS
Sede da OpenAI
Divulgação/OpenAI.
A OpenAI lançou seu mais recente modelo de inteligência artificial, que, segundo a empresa, é capaz de “pensar com imagens”, ou seja, pode entender e analisar esboços e diagramas feitos pelo usuário, mesmo que sejam de baixa qualidade.
O novo modelo principal de raciocínio da OpenAI é chamado de o3, e a empresa lançou simultaneamente um modelo menor chamado o4-mini. O lançamento segue a estreia em setembro do primeiro modelo de raciocínio da OpenAI, o o1, que focava em resolver problemas complexos e deliberar sobre suas respostas em várias etapas.
Com o o3, usuários podem enviar imagens de quadros brancos, esboços e outras imagens para que a IA as analise e discuta. Os modelos também podem girar, dar zoom e usar outras ferramentas de edição de imagem.
Desde a introdução do chatbot viral ChatGPT no final de 2022, a OpenAI tem atualizado rapidamente seus modelos para ir além do texto e incluir imagens, voz e vídeos. A empresa está correndo para se manter à frente na “corrida” da inteligência artificial generativa, onde enfrenta forte concorrência de rivais, como Google, Anthropic e a xAI, de Elon Musk.
“Pela primeira vez, nossos modelos de raciocínio podem usar de forma independente todas as ferramentas do ChatGPT — navegação na web, Python, entendimento de imagens e geração de imagens”, escreveu a OpenAI. “Isso os ajuda a resolver problemas complexos e de múltiplas etapas de maneira mais eficaz e a dar passos reais em direção à atuação independente”.
A empresa, avaliada em US$ 300 bilhões (aproximadamente R$ 1,76 trilhão, na cotação atual) em uma rodada de financiamento no mês passado, disse que o o3 e o o4-mini são seus primeiros modelos de IA que podem “pensar com imagens”. Isso significa que “eles não apenas veem uma imagem, mas podem integrar informações visuais diretamente na cadeia de raciocínio”, segundo a OpenAI.
No mês passado, a OpenAI lançou um recurso de geração de imagens que viralizou online por sua capacidade de produzir imagens de anime no estilo do Studio Ghibli.
A OpenAI disse que seu modelo o3 é especialmente ajustado para matemática, programação, ciência e entendimento de imagens, enquanto o o4-mini opera mais rápido e a um custo menor. Ambos os modelos estão disponíveis a partir desta quarta-feira (16) para os clientes do ChatGPT Plus, Pro e Team.
A comunidade de usuários da OpenAI brinca há muito tempo sobre os nomes estranhos ou confusos de seus modelos de IA. O CEO Sam Altman entrou na brincadeira esta semana, escrevendo em um post na rede social X: “que tal consertarmos o nome dos nossos modelos até este verão e todo mundo ganha mais alguns meses para brincar com a gente (o que merecemos muito) até lá?”.
A empresa também informou que ambos os modelos foram “testados sob o programa de segurança mais rigoroso até hoje” e vinculou ao seu “framework de preparação”, atualizado no início desta semana.
A OpenAI tem sido criticada recentemente por mudanças em suas precauções e processos de segurança. Ela afirmou nesta semana que detém o direito de “mudar seus requisitos de segurança se ‘outro desenvolvedor de IA de fronteira lançar um sistema de alto risco sem salvaguardas comparáveis'”.
Ao mudar suas políticas nesta semana, a OpenAI escreveu que não exigiria mais testes de segurança para certos modelos já ajustados. A empresa também evitou divulgar um “cartão de modelo” — ou um relatório contendo informações sobre testes de segurança realizados antes do lançamento de um modelo — para seu modelo GPT-4.1. Em fevereiro, a OpenAI lançou a ferramenta de agente de IA Deep Research semanas antes de publicar seu cartão de sistema.
A OpenAI não respondeu imediatamente a um pedido de comentário.
📌 ONDE ASSISTIR AO MAIOR CANAL DE NEGÓCIOS DO MUNDO NO BRASIL:
🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais
🔷 TV SINAL ABERTO: parabólicas canal 562
🔷 ONLINE: www.timesbrasil.com.br | YouTube
🔷 FAST Channels: Samsung TV Plus, TCL Channels, Pluto TV, Soul TV, Zapping | Novos Streamings
Este conteúdo foi fornecido pela CNBC Internacional e a responsabilidade exclusiva pela tradução para o português é do Times Brasil.
Mais lidas
Vale demite vice-presidente de RH após polêmica sobre diversidade
Banco do Brasil coloca 142 imóveis em leilão neste mês
Mansão, Ferrari e aeronaves: alvo da PF, advogado Nelson Wilians ostenta nas redes sociais
PF prende oito suspeitos por furto de R$ 1,22 milhões no sistema Pix
Análise: Embraer pode abrir mais um flanco de disputa entre Brasil e EUA