OpenAI diz que novo modelo de IA pode ‘pensar com imagens’, entendendo diagramas e esboços
Publicado 16/04/2025 • 16:00 | Atualizado há 2 dias
Leia a carta do CEO da Hertz aos funcionários sobre a participação ‘significativa’ de Bill Ackman na locadora de veículos pós-falência
Fusão entre Capital One e Discover é aprovada pelo Fed em transação de mais de US$ 35 bi
Pré-venda do Nintendo Switch 2 nos EUA começa em 24 de abril após atraso causado por tarifas
Onde o ‘Made in China 2025’ falhou
Não há problema em usar IA no seu currículo, diz recrutador que já contratou centenas de pessoas: ‘Ninguém vai perceber’
Publicado 16/04/2025 • 16:00 | Atualizado há 2 dias
KEY POINTS
OpenAI está acelerando o desenvolvimento de IA generativa
Divulgação/OpenAI.
A OpenAI lançou seu mais recente modelo de inteligência artificial, que, segundo a empresa, é capaz de “pensar com imagens”, ou seja, pode entender e analisar esboços e diagramas feitos pelo usuário, mesmo que sejam de baixa qualidade.
O novo modelo principal de raciocínio da OpenAI é chamado de o3, e a empresa lançou simultaneamente um modelo menor chamado o4-mini. O lançamento segue a estreia em setembro do primeiro modelo de raciocínio da OpenAI, o o1, que focava em resolver problemas complexos e deliberar sobre suas respostas em várias etapas.
Com o o3, usuários podem enviar imagens de quadros brancos, esboços e outras imagens para que a IA as analise e discuta. Os modelos também podem girar, dar zoom e usar outras ferramentas de edição de imagem.
Desde a introdução do chatbot viral ChatGPT no final de 2022, a OpenAI tem atualizado rapidamente seus modelos para ir além do texto e incluir imagens, voz e vídeos. A empresa está correndo para se manter à frente na “corrida” da inteligência artificial generativa, onde enfrenta forte concorrência de rivais, como Google, Anthropic e a xAI, de Elon Musk.
“Pela primeira vez, nossos modelos de raciocínio podem usar de forma independente todas as ferramentas do ChatGPT — navegação na web, Python, entendimento de imagens e geração de imagens”, escreveu a OpenAI. “Isso os ajuda a resolver problemas complexos e de múltiplas etapas de maneira mais eficaz e a dar passos reais em direção à atuação independente”.
A empresa, avaliada em US$ 300 bilhões (aproximadamente R$ 1,76 trilhão, na cotação atual) em uma rodada de financiamento no mês passado, disse que o o3 e o o4-mini são seus primeiros modelos de IA que podem “pensar com imagens”. Isso significa que “eles não apenas veem uma imagem, mas podem integrar informações visuais diretamente na cadeia de raciocínio”, segundo a OpenAI.
No mês passado, a OpenAI lançou um recurso de geração de imagens que viralizou online por sua capacidade de produzir imagens de anime no estilo do Studio Ghibli.
A OpenAI disse que seu modelo o3 é especialmente ajustado para matemática, programação, ciência e entendimento de imagens, enquanto o o4-mini opera mais rápido e a um custo menor. Ambos os modelos estão disponíveis a partir desta quarta-feira (16) para os clientes do ChatGPT Plus, Pro e Team.
A comunidade de usuários da OpenAI brinca há muito tempo sobre os nomes estranhos ou confusos de seus modelos de IA. O CEO Sam Altman entrou na brincadeira esta semana, escrevendo em um post na rede social X: “que tal consertarmos o nome dos nossos modelos até este verão e todo mundo ganha mais alguns meses para brincar com a gente (o que merecemos muito) até lá?”.
A empresa também informou que ambos os modelos foram “testados sob o programa de segurança mais rigoroso até hoje” e vinculou ao seu “framework de preparação”, atualizado no início desta semana.
A OpenAI tem sido criticada recentemente por mudanças em suas precauções e processos de segurança. Ela afirmou nesta semana que detém o direito de “mudar seus requisitos de segurança se ‘outro desenvolvedor de IA de fronteira lançar um sistema de alto risco sem salvaguardas comparáveis'”.
Ao mudar suas políticas nesta semana, a OpenAI escreveu que não exigiria mais testes de segurança para certos modelos já ajustados. A empresa também evitou divulgar um “cartão de modelo” — ou um relatório contendo informações sobre testes de segurança realizados antes do lançamento de um modelo — para seu modelo GPT-4.1. Em fevereiro, a OpenAI lançou a ferramenta de agente de IA Deep Research semanas antes de publicar seu cartão de sistema.
A OpenAI não respondeu imediatamente a um pedido de comentário.
📌 ONDE ASSISTIR AO MAIOR CANAL DE NEGÓCIOS DO MUNDO NO BRASIL:
🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais
🔷 TV SINAL ABERTO: parabólicas canal 562
🔷 ONLINE: www.timesbrasil.com.br | YouTube
🔷 FAST Channels: Samsung TV Plus, TCL Channels, Pluto TV, Soul TV, Zapping | Novos Streamings
Este conteúdo foi fornecido pela CNBC Internacional e a responsabilidade exclusiva pela tradução para o português é do Times Brasil.
Mais lidas
EUA e Itália concordam em não discriminar ou taxar serviços digitais e empresas de tecnologia
Volkswagen considera fabricar Audis nos EUA para evitar tarifas de Trump
Onde o 'Made in China 2025' falhou
Trump amplia o cerco contra Harvard com devassa fiscal e investigação sobre doadores
Pré-venda do Nintendo Switch 2 nos EUA começa em 24 de abril após atraso causado por tarifas