Siga o Times Brasil - Licenciado Exclusivo CNBC no
OpenAI diz que novo modelo de IA pode ‘pensar com imagens’, entendendo diagramas e esboços
Publicado 16/04/2025 • 16:00 | Atualizado há 3 meses
ALERTA DE MERCADO
Fed dividido mantém taxa básica de juros, contrariando pressão de Trump por cortes agressivos
Wall Street vê recuperação da Starbucks ganhando força, mesmo após mais um trimestre fraco
Fabricantes de carros de luxo sinalizam custos combinados de US$ 889 milhões com tarifas dos EUA
Adidas despenca 7% após gigante do esporte alertar que tarifas vão encarecer preços nos EUA
Divisão das Big Techs? Google vai assinar as diretrizes de IA da UE; Meta rejeita as regras
Publicado 16/04/2025 • 16:00 | Atualizado há 3 meses
KEY POINTS
Sede da OpenAI
Divulgação/OpenAI.
A OpenAI lançou seu mais recente modelo de inteligência artificial, que, segundo a empresa, é capaz de “pensar com imagens”, ou seja, pode entender e analisar esboços e diagramas feitos pelo usuário, mesmo que sejam de baixa qualidade.
O novo modelo principal de raciocínio da OpenAI é chamado de o3, e a empresa lançou simultaneamente um modelo menor chamado o4-mini. O lançamento segue a estreia em setembro do primeiro modelo de raciocínio da OpenAI, o o1, que focava em resolver problemas complexos e deliberar sobre suas respostas em várias etapas.
Com o o3, usuários podem enviar imagens de quadros brancos, esboços e outras imagens para que a IA as analise e discuta. Os modelos também podem girar, dar zoom e usar outras ferramentas de edição de imagem.
Desde a introdução do chatbot viral ChatGPT no final de 2022, a OpenAI tem atualizado rapidamente seus modelos para ir além do texto e incluir imagens, voz e vídeos. A empresa está correndo para se manter à frente na “corrida” da inteligência artificial generativa, onde enfrenta forte concorrência de rivais, como Google, Anthropic e a xAI, de Elon Musk.
“Pela primeira vez, nossos modelos de raciocínio podem usar de forma independente todas as ferramentas do ChatGPT — navegação na web, Python, entendimento de imagens e geração de imagens”, escreveu a OpenAI. “Isso os ajuda a resolver problemas complexos e de múltiplas etapas de maneira mais eficaz e a dar passos reais em direção à atuação independente”.
A empresa, avaliada em US$ 300 bilhões (aproximadamente R$ 1,76 trilhão, na cotação atual) em uma rodada de financiamento no mês passado, disse que o o3 e o o4-mini são seus primeiros modelos de IA que podem “pensar com imagens”. Isso significa que “eles não apenas veem uma imagem, mas podem integrar informações visuais diretamente na cadeia de raciocínio”, segundo a OpenAI.
No mês passado, a OpenAI lançou um recurso de geração de imagens que viralizou online por sua capacidade de produzir imagens de anime no estilo do Studio Ghibli.
A OpenAI disse que seu modelo o3 é especialmente ajustado para matemática, programação, ciência e entendimento de imagens, enquanto o o4-mini opera mais rápido e a um custo menor. Ambos os modelos estão disponíveis a partir desta quarta-feira (16) para os clientes do ChatGPT Plus, Pro e Team.
A comunidade de usuários da OpenAI brinca há muito tempo sobre os nomes estranhos ou confusos de seus modelos de IA. O CEO Sam Altman entrou na brincadeira esta semana, escrevendo em um post na rede social X: “que tal consertarmos o nome dos nossos modelos até este verão e todo mundo ganha mais alguns meses para brincar com a gente (o que merecemos muito) até lá?”.
A empresa também informou que ambos os modelos foram “testados sob o programa de segurança mais rigoroso até hoje” e vinculou ao seu “framework de preparação”, atualizado no início desta semana.
A OpenAI tem sido criticada recentemente por mudanças em suas precauções e processos de segurança. Ela afirmou nesta semana que detém o direito de “mudar seus requisitos de segurança se ‘outro desenvolvedor de IA de fronteira lançar um sistema de alto risco sem salvaguardas comparáveis'”.
Ao mudar suas políticas nesta semana, a OpenAI escreveu que não exigiria mais testes de segurança para certos modelos já ajustados. A empresa também evitou divulgar um “cartão de modelo” — ou um relatório contendo informações sobre testes de segurança realizados antes do lançamento de um modelo — para seu modelo GPT-4.1. Em fevereiro, a OpenAI lançou a ferramenta de agente de IA Deep Research semanas antes de publicar seu cartão de sistema.
A OpenAI não respondeu imediatamente a um pedido de comentário.
📌 ONDE ASSISTIR AO MAIOR CANAL DE NEGÓCIOS DO MUNDO NO BRASIL:
🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais
🔷 TV SINAL ABERTO: parabólicas canal 562
🔷 ONLINE: www.timesbrasil.com.br | YouTube
🔷 FAST Channels: Samsung TV Plus, TCL Channels, Pluto TV, Soul TV, Zapping | Novos Streamings
Este conteúdo foi fornecido pela CNBC Internacional e a responsabilidade exclusiva pela tradução para o português é do Times Brasil.
Mais lidas
Ondas de tsunami chegam à Califórnia e ao Havaí após terremoto de grande magnitude na Rússia
Tsunami provocado por forte terremoto é observado no Japão
Casa Branca informa que Trump assinou decreto elevando tarifa sobre o Brasil
Forte terremoto provoca tsunami na Ásia: ondas atingem prédios e casas na Rússia; veja o momento
Tsunami atinge cidade russa; Fukushima no Japão é evacuada