Jovem trabalhou disfarçada em uma rede de cafeterias antes de abrir seu próprio café de matcha

SpaceX pode tornar a empresa mais valiosa do mundo? Confira as chances

Waymo faz recall de cerca de 3.900 robotáxis depois de alguns terem invadido zonas de obras em rodovias

Funcionários da Amazon são alvo de investigação após críticas à expansão de data centers de IA

Chefe da OPEP rejeita previsão da AIE sobre excesso de oferta enquanto “crítico” Estreito de Ormuz é reaberto

Inteligência Artificial

Modelo brasileiro de IA supera concorrentes globais na prova de formação médica Enamed

Publicado 20/06/2026 • 15:02 | Atualizado há 3 horas

KEY POINTS

Estudo compara dez modelos de IA na prova do Enamed de formação médica
Modelo brasileiro registrou 96,97% de acertos e supera modelos globais
GPT-4o-mini tem o menor índice de acerto entre os modelos avaliados

Pixabay

Estudo testa dez modelos de IA no Enamed e mostra desempenho superior de sistema treinado no contexto brasileiro

Pesquisadores de quatro instituições testaram dez modelos de linguagem na prova do Exame Nacional de Avaliação da Formação Médica, o Enamed, edição de 2026. O estudo, publicado no Journal of Medical Internet Research, buscou medir até que ponto sistemas de Inteligência Artificial resolvem com precisão desafios clínicos complexos antes de uma adoção mais ampla na prática médica.

A pesquisa reuniu equipes da Pontifícia Universidade Católica do Paraná, da Universidade Federal do Paraná, do Instituto Tecnológico de Aeronáutica e da Ohio State University, nos Estados Unidos. Cada modelo respondeu à prova cinco vezes, totalizando 500 respostas por sistema, das quais 495 foram consideradas válidas para o cálculo de acurácia.

Enamed expõe diferenças entre modelos generalistas

Nove dos dez modelos testados superaram 85% de acerto no Enamed. A exceção foi o GPT-4o-mini, que ficou em 73,74%. Entre os modelos generalistas, o GPT-5 alcançou 94,34% de acertos e o Gemini 2.5 Pro, 93,94%. Outros sistemas avaliados, como Claude Opus 4.1, Claude Sonnet 4.5, GPT-4o, GPT-4.1, Grok 4 e DeepSeek v.3.2, ficaram entre 85,65% e 91,92%.

As diferenças mais relevantes apareceram em questões que exigiam conhecimento de diretrizes e protocolos locais. Segundo o estudo, modelos generalistas convergiam com frequência para respostas incorretas em domínios como tuberculose e pré-natal, áreas em que a realidade epidemiológica brasileira tem peso direto na resposta correta.

Modelo nacional supera concorrentes no Enamed

O melhor desempenho geral coube ao Charcot, modelo desenvolvido pela Voa Health, healthtech brasileira voltada a soluções de IA para médicos. O sistema acertou 96,97% das questões do Enamed, treinado com diretrizes clínicas nacionais, protocolos locais e a realidade epidemiológica do país.

Para Gustavo Lenci Marques, médico, pesquisador e Clinical Research Leader da Voa Health, a influência de diretrizes locais, do perfil da população e do funcionamento do sistema de saúde torna a avaliação de IA no contexto brasileiro um ponto-chave.

“Os resultados mostram que soluções desenvolvidas com foco nesse contexto podem apresentar respostas mais alinhadas às necessidades da prática médica no país, sempre com supervisão profissional e uso responsável”, afirma.

O estudo aponta que a especialização em português e no contexto médico brasileiro reduz erros associados a vieses de treinamento presentes em modelos globais, treinados majoritariamente com dados internacionais.

Metodologia do estudo sobre IA no Enamed

A avaliação usou a versão oficial do Enamed, com 100 questões de múltipla escolha distribuídas entre clínica, cirurgia, atenção primária, saúde pública, pediatria e ginecologia-obstetrícia. Para cada questão, os pesquisadores registraram a alternativa escolhida, a justificativa apresentada pelo modelo e o tempo de resposta, o que permitiu uma análise comparativa detalhada entre os dez sistemas testados.

Siga o Times Brasil no Google e receba as principais notícias do Brasil e do Mundo.

Seguir no Google

O artigo, intitulado “Performance of Large Language Models on the Brazilian National Medical Education Examination: Comparative Benchmark Study”, tem entre os autores Francys de Luca Fernandes da Silva, Eduardo Augusto Roeder, João Victor Bruneti Severino, Matheus Nespolo Berger, Pedro Angelo Basei de Paula, Davi Ferreira, Maria Han Veiga, Thyago Proença de Moraes e Gustavo Lenci Marques.

📌 ONDE ASSISTIR AO MAIOR CANAL DE NEGÓCIOS DO MUNDO NO BRASIL:

🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais

🔷 TV SINAL ABERTO: parabólicas canal 562

🔷 ONLINE: www.timesbrasil.com.br | YouTube

🔷 FAST Channels: Samsung TV Plus, LG Channels, TCL Channels, Pluto TV, Roku, Soul TV, Zapping | Novos Streamings

Allan Ravagnani

Siga o Times Brasil - Licenciado Exclusivo CNBC no

Maiores Audiências

Endrick no banco: por que o patrocínio do jogador virou teoria nas redes?

‘Misantropia’ dispara nas buscas na web após invasão de sistema e disparo de alerta da Defesa Civil

Messi foge da onda rosa da Copa com chuteira especial; veja quanto custa o modelo

Como o Claude Fable passou de grande aposta da I.A a uma crise de reputação para a Anthropic

Explosão em empresa de produtos químicos em Itupeva mobiliza bombeiros; não há feridos

MAIS EM Inteligência Artificial

Tentativas de fraude de identidade sobem 36,6% no primeiro trimestre no Brasil, mostra pesquisa

há 2 horas

Imigrantes lideram tecnologia e IA na elite dos Estados Unidos, mostra ranking

há 2 horas

Marketing 7.0 usa IA para prever decisão de compra do consumidor

Inteligência artificial sabe o que você vai comprar antes de você, mostra nova teoria de Marketing

há 4 horas

A mesma pergunta pode ter respostas até 80% diferentes no ChatGPT, mostra estudo

há 5 horas