Siga o Times Brasil - Licenciado Exclusivo CNBC no
Modelo brasileiro de IA supera concorrentes globais na prova de formação médica Enamed
Publicado 20/06/2026 • 15:02 | Atualizado há 3 horas
Jovem trabalhou disfarçada em uma rede de cafeterias antes de abrir seu próprio café de matcha
SpaceX pode tornar a empresa mais valiosa do mundo? Confira as chances
Waymo faz recall de cerca de 3.900 robotáxis depois de alguns terem invadido zonas de obras em rodovias
Funcionários da Amazon são alvo de investigação após críticas à expansão de data centers de IA
Chefe da OPEP rejeita previsão da AIE sobre excesso de oferta enquanto “crítico” Estreito de Ormuz é reaberto
Publicado 20/06/2026 • 15:02 | Atualizado há 3 horas
KEY POINTS
Pixabay
Estudo testa dez modelos de IA no Enamed e mostra desempenho superior de sistema treinado no contexto brasileiro
Pesquisadores de quatro instituições testaram dez modelos de linguagem na prova do Exame Nacional de Avaliação da Formação Médica, o Enamed, edição de 2026. O estudo, publicado no Journal of Medical Internet Research, buscou medir até que ponto sistemas de Inteligência Artificial resolvem com precisão desafios clínicos complexos antes de uma adoção mais ampla na prática médica.
A pesquisa reuniu equipes da Pontifícia Universidade Católica do Paraná, da Universidade Federal do Paraná, do Instituto Tecnológico de Aeronáutica e da Ohio State University, nos Estados Unidos. Cada modelo respondeu à prova cinco vezes, totalizando 500 respostas por sistema, das quais 495 foram consideradas válidas para o cálculo de acurácia.
Leia também: A mesma pergunta pode ter respostas até 80% diferentes no ChatGPT, mostra estudo
Nove dos dez modelos testados superaram 85% de acerto no Enamed. A exceção foi o GPT-4o-mini, que ficou em 73,74%. Entre os modelos generalistas, o GPT-5 alcançou 94,34% de acertos e o Gemini 2.5 Pro, 93,94%. Outros sistemas avaliados, como Claude Opus 4.1, Claude Sonnet 4.5, GPT-4o, GPT-4.1, Grok 4 e DeepSeek v.3.2, ficaram entre 85,65% e 91,92%.
As diferenças mais relevantes apareceram em questões que exigiam conhecimento de diretrizes e protocolos locais. Segundo o estudo, modelos generalistas convergiam com frequência para respostas incorretas em domínios como tuberculose e pré-natal, áreas em que a realidade epidemiológica brasileira tem peso direto na resposta correta.
O melhor desempenho geral coube ao Charcot, modelo desenvolvido pela Voa Health, healthtech brasileira voltada a soluções de IA para médicos. O sistema acertou 96,97% das questões do Enamed, treinado com diretrizes clínicas nacionais, protocolos locais e a realidade epidemiológica do país.
Para Gustavo Lenci Marques, médico, pesquisador e Clinical Research Leader da Voa Health, a influência de diretrizes locais, do perfil da população e do funcionamento do sistema de saúde torna a avaliação de IA no contexto brasileiro um ponto-chave.
“Os resultados mostram que soluções desenvolvidas com foco nesse contexto podem apresentar respostas mais alinhadas às necessidades da prática médica no país, sempre com supervisão profissional e uso responsável”, afirma.
O estudo aponta que a especialização em português e no contexto médico brasileiro reduz erros associados a vieses de treinamento presentes em modelos globais, treinados majoritariamente com dados internacionais.
A avaliação usou a versão oficial do Enamed, com 100 questões de múltipla escolha distribuídas entre clínica, cirurgia, atenção primária, saúde pública, pediatria e ginecologia-obstetrícia. Para cada questão, os pesquisadores registraram a alternativa escolhida, a justificativa apresentada pelo modelo e o tempo de resposta, o que permitiu uma análise comparativa detalhada entre os dez sistemas testados.
Siga o Times Brasil no Google e receba as principais notícias do Brasil e do Mundo.
Seguir no GoogleO artigo, intitulado “Performance of Large Language Models on the Brazilian National Medical Education Examination: Comparative Benchmark Study”, tem entre os autores Francys de Luca Fernandes da Silva, Eduardo Augusto Roeder, João Victor Bruneti Severino, Matheus Nespolo Berger, Pedro Angelo Basei de Paula, Davi Ferreira, Maria Han Veiga, Thyago Proença de Moraes e Gustavo Lenci Marques.
🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais
🔷 TV SINAL ABERTO: parabólicas canal 562
🔷 ONLINE: www.timesbrasil.com.br | YouTube
🔷 FAST Channels: Samsung TV Plus, LG Channels, TCL Channels, Pluto TV, Roku, Soul TV, Zapping | Novos Streamings

Maiores Audiências
1
Endrick no banco: por que o patrocínio do jogador virou teoria nas redes?
2
‘Misantropia’ dispara nas buscas na web após invasão de sistema e disparo de alerta da Defesa Civil
3
Messi foge da onda rosa da Copa com chuteira especial; veja quanto custa o modelo
4
Como o Claude Fable passou de grande aposta da I.A a uma crise de reputação para a Anthropic
5
Explosão em empresa de produtos químicos em Itupeva mobiliza bombeiros; não há feridos