Como o novo modelo de IA da China, DeepSeek, ameaça a liderança dos EUA
Publicado 26/01/2025 • 08:34 | Atualizado há 2 meses
Putin diz apoiar cessar-fogo com a Ucrânia, mas impõe condições
Empresa de esportes femininos Monarch Collective aumenta fundo para US$ 250 milhões e deve investir em equipes internacionais
Spotify pagou mais de US$ 1 milhão em royalties a quase 1,5 mil artistas em 2024
Meta recorre para impedir ex-funcionária de promover livro de denúncias
Alibaba lança nova versão de assistente de IA com raciocínio avançado
Publicado 26/01/2025 • 08:34 | Atualizado há 2 meses
KEY POINTS
DeepSeek
CFOTO/Sipa USA via Reuters Connect
Um laboratório de inteligência artificial pouco conhecido na China gerou pânico no Vale do Silício ao lançar modelos de Inteligência Artificial que superam os melhores dos EUA — apesar de serem desenvolvidos com menor custo e usando chips menos potentes.
O laboratório, chamado DeepSeek, apresentou no final de dezembro um modelo de linguagem de código aberto, afirmando que o desenvolveu em apenas dois meses e com um orçamento inferior a US$ 6 milhões, utilizando chips da Nvidia de capacidade reduzida, conhecidos como H800.
Esses avanços levantaram preocupações sobre a possível redução da liderança global dos EUA em inteligência artificial, além de questionarem os altos investimentos das big techs no desenvolvimento de modelos de IA e data centers.
Leia também:
Em uma série de testes independentes de benchmark, o modelo da DeepSeek superou o Llama 3.1, da Meta, o GPT-4o, da OpenAI, e o Claude Sonnet 3.5, da Anthropic, em métricas que avaliam precisão em resolução de problemas complexos, matemática e codificação.
Na segunda-feira, a DeepSeek lançou o r1, um modelo de raciocínio que também superou o modelo mais recente da OpenAI, o o1, em muitos desses testes independentes.
“Ver esse novo modelo da DeepSeek é extremamente impressionante, tanto pela eficiência no uso de recursos computacionais quanto pela forma como eles desenvolveram um modelo de código aberto altamente eficaz,” disse Satya Nadella, CEO da Microsoft, durante o Fórum Econômico Mundial em Davos, na Suíça, na quarta-feira. “Precisamos levar muito a sério os avanços vindos da China.”
A DeepSeek também enfrentou as rígidas restrições dos EUA à exportação de semicondutores, que cortaram o acesso da China a chips de alta potência, como os H100 da Nvidia.
Os avanços mais recentes sugerem que a DeepSeek encontrou uma forma de contornar essas limitações ou que os controles de exportação não tiveram o impacto esperado por Washington.
“Eles podem usar um modelo muito grande e bom para aplicar um processo chamado destilação,” explicou Chetan Puttagunta, sócio da Benchmark. “Basicamente, você utiliza um modelo maior para ensinar um modelo menor a se especializar naquilo que você quer. É um método muito eficiente em termos de custo.”
Pouco se sabe sobre o laboratório e seu fundador, Liang WenFeng. De acordo com reportagens, a DeepSeek nasceu de um fundo de hedge chinês chamado High-Flyer Quant, que administra cerca de US$ 8 bilhões em ativos.
No entanto, a DeepSeek não é a única empresa chinesa avançando no setor.
O renomado pesquisador de IA Kai-Fu Lee afirmou que sua startup, a 01.ai, foi treinada com um orçamento de apenas US$ 3 milhões. Na quarta-feira, a ByteDance, controladora do TikTok, anunciou uma atualização de seu modelo, alegando que ele superou o o1 da OpenAI em um importante teste de benchmark.
“A necessidade é a mãe da invenção,” disse Aravind Srinivas, CEO da Perplexity. “Por terem que descobrir soluções alternativas, eles acabaram construindo algo muito mais eficiente.”
Mais lidas
Porsche investe US$ 872 mi em motores a combustão após queda na venda dos elétricos
Simone Tebet afirma que a integração sul-americana está pronta para sair do papel
Previ, fundo de pensão dos funcionários do BB, registra déficit acumulado de R$ 3,16 bilhões
Cacau Show celebra aumento das vendas e recorde de faturamento
Executivo da OpenAI revela o 'maior desafio' da empresa no momento