Siga o Times Brasil - Licenciado Exclusivo CNBC no
Como o novo modelo de IA da China, DeepSeek, ameaça a liderança dos EUA
Publicado 26/01/2025 • 08:34 | Atualizado há 5 meses
Três razões pelas quais as tarifas ainda não aumentaram a inflação nos EUA
CEO da Nvidia diz que esta é a década dos robôs e veículos autônomos
CNBC Daily Open: boas notícias sobre comércio dos EUA e inflação não estão elevando os mercados
Maioria dos executivos de varejo espera que Trump recue nas tarifas, segundo pesquisa
Trump chama presidente do Fed, Jerome Powell, de “idiota” e pressiona por corte nos juros
Publicado 26/01/2025 • 08:34 | Atualizado há 5 meses
KEY POINTS
DeepSeek
CFOTO/Sipa USA via Reuters Connect
Um laboratório de inteligência artificial pouco conhecido na China gerou pânico no Vale do Silício ao lançar modelos de Inteligência Artificial que superam os melhores dos EUA — apesar de serem desenvolvidos com menor custo e usando chips menos potentes.
O laboratório, chamado DeepSeek, apresentou no final de dezembro um modelo de linguagem de código aberto, afirmando que o desenvolveu em apenas dois meses e com um orçamento inferior a US$ 6 milhões, utilizando chips da Nvidia de capacidade reduzida, conhecidos como H800.
Esses avanços levantaram preocupações sobre a possível redução da liderança global dos EUA em inteligência artificial, além de questionarem os altos investimentos das big techs no desenvolvimento de modelos de IA e data centers.
Leia também:
Em uma série de testes independentes de benchmark, o modelo da DeepSeek superou o Llama 3.1, da Meta, o GPT-4o, da OpenAI, e o Claude Sonnet 3.5, da Anthropic, em métricas que avaliam precisão em resolução de problemas complexos, matemática e codificação.
Na segunda-feira, a DeepSeek lançou o r1, um modelo de raciocínio que também superou o modelo mais recente da OpenAI, o o1, em muitos desses testes independentes.
“Ver esse novo modelo da DeepSeek é extremamente impressionante, tanto pela eficiência no uso de recursos computacionais quanto pela forma como eles desenvolveram um modelo de código aberto altamente eficaz,” disse Satya Nadella, CEO da Microsoft, durante o Fórum Econômico Mundial em Davos, na Suíça, na quarta-feira. “Precisamos levar muito a sério os avanços vindos da China.”
A DeepSeek também enfrentou as rígidas restrições dos EUA à exportação de semicondutores, que cortaram o acesso da China a chips de alta potência, como os H100 da Nvidia.
Os avanços mais recentes sugerem que a DeepSeek encontrou uma forma de contornar essas limitações ou que os controles de exportação não tiveram o impacto esperado por Washington.
“Eles podem usar um modelo muito grande e bom para aplicar um processo chamado destilação,” explicou Chetan Puttagunta, sócio da Benchmark. “Basicamente, você utiliza um modelo maior para ensinar um modelo menor a se especializar naquilo que você quer. É um método muito eficiente em termos de custo.”
Pouco se sabe sobre o laboratório e seu fundador, Liang WenFeng. De acordo com reportagens, a DeepSeek nasceu de um fundo de hedge chinês chamado High-Flyer Quant, que administra cerca de US$ 8 bilhões em ativos.
No entanto, a DeepSeek não é a única empresa chinesa avançando no setor.
O renomado pesquisador de IA Kai-Fu Lee afirmou que sua startup, a 01.ai, foi treinada com um orçamento de apenas US$ 3 milhões. Na quarta-feira, a ByteDance, controladora do TikTok, anunciou uma atualização de seu modelo, alegando que ele superou o o1 da OpenAI em um importante teste de benchmark.
“A necessidade é a mãe da invenção,” disse Aravind Srinivas, CEO da Perplexity. “Por terem que descobrir soluções alternativas, eles acabaram construindo algo muito mais eficiente.”
Mais lidas
Trump chama presidente do Fed, Jerome Powell, de "idiota" e pressiona por corte nos juros
'Metade da população mundial não deveria ser chamada de nicho', diz CEO da Tether
Irã responde ataque de mísseis e lança 100 drones contra Israel; mercados oscilam
Preços do petróleo sobem após Israel lançar ataques aéreos unilaterais contra o Irã
Ministro da Defesa de Israel anuncia ‘situação especial’ após ataque israelense ao Irã