Ford lança nova IA para impulsionar Pro, um negócio comercial bilionário

Meta compra Moltbook e entra nas redes sociais para agentes de inteligência artificial

Google aprofunda aposta em IA no Pentágono após Anthropic processar governo Trump

EUA desmentem secretário de Energia e dizem que não escoltaram petroleiros no Estreito de Ormuz

Por que a China consegue suportar a alta do petróleo com mais facilidade do que outros países

Tecnologia & Inovação

Como o novo modelo de IA da China, DeepSeek, ameaça a liderança dos EUA

Publicado 26/01/2025 • 08:34 | Atualizado há 1 ano

KEY POINTS

Um laboratório de inteligência artificial pouco conhecido na China gerou pânico no Vale do Silício ao lançar modelos de IA que superam os melhores dos EUA.
O laboratório, chamado DeepSeek, apresentou no final de dezembro um modelo de linguagem de código aberto, afirmando que o desenvolveu em apenas dois meses e com um orçamento inferior a US$ 6 milhões, utilizando chips da Nvidia de capacidade reduzida.
Esses avanços levantaram preocupações sobre a possível redução da liderança global dos EUA em inteligência artificial.

DeepSeek

CFOTO/Sipa USA via Reuters Connect

Um laboratório de inteligência artificial pouco conhecido na China gerou pânico no Vale do Silício ao lançar modelos de Inteligência Artificial que superam os melhores dos EUA — apesar de serem desenvolvidos com menor custo e usando chips menos potentes.

O laboratório, chamado DeepSeek, apresentou no final de dezembro um modelo de linguagem de código aberto, afirmando que o desenvolveu em apenas dois meses e com um orçamento inferior a US$ 6 milhões, utilizando chips da Nvidia de capacidade reduzida, conhecidos como H800.

Esses avanços levantaram preocupações sobre a possível redução da liderança global dos EUA em inteligência artificial, além de questionarem os altos investimentos das big techs no desenvolvimento de modelos de IA e data centers.

Leia também:

Em uma série de testes independentes de benchmark, o modelo da DeepSeek superou o Llama 3.1, da Meta, o GPT-4o, da OpenAI, e o Claude Sonnet 3.5, da Anthropic, em métricas que avaliam precisão em resolução de problemas complexos, matemática e codificação.

Na segunda-feira, a DeepSeek lançou o r1, um modelo de raciocínio que também superou o modelo mais recente da OpenAI, o o1, em muitos desses testes independentes.

“Ver esse novo modelo da DeepSeek é extremamente impressionante, tanto pela eficiência no uso de recursos computacionais quanto pela forma como eles desenvolveram um modelo de código aberto altamente eficaz,” disse Satya Nadella, CEO da Microsoft, durante o Fórum Econômico Mundial em Davos, na Suíça, na quarta-feira. “Precisamos levar muito a sério os avanços vindos da China.”

A DeepSeek também enfrentou as rígidas restrições dos EUA à exportação de semicondutores, que cortaram o acesso da China a chips de alta potência, como os H100 da Nvidia.

Os avanços mais recentes sugerem que a DeepSeek encontrou uma forma de contornar essas limitações ou que os controles de exportação não tiveram o impacto esperado por Washington.

“Eles podem usar um modelo muito grande e bom para aplicar um processo chamado destilação,” explicou Chetan Puttagunta, sócio da Benchmark. “Basicamente, você utiliza um modelo maior para ensinar um modelo menor a se especializar naquilo que você quer. É um método muito eficiente em termos de custo.”

Pouco se sabe sobre o laboratório e seu fundador, Liang WenFeng. De acordo com reportagens, a DeepSeek nasceu de um fundo de hedge chinês chamado High-Flyer Quant, que administra cerca de US$ 8 bilhões em ativos.

No entanto, a DeepSeek não é a única empresa chinesa avançando no setor.

O renomado pesquisador de IA Kai-Fu Lee afirmou que sua startup, a 01.ai, foi treinada com um orçamento de apenas US$ 3 milhões. Na quarta-feira, a ByteDance, controladora do TikTok, anunciou uma atualização de seu modelo, alegando que ele superou o o1 da OpenAI em um importante teste de benchmark.

“A necessidade é a mãe da invenção,” disse Aravind Srinivas, CEO da Perplexity. “Por terem que descobrir soluções alternativas, eles acabaram construindo algo muito mais eficiente.”

📌 ONDE ASSISTIR AO MAIOR CANAL DE NEGÓCIOS DO MUNDO NO BRASIL:

🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais

🔷 TV SINAL ABERTO: parabólicas canal 562

🔷 ONLINE: www.timesbrasil.com.br | YouTube

🔷 FAST Channels: Samsung TV Plus, LG Channels, TCL Channels, Pluto TV, Roku, Soul TV, Zapping | Novos Streamings