CNBC

CNBCCEO da Honeywell Aerospace prevê forte crescimento após estreia da empresa como companhia independente

Tecnologia & Inovação

DeepSeek diz ter treinado modelo de IA por apenas US$ 294 mil

Publicado 19/09/2025 • 09:18 | Atualizado há 9 meses

KEY POINTS

  • A chinesa DeepSeek gastou US$ 294 mil no treinamento de seu modelo R1, valor inferior aos reportados por concorrentes dos Estados Unidos.
  • Segundo o estudo, que listou o fundador Liang Wenfeng como um dos coautores, o modelo R1 foi treinado ao longo de 80 horas utilizando 512 chips Nvidia H800.

Pexels

A chinesa DeepSeek gastou US$ 294 mil no treinamento de seu modelo R1, valor inferior aos reportados por concorrentes dos Estados Unidos. A informação foi publicada na quarta-feira (17) na revista científica Nature.

Segundo o estudo, que listou o fundador Liang Wenfeng como um dos coautores, o modelo R1 foi treinado ao longo de 80 horas utilizando 512 chips Nvidia H800. Esta é a primeira vez que a empresa, sediada em Hangzhou, divulga estimativas de custos de treinamento de seus sistemas. O dado não constava em versão anterior do artigo, publicada em janeiro.

O lançamento, em janeiro, de sistemas de IA que a DeepSeek classificou como de baixo custo levou investidores globais a vender ações de tecnologia, diante do receio de que os novos modelos pudessem ameaçar o domínio de líderes do setor, como a Nvidia.

Em 2023, Sam Altman, CEO da OpenAI, afirmou que a criação de modelos fundacionais havia custado “muito mais de US$ 100 milhões”, sem detalhar valores.

Leia também:

Com a OpenAI na mira, DeepSeek lança discretamente atualização da inteligência artificial R1

DeepSeek afirma que novos modelos de chips chineses serão equivalentes a análogos americanos

Sucesso da DeepSeek, da China, faz Nvidia desvalorizar US$ 600 bilhões em 1 dia

O artigo também trouxe detalhes sobre o uso de chips da Nvidia em meio a restrições impostas pelos Estados Unidos. Embora o treinamento principal tenha utilizado H800, criados especificamente para o mercado chinês, a empresa reconheceu pela primeira vez possuir A100 e disse que esses foram usados em fases preparatórias de experimentos.

Outra controvérsia gira em torno do processo de “destilação de modelos”, técnica em que um sistema aprende a partir de outro, reduzindo custos. Autoridades e empresas norte-americanas já questionaram se a DeepSeek teria se apropriado de tecnologias da OpenAI. A companhia defende que a prática melhora o desempenho e amplia o acesso à IA, destacando ainda que parte de seus modelos utilizou o Llama, da Meta, como base.

No artigo, a empresa admitiu que dados usados no treinamento de seu modelo V3 incluíam páginas da web com respostas geradas por sistemas da OpenAI, mas afirmou que isso ocorreu de forma incidental.

Times Brasil - CNBC

Siga o Times Brasil no Google e receba as principais notícias do Brasil e do Mundo.

Seguir no Google

A OpenAI não comentou o caso até o momento.

📌 ONDE ASSISTIR AO MAIOR CANAL DE NEGÓCIOS DO MUNDO NO BRASIL:

🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais

🔷 TV SINAL ABERTO: parabólicas canal 562

🔷 ONLINE: www.timesbrasil.com.br | YouTube

🔷 FAST Channels: Samsung TV Plus, LG Channels, TCL Channels, Pluto TV, Roku, Soul TV, Zapping | Novos Streamings

Siga o Times Brasil - Licenciado Exclusivo CNBC no

MAIS EM Tecnologia & Inovação