Siga o Times Brasil - Licenciado Exclusivo CNBC no
Relatório estima que gastos da DeepSeek com hardware podem chegar a US$ 500 milhões
Publicado 01/02/2025 • 08:59 | Atualizado há 5 meses
As 10 cidades mais habitáveis do mundo com base em saúde, infraestrutura e muito mais
Airbus domina o Paris Air Show enquanto a Boeing volta a ficar em segundo plano
Samsung busca alcançar rivais chinesas com celulares dobráveis mais finos, enquanto Apple se prepara para entrar no mercado
Starship da SpaceX explode durante teste rotineiro no Texas; veja imagens
Hackers pró-Israel destroem US$ 90 milhões em criptomoedas do Irã, diz empresa de análise
Publicado 01/02/2025 • 08:59 | Atualizado há 5 meses
KEY POINTS
DeepSeek
CFOTO/Sipa USA via Reuters Connect
A DeepSeek da China se tornou o principal assunto no mundo da tecnologia nesta semana, com muitos na indústria e em Wall Street focados em um único número: US$ 6 milhões (aproximadamente R$ 29,76 milhões).
No documento da DeepSeek sobre seu mais novo modelo de inteligência artificial, a empresa informou que seus custos totais de treinamento foram de US$ 5,576 milhões (aproximadamente R$ 27,72 milhões), baseados no preço de aluguel das unidades de processamento gráfico da Nvidia. A DeepSeek fez uma ressalva clara, dizendo que o número incluía apenas o “treinamento oficial” do modelo e excluía os custos relacionados a “pesquisas anteriores e experimentos de remoção sobre arquiteturas, algoritmos ou dados”.
No início da semana, o Assistente de IA da DeepSeek alcançou o cobiçado posto de aplicativo gratuito mais baixado na App Store nos Estados Unidos, destronando o ChatGPT da OpenAI. As ações globais de tecnologia caíram, com os fabricantes de chips Nvidia e Broadcom perdendo juntos US$ 800 bilhões (aproximadamente R$ 3,97 trilhões) em valor de mercado na última segunda-feira (27).
Um novo relatório da SemiAnalysis, uma empresa de pesquisa e consultoria em semicondutores, trouxe mais contexto para as despesas da DeepSeek. A empresa estimou que os gastos com hardware da DeepSeek estão “bem acima de US$ 500 milhões ao longo da história da empresa”, acrescentando que os custos de P&D e o custo total de propriedade são significativos. Gerar “dados sintéticos” para o modelo treinar exigiria “uma quantidade considerável de computação”, escreveu a SemiAnalysis.
O relatório mencionou que o Claude 3.5 Sonnet da Anthropic custou “dezenas de milhões para treinar”, mas destacou que a Anthropic levantou bilhões de dólares da Amazon e do Google, um indicativo da quantidade maior de dinheiro necessária para operar os modelos e a empresa.
“Isso acontece porque eles precisam experimentar, criar novas arquiteturas, coletar e limpar dados, pagar funcionários e muito mais”, disse a SemiAnalysis.
O próprio documento da DeepSeek não inclui uma estimativa de seus custos de computação. A empresa não respondeu imediatamente a um pedido de posicionamento.
“Para ser claro, a DeepSeek é única por ter sido a primeira a alcançar esse nível de custo e capacidades “, escreveram os analistas da SemiAnalysis. A empresa acrescentou que o R1 da DeepSeek “é um modelo muito bom” e que “alcançar rapidamente esse nível de raciocínio é objetivamente impressionante”.
Especialistas e analistas destacaram nesta semana a qualidade do modelo da DeepSeek e notaram o quão impressionante ele é, considerando que os EUA restringiram a exportação de chips para a China três vezes em três anos. Isso gerou preocupações de que os EUA estão ficando para trás de seu principal adversário em um mercado que deve alcançar US$ 1 trilhão (aproximadamente R$ 4,97 trilhões) em receita dentro de uma década.
Analistas da Bernstein escreveram em uma nota na segunda-feira (27) que “de acordo com as muitas (ocasionalmente histéricas) análises polêmicas que vimos [no final de semana], as implicações variam de ‘Isso é realmente interessante’ a ‘Este é o fim do complexo de infraestrutura de IA como o conhecemos'”.
A DeepSeek foi fundada em 2023 por Liang Wenfeng, cofundador da High-Flyer, um fundo de hedge quantitativo focado em IA. A startup de IA supostamente cresceu a partir da unidade de pesquisa em IA do fundo de hedge em abril de 2023 para focar em modelos de linguagem de grande escala e alcançar a inteligência geral artificial, ou AGI — um ramo da IA que iguala ou supera a inteligência humana em uma ampla gama de tarefas, e que a OpenAI e outros estão buscando.
A DeepSeek ainda é totalmente propriedade e financiada pela High-Flyer, segundo analistas da Jefferies.
O burburinho em torno da DeepSeek começou a ganhar força no início deste mês, quando a startup lançou o R1, seu modelo de raciocínio que rivaliza com o o1 da OpenAI. Ele é de código aberto, o que significa que qualquer desenvolvedor de IA pode usá-lo.
Como outros chatbots chineses, o da DeepSeek tem limitações em certos tópicos: quando questionado sobre algumas das políticas do líder chinês Xi Jinping, por exemplo, o DeepSeek supostamente desvia o usuário de questões semelhantes.
O CEO da OpenAI, Sam Altman, elogiou publicamente o modelo, mas a empresa também afirmou acreditar que há evidências de que a DeepSeek colheu indevidamente dados da OpenAI para construir seu produto. Em um evento em Washington, D.C. organizado pela OpenAI na quinta-feira (30), Altman disse que a DeepSeek é “claramente um grande modelo”.
“Isso é um lembrete do nível de competição e da necessidade de uma IA democrática vencer”, disse ele. Ele afirmou que isso também aponta para o “nível de interesse em raciocínio, o nível de interesse em código aberto”.
Este conteúdo foi fornecido pela CNBC Internacional e a responsabilidade exclusiva pela tradução para o português é do Times Brasil.
Mais lidas
Ministro alerta que economia da Rússia está à beira da recessão
Criadores dizem que não sabiam que o Google usa o YouTube para treinar IA
Montadoras chinesas inundam o Brasil com carros elétricos e gera reação de players estabelecidos
Meirelles sobre aumento da Selic: 'BC vai fazer o que for preciso para que a inflação caia'
EUA ganham mil novos milionários por dia em 2024, aponta relatório