Relatório estima que gastos da DeepSeek com hardware podem chegar a US$ 500 milhões
Publicado sáb, 01 fev 2025 • 8:59 AM GMT-0300 | Atualizado há 15 dias
67% dos americanos endividados com cartão cometem esse ‘grande erro’, diz especialista
Comcast e NBCUniversal são investigadas nos EUA por iniciativas de diversidade
Como o DeepSeek da China pode impulsionar o já crescente mercado de data centers
Fabricante da bolsa Birkin, Hermès supera expectativas com salto nas vendas do quarto trimestre
Documentos mostram que BYD detém direitos de mineração no Vale do Lítio, em Minas Gerais
Publicado sáb, 01 fev 2025 • 8:59 AM GMT-0300 | Atualizado há 15 dias
KEY POINTS
DeepSeek
CFOTO/Sipa USA via Reuters Connect
A DeepSeek da China se tornou o principal assunto no mundo da tecnologia nesta semana, com muitos na indústria e em Wall Street focados em um único número: US$ 6 milhões (aproximadamente R$ 29,76 milhões).
No documento da DeepSeek sobre seu mais novo modelo de inteligência artificial, a empresa informou que seus custos totais de treinamento foram de US$ 5,576 milhões (aproximadamente R$ 27,72 milhões), baseados no preço de aluguel das unidades de processamento gráfico da Nvidia. A DeepSeek fez uma ressalva clara, dizendo que o número incluía apenas o “treinamento oficial” do modelo e excluía os custos relacionados a “pesquisas anteriores e experimentos de remoção sobre arquiteturas, algoritmos ou dados”.
No início da semana, o Assistente de IA da DeepSeek alcançou o cobiçado posto de aplicativo gratuito mais baixado na App Store nos Estados Unidos, destronando o ChatGPT da OpenAI. As ações globais de tecnologia caíram, com os fabricantes de chips Nvidia e Broadcom perdendo juntos US$ 800 bilhões (aproximadamente R$ 3,97 trilhões) em valor de mercado na última segunda-feira (27).
Um novo relatório da SemiAnalysis, uma empresa de pesquisa e consultoria em semicondutores, trouxe mais contexto para as despesas da DeepSeek. A empresa estimou que os gastos com hardware da DeepSeek estão “bem acima de US$ 500 milhões ao longo da história da empresa”, acrescentando que os custos de P&D e o custo total de propriedade são significativos. Gerar “dados sintéticos” para o modelo treinar exigiria “uma quantidade considerável de computação”, escreveu a SemiAnalysis.
O relatório mencionou que o Claude 3.5 Sonnet da Anthropic custou “dezenas de milhões para treinar”, mas destacou que a Anthropic levantou bilhões de dólares da Amazon e do Google, um indicativo da quantidade maior de dinheiro necessária para operar os modelos e a empresa.
“Isso acontece porque eles precisam experimentar, criar novas arquiteturas, coletar e limpar dados, pagar funcionários e muito mais”, disse a SemiAnalysis.
O próprio documento da DeepSeek não inclui uma estimativa de seus custos de computação. A empresa não respondeu imediatamente a um pedido de posicionamento.
“Para ser claro, a DeepSeek é única por ter sido a primeira a alcançar esse nível de custo e capacidades “, escreveram os analistas da SemiAnalysis. A empresa acrescentou que o R1 da DeepSeek “é um modelo muito bom” e que “alcançar rapidamente esse nível de raciocínio é objetivamente impressionante”.
Especialistas e analistas destacaram nesta semana a qualidade do modelo da DeepSeek e notaram o quão impressionante ele é, considerando que os EUA restringiram a exportação de chips para a China três vezes em três anos. Isso gerou preocupações de que os EUA estão ficando para trás de seu principal adversário em um mercado que deve alcançar US$ 1 trilhão (aproximadamente R$ 4,97 trilhões) em receita dentro de uma década.
Analistas da Bernstein escreveram em uma nota na segunda-feira (27) que “de acordo com as muitas (ocasionalmente histéricas) análises polêmicas que vimos [no final de semana], as implicações variam de ‘Isso é realmente interessante’ a ‘Este é o fim do complexo de infraestrutura de IA como o conhecemos'”.
A DeepSeek foi fundada em 2023 por Liang Wenfeng, cofundador da High-Flyer, um fundo de hedge quantitativo focado em IA. A startup de IA supostamente cresceu a partir da unidade de pesquisa em IA do fundo de hedge em abril de 2023 para focar em modelos de linguagem de grande escala e alcançar a inteligência geral artificial, ou AGI — um ramo da IA que iguala ou supera a inteligência humana em uma ampla gama de tarefas, e que a OpenAI e outros estão buscando.
A DeepSeek ainda é totalmente propriedade e financiada pela High-Flyer, segundo analistas da Jefferies.
O burburinho em torno da DeepSeek começou a ganhar força no início deste mês, quando a startup lançou o R1, seu modelo de raciocínio que rivaliza com o o1 da OpenAI. Ele é de código aberto, o que significa que qualquer desenvolvedor de IA pode usá-lo.
Como outros chatbots chineses, o da DeepSeek tem limitações em certos tópicos: quando questionado sobre algumas das políticas do líder chinês Xi Jinping, por exemplo, o DeepSeek supostamente desvia o usuário de questões semelhantes.
O CEO da OpenAI, Sam Altman, elogiou publicamente o modelo, mas a empresa também afirmou acreditar que há evidências de que a DeepSeek colheu indevidamente dados da OpenAI para construir seu produto. Em um evento em Washington, D.C. organizado pela OpenAI na quinta-feira (30), Altman disse que a DeepSeek é “claramente um grande modelo”.
“Isso é um lembrete do nível de competição e da necessidade de uma IA democrática vencer”, disse ele. Ele afirmou que isso também aponta para o “nível de interesse em raciocínio, o nível de interesse em código aberto”.
Este conteúdo foi fornecido pela CNBC Internacional e a responsabilidade exclusiva pela tradução para o português é do Times Brasil.