CNBC

CNBC Ações da Tesla despencam após Trump dizer que DOGE deveria analisar os subsídios de Elon Musk

Empresas & Negócios

Cloudflare vai bloquear robôs de IA que rastreiam e extraem conteúdo

Publicado 01/07/2025 • 09:11 | Atualizado há 9 horas

CNBC

Redação CNBC

KEY POINTS

  • A partir de terça-feira (1), cada novo domínio da web que se inscrever no Cloudflare será perguntado se deseja permitir ou bloquear rastreadores de IA.
  • Pelo menos 16% do tráfego de internet do mundo é roteado pela Cloudflare, uma das maiores redes de distribuição de conteúdo do mundo.
  • A medida poderia “prejudicar a capacidade dos chatbots de IA de coletar dados para fins de treinamento e pesquisa”, disse um advogado à CNBC.
ChatGPT é o chatbot de inteligência artificial da OpenAI

ChatGPT é o chatbot de inteligência artificial da OpenAI

Pexels

Empresa de Internet Cloudflare vai bloquear rastreadores de inteligência artificial de acessar conteúdo sem a permissão ou compensação padrão dos proprietários do site, em uma medida que pode impactar significativamente a capacidade dos desenvolvedores de IA de treinar seus modelos.

A partir de terça-feira (1), cada novo domínio da web que se inscrever no Cloudflare será perguntado se deseja permitir rastreadores de IA, dando efetivamente a eles a capacidade de impedir que bots extraiam dados de seus sites.

A Cloudflare é o que chamamos de rede de distribuição de conteúdo, ou CDN. Ela ajuda as empresas a entregar conteúdo e aplicativos online com mais rapidez, armazenando os dados em cache mais próximos dos usuários finais. Ela desempenha um papel fundamental para garantir que as pessoas acessem o conteúdo da web sem problemas todos os dias.

Aproximadamente 16% do tráfego global da internet passa diretamente pelo CDN da Cloudflare, estimou a empresa em um relatório de 2023.

“Os rastreadores de IA têm extraído conteúdo sem limites. Nosso objetivo é devolver o poder aos criadores, ao mesmo tempo, em que ajudamos as empresas de IA a inovar”, disse Matthew Prince, cofundador e CEO da Cloudflare, em um comunicado na terça-feira.

“Trata-se de salvaguardar o futuro de uma Internet livre e vibrante com um novo modelo que funcione para todos”, acrescentou.

O que são rastreadores de IA?

Os rastreadores de IA são bots automatizados projetados para extrair grandes quantidades de dados de sites, bancos de dados e outras fontes de informação para treinar grandes modelos de linguagem como OpenAI e Google.

Enquanto a Internet anteriormente recompensava os criadores direcionando os usuários para sites originais, segundo a Cloudflare, hoje os rastreadores de IA estão quebrando esse modelo ao coletar textos, artigos e imagens para gerar respostas a consultas de uma forma que os usuários não precisam visitar a fonte original.

Isso, acrescenta a empresa, está privando os editores de tráfego vital e, por sua vez, de receita de publicidade online.

A medida tomada na terça-feira se baseia em uma ferramenta lançada pela Cloudflare em setembro do ano passado, que permitia aos editores bloquear rastreadores de IA com um único clique. 

Agora, a empresa vai além, tornando essa ferramenta padrão para todos os sites para os quais fornece serviços.

A OpenAI disse que se recusou a participar quando a Cloudflare apresentou seu plano de bloquear rastreadores de IA por padrão, alegando que a rede de distribuição de conteúdo está adicionando um intermediário ao sistema.

O laboratório de IA apoiado pela Microsoft enfatizou seu papel como pioneiro no uso do robots.txt, um conjunto de códigos que impede a coleta automatizada de dados da web, e disse que seus rastreadores respeitam as preferências do editor.

“Rastreadores de IA são normalmente vistos como mais invasivos e seletivos no que diz respeito aos dados que consomem. Eles foram acusados ​​de sobrecarregar sites e impactar significativamente a experiência do usuário”, disse Matthew Holman, sócio do escritório de advocacia britânico Cripps, à CNBC.

“Se for eficaz, o desenvolvimento prejudicará a capacidade dos chatbots de IA de coletar dados para fins de treinamento e pesquisa”, acrescentou. “Isso provavelmente terá um impacto de curto prazo no treinamento de modelos de IA e poderá, a longo prazo, afetar a viabilidade dos modelos.”

📌 ONDE ASSISTIR AO MAIOR CANAL DE NEGÓCIOS DO MUNDO NO BRASIL:

🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais

🔷 TV SINAL ABERTO: parabólicas canal 562

🔷 ONLINE: www.timesbrasil.com.br | YouTube

🔷 FAST Channels: Samsung TV Plus, LG Channels, TCL Channels, Pluto TV, Roku, Soul TV, Zapping | Novos Streamings

Siga o Times Brasil - Licenciado Exclusivo CNBC no

Este conteúdo foi fornecido pela CNBC Internacional e a responsabilidade exclusiva pela tradução para o português é do Times Brasil.

MAIS EM Empresas & Negócios