CNBC

CNBC“Inimigos silenciosos”: como startups de I.A. tentam resolver um dos maiores problemas do varejo de roupas

Allan Ravagnani AI-451

GitHub guarda o código do mundo e virou campo de batalha da inteligência artificial; entenda

Publicado 05/04/2026 • 10:00 | Atualizado há 5 horas

Foto de Allan Ravagnani

Allan Ravagnani

Redator

Allan Ravagnani é jornalista há 20 anos, duas vezes eleito entre os 50 jornalistas de Economia mais admirados do Brasil. Assina a coluna AI-451 e é repórter do Times Brasil | CNBC. Estudou Publicidade na ESPM e Jornalismo na Fapcom, fez pós-graduações em Macroeconomia, Finanças e Ciência Política.

KEY POINTS

  • GitHub reúne 100 milhões de programadores e é o maior repositório de código do mundo
  • Plataforma comprada pela Microsoft por US$ 7,5 bilhões fatura US$ 1 bilhão por ano
  • Copilot vai usar código de usuários para treinar IA a partir de abril (24), gerando revolta entre desenvolvedores
Corredor de servidores com iluminação azul dramática representando infraestrutura digital em larga escala - GitHub

Crédito: StockCake/Reprodução

Datacenters como o do GitHub armazenam o código que sustenta a internet, e agora querem usar esse código para treinar inteligência artificial

Há uma versão do futuro sendo escrita agora, sem cerimônia, sem discurso de lançamento e sem nenhum convite para a imprensa, numa tela preta cheia de letras brancas, por alguém que provavelmente não dormiu direito e está com fone de ouvido para não ter que falar com ninguém. O produto desse trabalho, o código-fonte, vai parar num lugar que governa quase tudo que você usa no dia a dia, do aplicativo do banco ao mapa que recalcula a rota quando você erra o caminho. Esse lugar se chama GitHub (link).

Antes de explicar o que é, convém desfazer uma confusão que persiste até em redações de tecnologia. GitHub e Git não são a mesma coisa. O Git é uma ferramenta criada em 2005 por Linus Torvalds, o mesmo finlandês que fez o Linux, que registra cada alteração num código ao longo do tempo, como um histórico inviolável. É a tecnologia. O GitHub é a plataforma web que pegou essa tecnologia, colocou numa interface amigável e convidou o mundo inteiro para colaborar. É como a diferença entre o motor e o carro.

Uma observação antes de continuar. O GitHub é citado em quase todos os textos de AI-451 até agora, e como a coluna ainda é nova, achei melhor não deixar o nome solto no ar sem uma explicação decente. Esta coluna é para os entusiastas ainda não tão iniciados. Quem já programa e vive no GitHub vai achar o texto básico, talvez até encontrar alguma imprecisão no caminho, e peço que me escrevam quando isso acontecer. Estou ainda calibrando o tom certo para falar de tecnologia com quem não é da área sem soar condescendente com quem é. É um equilíbrio difícil, e a única forma de acertar é errando em público.

Biblioteca pública do código humano

Lançado em abril de 2008 por quatro programadores em São Francisco, o GitHub funciona como uma biblioteca pública do código humano. Um programador cria um "repositório", pense numa pasta inteligente que guarda não só os arquivos, mas todo o histórico de quem mudou o quê, quando e por quê. Outros programadores de qualquer lugar do mundo podem ver, copiar, sugerir melhorias e propor alterações. O dono aceita ou rejeita. É colaboração em escala industrial, sem reunião, sem PowerPoint, sem aquele e-mail com vinte pessoas em cópia.

Os números hoje são de causar vertigem. A plataforma tem mais de 100 milhões de desenvolvedores cadastrados e mais de 420 milhões de repositórios. Em 2024, foram registradas mais de 5 bilhões de contribuições individuais em projetos de código aberto, projetos que qualquer pessoa pode ver, usar e melhorar, de graça. O sistema operacional que roda a maioria dos servidores do mundo está lá. O navegador Chrome está lá. O framework que provavelmente sustenta o site da sua empresa está lá.

Leia também: Anthropic tem seu próprio OpenClaw, se chama Conway e ela não queria que você soubesse ainda

Microsoft e os US$ 7,5 bilhões ao GitHub

Em junho de 2018, a Microsoft anunciou a compra do GitHub por US$ 7,5 bilhões e muita gente da comunidade de programadores entrou em pânico. A Microsoft tinha um histórico tortuoso com o movimento de código aberto, décadas de software fechado, patentes agressivas e a crença de que compartilhar código era coisa de idealista ingênuo. O medo era que a gigante de Redmond engolisse a plataforma, cobrasse pelo que era gratuito e afastasse a comunidade que fazia o GitHub funcionar.

Não foi isso que aconteceu. A receita anual, que girava entre US$ 200 e 300 milhões na época da aquisição, chegou a US$ 1 bilhão. O número de usuários saiu de 28 milhões para mais de 90 milhões. A Microsoft, sob o comando de Satya Nadella, foi suficientemente sábia para perceber que o nome da empresa nem aparece no rodapé do site do GitHub. Deixou a plataforma caminhar com os próprios pés.

IA nasce aqui

É aqui que a história fica interessante para quem acompanha a corrida da inteligência artificial. Todo modelo de IA começa como código. Os pesquisadores do Google, da Meta, da Anthropic, da OpenAI, todos publicam seus experimentos, frameworks e modelos no GitHub. Quando se lê sobre um "modelo open source", a primeira coisa que aparece é um link para um repositório no GitHub. A plataforma virou a vitrine e o almoxarifado da inteligência artificial global.

Nas colunas anteriores desta série, o GitHub apareceu nas bordas das histórias. O vazamento acidental do código-fonte do Claude Code, da Anthropic, foi detectado porque o material foi parar num repositório público no GitHub. O OpenClaw, o agente autônomo que explodiu em popularidade no início do ano, teve seu crescimento medido em "estrelas no GitHub", a forma como os desenvolvedores sinalizam admiração por um projeto.

Leia também: Inteligência artificial virou obsessão do Brasil corporativo; mas o país real não aparece em dado nenhum

Copilot escreve código e quer seu código de volta

Em 2021, o GitHub lançou o Copilot, uma ferramenta de inteligência artificial que funciona como um assistente de programação dentro do editor de código. O desenvolvedor começa a digitar e o Copilot sugere como terminar, linhas, funções inteiras, estruturas completas.

Segundo a própria empresa, a ferramenta aumenta a produtividade em até 55% e os programadores que a usam relatam 75% mais satisfação no trabalho. É o tipo de estatística que uma empresa divulga quando tem interesse direto no resultado, mas a adoção fala por si, pois o Copilot chegou a 15 milhões de usuários em 2025, quatro vezes mais do que no ano anterior.

O modelo usa GPT, Claude e Gemini para gerar as sugestões e foi treinado, inicialmente, com código público hospedado no próprio GitHub, o que gerou uma ação coletiva em 2022 alegando violação de licenças e direitos autorais. O processo segue nos tribunais.

Dados dos usuários, sem pedir licença

A polêmica mais recente é de agora. A partir de 24 de abril o GitHub vai usar as interações dos usuários com o Copilot para treinar seus modelos de inteligência artificial, e a configuração padrão é participar. Quem não quiser que seu código, suas perguntas e suas correções sirvam de matéria-prima para o aperfeiçoamento da IA precisa ir nas configurações de privacidade e desativar a opção manualmente.

A comunidade reagiu de forma irritada, desenvolvedores acusaram a empresa de usar o que chamam de "padrão obscuro", uma prática de design que leva o usuário ao comportamento que a empresa prefere sem que ele perceba. Uma pessoa num fórum de discussão resumiu o problema com precisão incômoda, dizendo que quando você usa o Copilot, não está somente recebendo sugestões, mas alimentando o sistema que vai competir com você amanhã.

A Microsoft tem o maior arquivo de código do planeta. Agora quer que esse arquivo seja também o cardápio de treinamento de sua inteligência artificial. É um negócio redondo, para ela.

Siga o Times Brasil - Licenciado Exclusivo CNBC no

MAIS EM AI-451