Siga o Times Brasil - Licenciado Exclusivo CNBC no
GitHub guarda o código do mundo e virou campo de batalha da inteligência artificial; entenda
Publicado 05/04/2026 • 10:00 | Atualizado há 3 horas
“Inimigos silenciosos”: como startups de I.A. tentam resolver um dos maiores problemas do varejo de roupas
Polymarket remove apostas sobre resgate de aviadores dos EUA após críticas
Payroll: EUA criam 178 mil vagas em março e superam projeção do mercado; desemprego ficou em 4,3%
Trump ameaça destruir pontes e usinas do Irã; Direito Internacional alerta para crimes de guerra
Tiger Woods ligou para Trump após acidente por dirigir embriagado
Publicado 05/04/2026 • 10:00 | Atualizado há 3 horas
KEY POINTS
Crédito: StockCake/Reprodução
Datacenters como o do GitHub armazenam o código que sustenta a internet, e agora querem usar esse código para treinar inteligência artificial
Há uma versão do futuro sendo escrita agora, sem cerimônia, sem discurso de lançamento e sem nenhum convite para a imprensa, numa tela preta cheia de letras brancas, por alguém que provavelmente não dormiu direito e está com fone de ouvido para não ter que falar com ninguém. O produto desse trabalho, o código-fonte, vai parar num lugar que governa quase tudo que você usa no dia a dia, do aplicativo do banco ao mapa que recalcula a rota quando você erra o caminho. Esse lugar se chama GitHub (link).
Antes de explicar o que é, convém desfazer uma confusão que persiste até em redações de tecnologia. GitHub e Git não são a mesma coisa. O Git é uma ferramenta criada em 2005 por Linus Torvalds, o mesmo finlandês que fez o Linux, que registra cada alteração num código ao longo do tempo, como um histórico inviolável. É a tecnologia. O GitHub é a plataforma web que pegou essa tecnologia, colocou numa interface amigável e convidou o mundo inteiro para colaborar. É como a diferença entre o motor e o carro.
Uma observação antes de continuar. O GitHub é citado em quase todos os textos de AI-451 até agora, e como a coluna ainda é nova, achei melhor não deixar o nome solto no ar sem uma explicação decente. Esta coluna é para os entusiastas ainda não tão iniciados. Quem já programa e vive no GitHub vai achar o texto básico, talvez até encontrar alguma imprecisão no caminho, e peço que me escrevam quando isso acontecer. Estou ainda calibrando o tom certo para falar de tecnologia com quem não é da área sem soar condescendente com quem é. É um equilíbrio difícil, e a única forma de acertar é errando em público.
Lançado em abril de 2008 por quatro programadores em São Francisco, o GitHub funciona como uma biblioteca pública do código humano. Um programador cria um "repositório", pense numa pasta inteligente que guarda não só os arquivos, mas todo o histórico de quem mudou o quê, quando e por quê. Outros programadores de qualquer lugar do mundo podem ver, copiar, sugerir melhorias e propor alterações. O dono aceita ou rejeita. É colaboração em escala industrial, sem reunião, sem PowerPoint, sem aquele e-mail com vinte pessoas em cópia.
Os números hoje são de causar vertigem. A plataforma tem mais de 100 milhões de desenvolvedores cadastrados e mais de 420 milhões de repositórios. Em 2024, foram registradas mais de 5 bilhões de contribuições individuais em projetos de código aberto, projetos que qualquer pessoa pode ver, usar e melhorar, de graça. O sistema operacional que roda a maioria dos servidores do mundo está lá. O navegador Chrome está lá. O framework que provavelmente sustenta o site da sua empresa está lá.
Leia também: Anthropic tem seu próprio OpenClaw, se chama Conway e ela não queria que você soubesse ainda
Em junho de 2018, a Microsoft anunciou a compra do GitHub por US$ 7,5 bilhões e muita gente da comunidade de programadores entrou em pânico. A Microsoft tinha um histórico tortuoso com o movimento de código aberto, décadas de software fechado, patentes agressivas e a crença de que compartilhar código era coisa de idealista ingênuo. O medo era que a gigante de Redmond engolisse a plataforma, cobrasse pelo que era gratuito e afastasse a comunidade que fazia o GitHub funcionar.
Não foi isso que aconteceu. A receita anual, que girava entre US$ 200 e 300 milhões na época da aquisição, chegou a US$ 1 bilhão. O número de usuários saiu de 28 milhões para mais de 90 milhões. A Microsoft, sob o comando de Satya Nadella, foi suficientemente sábia para perceber que o nome da empresa nem aparece no rodapé do site do GitHub. Deixou a plataforma caminhar com os próprios pés.
É aqui que a história fica interessante para quem acompanha a corrida da inteligência artificial. Todo modelo de IA começa como código. Os pesquisadores do Google, da Meta, da Anthropic, da OpenAI, todos publicam seus experimentos, frameworks e modelos no GitHub. Quando se lê sobre um "modelo open source", a primeira coisa que aparece é um link para um repositório no GitHub. A plataforma virou a vitrine e o almoxarifado da inteligência artificial global.
Nas colunas anteriores desta série, o GitHub apareceu nas bordas das histórias. O vazamento acidental do código-fonte do Claude Code, da Anthropic, foi detectado porque o material foi parar num repositório público no GitHub. O OpenClaw, o agente autônomo que explodiu em popularidade no início do ano, teve seu crescimento medido em "estrelas no GitHub", a forma como os desenvolvedores sinalizam admiração por um projeto.
Leia também: Inteligência artificial virou obsessão do Brasil corporativo; mas o país real não aparece em dado nenhum
Em 2021, o GitHub lançou o Copilot, uma ferramenta de inteligência artificial que funciona como um assistente de programação dentro do editor de código. O desenvolvedor começa a digitar e o Copilot sugere como terminar, linhas, funções inteiras, estruturas completas.
Segundo a própria empresa, a ferramenta aumenta a produtividade em até 55% e os programadores que a usam relatam 75% mais satisfação no trabalho. É o tipo de estatística que uma empresa divulga quando tem interesse direto no resultado, mas a adoção fala por si, pois o Copilot chegou a 15 milhões de usuários em 2025, quatro vezes mais do que no ano anterior.
O modelo usa GPT, Claude e Gemini para gerar as sugestões e foi treinado, inicialmente, com código público hospedado no próprio GitHub, o que gerou uma ação coletiva em 2022 alegando violação de licenças e direitos autorais. O processo segue nos tribunais.
A polêmica mais recente é de agora. A partir de 24 de abril o GitHub vai usar as interações dos usuários com o Copilot para treinar seus modelos de inteligência artificial, e a configuração padrão é participar. Quem não quiser que seu código, suas perguntas e suas correções sirvam de matéria-prima para o aperfeiçoamento da IA precisa ir nas configurações de privacidade e desativar a opção manualmente.
A comunidade reagiu de forma irritada, desenvolvedores acusaram a empresa de usar o que chamam de "padrão obscuro", uma prática de design que leva o usuário ao comportamento que a empresa prefere sem que ele perceba. Uma pessoa num fórum de discussão resumiu o problema com precisão incômoda, dizendo que quando você usa o Copilot, não está somente recebendo sugestões, mas alimentando o sistema que vai competir com você amanhã.
A Microsoft tem o maior arquivo de código do planeta. Agora quer que esse arquivo seja também o cardápio de treinamento de sua inteligência artificial. É um negócio redondo, para ela.
Mais lidas
1
Com lucro em queda e caixa negativo, Cimed pega empréstimo para pagar dividendos
2
Consultor vê sinais de alerta na Cimed e diz que conta não fecha: ‘Onde tem fumaça, tem fogo’
3
Mar Cáspio: o corredor logístico que abriga bilhões em reservas de petróleo e é palco de três guerras ao mesmo tempo
4
João Fonseca estreia contra canadense no Masters 1000 de Monte Carlo, na França
5
Anthropic vazou código-fonte do Claude Code por erro humano, diz empresa