Reddit bloqueia bots do Internet Archive
16 de Setembro de 2025

Reddit bloqueia robôs do Internet Archive por uso indevido da Wayback Machine em coleta de dados para IA

O Reddit proibiu o acesso de robôs do Internet Archive aos seus fóruns, alegando que empresas de inteligência artificial (IA) utilizam a Wayback Machine para extrair dados da plataforma sem autorização.

Com a nova restrição, os bots poderão arquivar apenas a página inicial do site, ficando impedidos de acessar posts, comentários ou perfis de usuários.

A decisão acompanha movimentos de outras plataformas, como Cloudflare e Wikipédia, que também vêm adotando medidas para conter a raspagem de conteúdo feita por robôs ligados a projetos de IA.

Segundo o Reddit, a prática viola políticas internas e compromete a privacidade dos usuários.

“O Internet Archive é um serviço importante para a web aberta, mas temos conhecimento de que, em alguns casos, empresas de IA utilizam a Wayback Machine para raspar dados, infringindo as políticas de várias plataformas, incluindo a nossa”, afirmou a empresa ao site The Verge.

“Enquanto não houver garantias de que essas empresas respeitam as normas — como proteção à privacidade e remoção de conteúdos deletados —, vamos limitar o acesso delas ao Reddit para proteger os redditors”, completou o porta-voz.

Com o bloqueio em vigor, o Internet Archive só poderá registrar a página inicial do Reddit em suas versões arquivadas.

Isso significa que, na prática, só será possível consultar quais publicações estavam em destaque em determinado dia, mas não acessar o conteúdo completo dos posts ou comentários.

Mark Graham, diretor da Wayback Machine, destacou o relacionamento antigo com o Reddit e afirmou que as conversas para resolver o impasse continuam.

Reddit restringe APIs e fecha acordos de licenciamento para lidar com IA

Nos últimos anos, o Reddit tem sido protagonista em debates sobre o uso da inteligência artificial na web.

Em 2023, a plataforma limitou o acesso às suas APIs, justificando que estavam sendo utilizadas para raspagem automática de conteúdos, o que afetou o funcionamento de aplicativos independentes e gerou protestos da comunidade.

Em paralelo, o Reddit firmou acordos de licenciamento com gigantes como Google e OpenAI, que passaram a pagar pelo direito de usar o conteúdo da rede no treinamento de seus modelos de IA.

Por outro lado, abriu processo contra a Anthropic por coleta não autorizada de informações dos fóruns.

O enfrentamento aos robôs de IA se tornou um desafio global.

A Cloudflare, prestadora de serviços de otimização para sites, bloqueia por padrão bots de IA que tentam rastrear conteúdo e também processou a Perplexity por desrespeitar o protocolo robots.txt.

A Wikipédia, por sua vez, avalia medidas semelhantes para conter a raspagem de dados, já que o consumo excessivo causa lentidão e eleva os custos da infraestrutura.

Esses movimentos refletem a crescente preocupação com o impacto da inteligência artificial na privacidade, no controle de dados e na sustentabilidade das plataformas online.

Publicidade

Proteja sua navegação com a VPN nº 1

Mantenha seus dados longe de hackers e ameaças digitais com a NordVPN, uma das mais rápidas e seguras do mundo. Com tecnologia de criptografia avançada, você protege até 10 dispositivos e ainda conta com recursos poderosos como bloqueio de malware, monitoramento da dark web e backup criptografado. Aproveite até 70% de desconto e experimente com garantia de reembolso de 30 dias. Segurança digital nunca foi tão fácil e eficiente. Saiba mais...