Reddit bloqueia robôs do Internet Archive por uso indevido da Wayback Machine em coleta de dados para IA
O Reddit proibiu o acesso de robôs do Internet Archive aos seus fóruns, alegando que empresas de inteligência artificial (IA) utilizam a Wayback Machine para extrair dados da plataforma sem autorização.
Com a nova restrição, os bots poderão arquivar apenas a página inicial do site, ficando impedidos de acessar posts, comentários ou perfis de usuários.
A decisão acompanha movimentos de outras plataformas, como Cloudflare e Wikipédia, que também vêm adotando medidas para conter a raspagem de conteúdo feita por robôs ligados a projetos de IA.
Segundo o Reddit, a prática viola políticas internas e compromete a privacidade dos usuários.
“O Internet Archive é um serviço importante para a web aberta, mas temos conhecimento de que, em alguns casos, empresas de IA utilizam a Wayback Machine para raspar dados, infringindo as políticas de várias plataformas, incluindo a nossa”, afirmou a empresa ao site The Verge.
“Enquanto não houver garantias de que essas empresas respeitam as normas — como proteção à privacidade e remoção de conteúdos deletados —, vamos limitar o acesso delas ao Reddit para proteger os redditors”, completou o porta-voz.
Com o bloqueio em vigor, o Internet Archive só poderá registrar a página inicial do Reddit em suas versões arquivadas.
Isso significa que, na prática, só será possível consultar quais publicações estavam em destaque em determinado dia, mas não acessar o conteúdo completo dos posts ou comentários.
Mark Graham, diretor da Wayback Machine, destacou o relacionamento antigo com o Reddit e afirmou que as conversas para resolver o impasse continuam.
Reddit restringe APIs e fecha acordos de licenciamento para lidar com IA
Nos últimos anos, o Reddit tem sido protagonista em debates sobre o uso da inteligência artificial na web.
Em 2023, a plataforma limitou o acesso às suas APIs, justificando que estavam sendo utilizadas para raspagem automática de conteúdos, o que afetou o funcionamento de aplicativos independentes e gerou protestos da comunidade.
Em paralelo, o Reddit firmou acordos de licenciamento com gigantes como Google e OpenAI, que passaram a pagar pelo direito de usar o conteúdo da rede no treinamento de seus modelos de IA.
Por outro lado, abriu processo contra a Anthropic por coleta não autorizada de informações dos fóruns.
O enfrentamento aos robôs de IA se tornou um desafio global.
A Cloudflare, prestadora de serviços de otimização para sites, bloqueia por padrão bots de IA que tentam rastrear conteúdo e também processou a Perplexity por desrespeitar o protocolo robots.txt.
A Wikipédia, por sua vez, avalia medidas semelhantes para conter a raspagem de dados, já que o consumo excessivo causa lentidão e eleva os custos da infraestrutura.
Esses movimentos refletem a crescente preocupação com o impacto da inteligência artificial na privacidade, no controle de dados e na sustentabilidade das plataformas online.
Publicidade
Mantenha seus dados longe de hackers e ameaças digitais com a NordVPN, uma das mais rápidas e seguras do mundo. Com tecnologia de criptografia avançada, você protege até 10 dispositivos e ainda conta com recursos poderosos como bloqueio de malware, monitoramento da dark web e backup criptografado. Aproveite até 70% de desconto e experimente com garantia de reembolso de 30 dias. Segurança digital nunca foi tão fácil e eficiente. Saiba mais...