24.6 C
Uberlândia
quarta-feira, abril 29, 2026

Wayback Machine sob pressão: veículos de imprensa bloqueiam acesso e põem em risco preservação da web

Arquivo histórico da internet enfrenta bloqueios de grandes veículos

Há três décadas o Internet Archive, organização sediada em São Francisco, mantém o acervo conhecido como Wayback Machine, que reúne mais de um bilhão de sites e funciona como referência para jornalistas, pesquisadores, historiadores e operadores do Direito que precisam recuperar páginas alteradas ou removidas. Nos últimos meses, porém, a plataforma tem sido alvo de restrições impostas por um número crescente de empresas de mídia.

Uma investigação da Nieman Foundation for Journalism, da Universidade de Harvard, identificou que pelo menos 241 portais de notícias em nove países já aplicaram bloqueios que impedem a Wayback Machine de arquivar ou acessar seus conteúdos. Entre os veículos que tomaram essa medida estão o britânico The Guardian, o americano New York Times, o francês Le Monde e o conglomerado USA Today.

O receio das editoras, segundo fontes ouvidas pela reportagem, é que corporações de inteligência artificial, como OpenAI e Google, utilizem as cópias armazenadas pelo Internet Archive para treinar modelos de linguagem sem autorização dos jornais e sem pagamento por direitos autorais. Em declaração citada, o porta-voz do New York Times, Graham James, afirmou que os conteúdos do jornal no Internet Archive estão sendo aproveitados por empresas de IA em concorrência direta com o próprio jornal.

Paradoxalmente, o USA Today usou a Wayback Machine em uma investigação recente que revelou tentativas do serviço de imigração americano (ICE) de ocultar informações públicas sobre sua política de detenção, apesar de a publicação agora impedir o acesso da plataforma aos seus arquivos.

Dados do próprio Internet Archive mostram que robôs têm buscado em larga escala conteúdos jornalísticos no site; segundo o diretor do Wayback Machine, Mark Graham, algumas empresas chegaram a efetuar dezenas de milhares de solicitações por segundo, ocasionando sobrecarga temporária nos servidores. A organização sem fins lucrativos afirma oferecer acesso público ao acervo com objetivo semelhante ao de bibliotecas tradicionais, mas admite que retirar o rastreamento automático de robôs não é compatível com sua missão atual.

A Electronic Frontier Foundation (EFF) comparou a atitude de jornais que barram o Internet Archive a uma situação em que um periódico impedisse bibliotecas de manter exemplares. Em resposta às restrições, mais de 100 jornalistas assinaram uma petição em defesa do Internet Archive, alertando que a perda de páginas online — por links quebrados, fusões ou cortes — torna a Wayback Machine uma ferramenta essencial para recuperar registros que, de outra forma, seriam irrecuperáveis.

Especialistas em mídia também manifestaram preocupação. O repórter Martin Fehrensen, fundador do socialmedia watchblog.de, disse que o archive.org representa o registro funcional da web aberta e que a impossibilidade de manter esse papel teria impactos sérios: referências na Wikipedia poderiam desaparecer, pesquisas sobre políticas de moderação das plataformas ficariam mais difíceis e evidências digitais com valor probatório poderiam ser perdidas. Fehrensen propõe diálogo técnico entre editores e arquivistas para separar o processo de armazenamento do uso desses arquivos no treinamento de IA, além de discutir um status jurídico específico e tratar o arquivamento da internet como infraestrutura pública.

O Internet Archive já enfrentou outros desafios: em setembro de 2024, um ataque cibernético resultou no roubo de 31 milhões de contas; no mesmo ano, editoras como Hachette, Penguin Random House, HarperCollins e Wiley conseguiram na Justiça a retirada de mais de 500 mil livros do serviço de empréstimo digital do archive.org. A organização ainda responde a pedidos de indenização na casa dos milhões.

Analistas dizem que, ao contrário de litígios passíveis de solução judicial, o conjunto de bloqueios adotados por empresas de mídia representa uma ameaça estrutural à capacidade do Wayback Machine de documentar a internet pública.

Fonte: G1

Evaldo Ribeiro
Evaldo Ribeirohttp://portalemdestaque.com.br
Evaldo Ribeiro é produtor de conteúdo digital e responsável pelo portal Reporter Marechal, atuando na criação, apuração e divulgação de conteúdos informativos de interesse público, com foco regional e relevância para a comunidade.
Últimas Notícias
Veja também