No entanto, esse projeto fundamental da entidade criada em São Francisco, nos EUA, enfrenta uma crise existencial. E a última ameaça vem justamente de quem mais precisa do arquivo — os veículos de imprensa.
Um número cada vez maior de empresas de comunicação vem negando o acesso do Internet Archive aos seus conteúdos.
Segundo uma pesquisa da Nieman Foundation for Journalism, da Universidade de Harvard, pelo menos 241 portais de notícias de nove países já bloquearam o acesso da Wayback Machine. Entre eles estão o britânico The Guardian, o americano New York Times, o francês Le Monde e o USA Today, maior conglomerado jornalístico dos Estados Unidos.
Veja os vídeos em alta do g1

Veja os vídeos que estão em alta no g1
Abrindo mão de uma importante ferramenta
O próprio USA Today publicou recentemente uma reportagem mostrando como a polícia de imigração americana, o ICE, havia ocultado informações na web sobre sua política de detenção. Para a apuração, o jornal utilizou conteúdos da Wayback Machine do archive.org, contradizendo a própria política da empresa, que agora bloqueia o acesso da plataforma a seus artigos.
O motivo pelo qual os veículos de comunicação estão barrando o acesso à ferramenta que eles mesmos utilizam é simples. Os jornais temem que empresas de inteligência artificial, como OpenAI ou Google, acessem os conteúdos jornalísticos arquivados na plataforma para treinar seus modelos de linguagem — sem autorização e sem pagamento.
Milhares de consultas por segundo com robôs
De fato, dados mostram que, no site archive.org, inúmeros robôs são usados para buscar conteúdos jornalísticos e utilizá-los no treinamento de modelos de IA — obtendo, assim, exatamente as informações que lhes são negadas.
O diretor do Wayback Machine, Mark Graham, afirmou à revista Wired que algumas empresas chegaram a acessar os arquivos com dezenas de milhares de solicitações por segundo, a ponto de sobrecarregar temporariamente os servidores.
Era algo que o archive.org não esperava. A organização sem fins lucrativos se apresenta como uma entidade comprometida com a internet aberta.
Isso também exclui a possibilidade de bloquear robôs e rastreadores — o que levou às sanções impostas por grandes editoras e empresas de mídia.
A Electronic Frontier Foundation (EFF), organização de direitos humanos especializada em questões digitais, compara a atitude dos veículos de imprensa a uma situação em que "um jornal proibisse bibliotecas de manter cópias de seu periódico".
A história da internet pode se perder para sempre
Desde então, mais de 100 jornalistas assinaram uma petição em apoio ao Internet Archive. Em carta aberta, eles afirmam:
Mark Graham, do New York Times, afirmou também à Wired que está em conversas com as empresas de jornalismo para reaver o acesso. O desfecho ainda é incerto.
"Não há dúvida de que o bloqueio crescente de grande parte da internet pública prejudica a capacidade da sociedade de compreender o que está acontecendo em nosso mundo", confessou Graham.
Fragmentar a internet é inevitável? — Foto: Getty Images
Arquivo como infraestrutura pública
Repórter especializado em mídia e fundador do socialmedia watchblog.de, Martin Fehrensen vê no archive.org o único registro funcional da web aberta. Caso a plataforma não consiga mais cumprir essa função, isso teria consequências graves, diz ele à DW.
Segundo Fehrensen, há duas maneiras de se resolver esse conflito. "Precisamos de um diálogo com os editores, com uma separação técnica clara entre o arquivamento e o treinamento de IA, pois esse é o verdadeiro conflito, não o arquivo em si", explica o jornalista.
A médio prazo, na opinião dele, deve ser criado um status jurídico especial para os arquivos da web. E, a longo prazo, o arquivamento da internet deve ser tratado como infraestrutura pública, não como um projeto isolado de uma ONG em São Francisco, acrescenta.
Um conflito dramático – entre vários
Não é a primeira vez que o Internet Archive luta para continuar existindo. Em setembro de 2024, um ataque hacker ao site resultou no roubo de 31 milhões de contas de usuário. Foi um duro golpe, mas a organização conseguiu se recuperar.
No mesmo ano, o Archive perdeu um processo de direitos autorais em um tribunal de apelação dos EUA: as editoras Hachette, Penguin Random House, HarperCollins e Wiley entraram com uma ação contra o programa gratuito de empréstimo de e-books que o Archive havia lançado durante a pandemia de Covid-19, e obtiveram sucesso. Mais de 500 mil livros tiveram que ser retirados da plataforma. Mas o archive.org ainda enfrenta pedidos de indenização na casa dos milhões.
Em comparação com essas derrotas, a ameaça atual representada pelos bloqueios da mídia é estruturalmente mais grave, pois não pode ser sanada por uma decisão judicial ou uma atualização. Ela é o resultado de inúmeras decisões corporativas que, em conjunto, minam a essência do Wayback Machine: a documentação completa da internet pública.

German (DE)
English (US)
Spanish (ES)
French (FR)
Hindi (IN)
Italian (IT)
Portuguese (BR)
Russian (RU)
7 horas atrás
3
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2024/b/l/u15Uw6TDupxn1iNEaRcA/captura-de-tela-2024-03-31-191032.png)


/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/9/Z/WMvCRxSBy8g5xZ8p7o9A/captura-de-tela-2025-04-09-222450.png)

:strip_icc()/i.s3.glbimg.com/v1/AUTH_59edd422c0c84a879bd37670ae4f538a/internal_photos/bs/2023/l/g/UvNZinRh2puy1SCdeg8w/cb1b14f2-970b-4f5c-a175-75a6c34ef729.jpg)

:strip_icc()/i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2024/o/u/v2hqAIQhAxupABJOskKg/1-captura-de-tela-2024-07-19-185812-39009722.png)








Comentários
Aproveite ao máximo as notícias fazendo login
Entrar Registro