Se uma árvore cai na floresta, isso realmente faz algum som? E se um site muda durante a noite, sua página inicial anterior realmente existiu? Como grande parte do nosso mundo está cada vez mais digital - e efêmero - não é apenas uma questão filosófica, é também uma simples questão de história. É por isso que a Wayback Machine, que apresenta instantâneos de sites à medida que envelhecem e mudam, é um vislumbre tão fascinante dos cantos empoeirados da web.
A Wayback Machine é um enorme arquivo digital destinado a preservar páginas da web que, de outra forma, seriam perdidas para sempre. Sem esse acúmulo de dados, toda vez que uma página era atualizada ou excluída, ela simplesmente desaparecia, como se nunca tivesse existido.
A expectativa de vida média de uma página da web é de cerca de 100 dias , observou Mark Graham, diretor da Wayback Machine, em um artigo da Entrepreneur de 2016. Existem vários motivos pelos quais essas páginas da web desaparecem. Os criadores do site passam para outros projetos. Empresas de hospedagem na Web vão à falência. Ou talvez a página seja movida ou substituída por novos dados e conteúdo.
Como a máquina Wayback começou
The Wayback Machine é ideia de Brewster Kahle e Bruce Gilliat, que também fundaram o Internet Archive , uma biblioteca digital de sites, livros, gravações de áudio e vídeo e programas de software. Ambos os projetos são organizações sem fins lucrativos com sede em San Francisco. The Wayback Machine é um projeto do Internet Archive. (Kahle e Gilliat também criaram o Alexa Internet, que analisa os padrões de tráfego da web e foi vendido para a Amazon.)
"Eles [Kahle e Gilliat] começaram a arquivar páginas da web em 1996 e, em 2001, lançaram a Wayback Machine para oferecer suporte à descoberta e reprodução desses recursos da web arquivados", disse Graham em uma recente entrevista por e-mail. “E, sim, o nome foi inspirado na série de desenhos animados dos anos 1960 'The Rocky and Bullwinkle Show.' No desenho animado, a Máquina WABAC (observe a diferença de grafia) era um dispositivo de trama usado para transportar os personagens Sr. Peabody e Sherman de volta no tempo para visitar eventos importantes na história humana. "
Em um mundo onde existem mais de 1,7 bilhão de sites, com o número aumentando drasticamente a cada dia , como alguém pode esperar catalogar tantas páginas da web? A Wayback Machine usa os chamados "crawlers", um tipo de software que se move automaticamente pela web, tirando instantâneos de bilhões de sites à medida que avança. Parte do processo é automatizado, mas muitas das solicitações são geradas manualmente por uma rede de bibliotecários, que priorizam certos tipos de sites que consideram importantes preservar para a posteridade e para as gerações futuras.
Os rastreadores não capturam todas as iterações de sites. A frequência dos instantâneos difere de acordo com a importância do site - sites muito significativos podem ser registrados a cada poucas horas. Outros podem ser registrados com semanas ou meses de intervalo. A maioria não está logada (então não se preocupe, aquele site de fã embaraçoso que você fez no colégio provavelmente já não existe mais). Wayback Machine visa capturar instantâneos de conteúdo importante, por exemplo, as manchetes de notícias de última hora criadas por grandes empresas de mídia.
Além disso, ele não recria necessariamente todo o site e não preserva os dados de uma maneira que você experimentaria com seu navegador. Ele pode capturar apenas algumas imagens de algumas páginas e não preservar o conteúdo vinculado a outros sites fora do domínio.
Usando a Máquina Wayback
Você provavelmente já teve a experiência de clicar em um link em uma página da web e obter a notação "404" ou "página não encontrada". Agora você está se perguntando o que estava originalmente na página. É aí que a Wayback Machine pode ajudar.
Para usar a Wayback Machine , vá para https://archive.org/web/. Digite o URL do site que deseja investigar na barra de pesquisa "Histórico de navegação". Usaremos nosso site favorito https://www.howstuffworks.com/ como nosso exemplo. Nos resultados, você verá um gráfico de barras cronológico que mostra quantas vezes o site foi rastreado (e salvo) em um determinado ano.
Clique no ano e abaixo, você verá um calendário de 12 meses com várias datas em destaque. Os realces em azul significam que o site foi salvo corretamente; vermelho significa que não foi. Clique em uma das datas destacadas e os instantâneos do site serão exibidos. Clique em um desses instantâneos e - assim mesmo - você viajou de volta no tempo para aquela versão mais antiga do site.
Se quiser ter certeza de que um determinado site seja registrado no arquivo, você pode fazer isso manualmente. Use a opção Salvar página agora para salvar uma página específica uma vez - mas lembre-se de que isso salva apenas aquela página (não um site inteiro) e não garante que o site será rastreado no futuro.
E, se os proprietários de conteúdo quiserem que seu material seja excluído da Wayback Machine, eles podem enviar uma solicitação enviando um e-mail para [email protected].
Você também pode pesquisar livros, vídeos, gravações de áudio e programas de software clicando nos ícones na parte superior da página inicial do Wayback Machine, ao lado das palavras "Arquivo da Internet". Eles podem ser baixados permanentemente ou emprestados por um período, dependendo do item. Recursos de pesquisa avançada também estão disponíveis.
O Futuro da Máquina Wayback
Graham diz que o mais incrível sobre a Wayback Machine é que ela existe e quanto da web pública ela é capaz de preservar, já que tem uma equipe e um orçamento pequenos. (Eles também usam voluntários .)
“Com mais suporte, podemos fazer um trabalho [ainda] melhor de backup da web pública”, diz ele. "O financiamento para o Internet Archive vem de uma combinação de 'receita obtida' de nosso serviço de arquivamento da web baseado em assinatura, Archive-It.org , principais doadores e fundações, bem como contribuições de mais de 100.000 doadores individuais. Adoramos ser capaz de oferecer nossos serviços e não veicular anúncios em nossas páginas da web. "
Ele tem certeza de que a Wayback Machine se tornará ainda mais importante no futuro.
“À medida que a natureza de como as pessoas se comunicam e compartilham informações evolui, também precisamos construir tecnologias, processos e parcerias para continuar a fazer o melhor que podemos para preservar o máximo possível dessas informações públicas”, diz ele. "Tudo em apoio à missão da Wayback Machine de 'Ajudar a tornar a web mais útil e confiável' e, em particular, ajudar a apoiar jornalistas, ativistas, acadêmicos, histórias, pesquisadores e o público em geral."
Nota do Editor: O parágrafo 13 deste artigo foi atualizado a pedido da equipe da Wayback Machine.
AGORA ISSO É INTERESSANTE
Mark Graham diz que mais de 11 milhões de páginas da web referenciadas em artigos da Wikipedia se deterioraram ao longo dos anos (em outras palavras, elas agora retornam um 404 ou "Página não encontrada"). Por terem sido arquivados na Wayback Machine, os técnicos de lá foram capazes de editar essas páginas da Wikipedia, então as referências agora apontam para versões arquivadas dessas URLs extintas.