Se un albero cade in una foresta, fa davvero un suono? E se un sito web cambia dall'oggi al domani, la sua precedente homepage è mai esistita davvero? Perché gran parte del nostro mondo è sempre più digitale - ed effimero - non è solo una questione filosofica, è anche una semplice questione di storia. Ecco perché la Wayback Machine, che presenta istantanee di siti Web man mano che invecchiano e cambiano, è uno scorcio così affascinante negli angoli polverosi del web.
La Wayback Machine è un enorme archivio digitale pensato per preservare pagine web che altrimenti andrebbero perse definitivamente nel tempo. Senza questo ammasso di dati, ogni volta che una pagina veniva aggiornata o cancellata, sarebbe semplicemente svanita, come se non fosse mai stata lì.
L'aspettativa di vita media di una pagina web è di circa 100 giorni , ha osservato Mark Graham, direttore di Wayback Machine, in un articolo sull'imprenditore del 2016. Ci sono una moltitudine di ragioni per cui queste pagine web scompaiono. I creatori di siti passano ad altri progetti. Le società di web hosting falliscono. O forse la pagina viene spostata o sostituita con nuovi dati e contenuti.
Come è stata avviata la Wayback Machine
The Wayback Machine nasce da un'idea di Brewster Kahle e Bruce Gilliat, che hanno anche fondato l' Internet Archive , una biblioteca digitale di siti web, libri, registrazioni audio e video e programmi software. Entrambi i progetti sono organizzazioni non profit con sede a San Francisco. The Wayback Machine è un progetto di Internet Archive. (Kahle e Gilliat hanno anche creato Alexa Internet che analizza i modelli di traffico web ed è stato venduto ad Amazon.)
"Loro [Kahle e Gilliat] avevano iniziato ad archiviare le pagine web nel 1996 e nel 2001 hanno lanciato la Wayback Machine per supportare la scoperta e la riproduzione di quelle risorse web archiviate", afferma Graham in una recente intervista via e-mail. "E, sì, il nome è stato ispirato dalla serie di cartoni animati degli anni '60" The Rocky and Bullwinkle Show ". Nel cartone animato la macchina WABAC (nota la differenza di ortografia) era un dispositivo di trama utilizzato per trasportare i personaggi Mr. Peabody e Sherman indietro nel tempo per visitare eventi importanti della storia umana ".
In un mondo in cui ci sono più di 1,7 miliardi di siti web, con il numero che aumenta vertiginosamente di giorno in giorno , come si può sperare di catalogare così tante pagine web? La Wayback Machine utilizza quelli che vengono chiamati "crawler", un tipo di software che si muove automaticamente attraverso il web, scattando istantanee di miliardi di siti mentre procede. Parte del processo è automatizzato, ma molte delle richieste sono generate manualmente da una rete di bibliotecari, che danno la priorità a determinati tipi di siti che ritengono importanti da preservare per i posteri e per le generazioni future.
I crawler non acquisiscono ogni iterazione dei siti. La frequenza delle istantanee varia in base all'importanza del sito: siti molto significativi potrebbero essere registrati ogni poche ore. Altri potrebbero essere registrati a distanza di settimane o mesi. La maggior parte non è affatto registrata (quindi non preoccuparti, quell'imbarazzante sito di fan che hai creato al liceo è probabilmente andato da tempo). Wayback Machine mira a catturare istantanee di contenuti importanti, ad esempio i titoli delle ultime notizie creati dalle principali società di media.
Inoltre, non ricrea necessariamente l'intero sito e non conserva i dati in un modo in cui lo sperimenteresti con il tuo browser. Può acquisire solo poche immagini di poche pagine e non conservare il contenuto collegato ad altri siti esterni al dominio.
Utilizzo della Wayback Machine
Probabilmente hai avuto l'esperienza di fare clic su un collegamento in una pagina web e ottenere una notazione "404" o "pagina non trovata". Ora ti stai chiedendo cosa c'era nella pagina originariamente. È qui che la Wayback Machine può aiutarti.
Per utilizzare Wayback Machine , vai su https://archive.org/web/. Digita l'URL del sito che desideri esaminare nella barra di ricerca "Sfoglia cronologia". Useremo il nostro sito Web preferito https://www.howstuffworks.com/ per il nostro esempio. Nei risultati, vedrai un grafico a barre cronologico che mostra quante volte il sito è stato sottoposto a scansione (e salvato) in un dato anno.
Fai clic sull'anno e sotto, vedrai un calendario di 12 mesi con varie date evidenziate. I punti salienti blu indicano che il sito è stato salvato correttamente; rosso significa che non lo era. Fare clic su una delle date evidenziate e verranno visualizzate le istantanee del sito. Fai clic su una di quelle istantanee e, proprio così, sei tornato indietro nel tempo a quella versione precedente del sito.
Se vuoi assicurarti che un determinato sito sia registrato nell'archivio, puoi farlo manualmente. Utilizza l'opzione Salva pagina ora per salvare una pagina specifica una volta, ma renditi conto che così facendo si salva solo quella pagina (non un intero sito web) e non si garantisce che il sito verrà sottoposto a scansione in futuro.
Inoltre, se i proprietari di contenuti desiderano che il loro materiale venga escluso dalla Wayback Machine, possono inviare una richiesta inviando un'e-mail a [email protected].
Puoi anche cercare libri, video, registrazioni audio e programmi software facendo clic sulle icone nella parte superiore della home page di Wayback Machine, accanto alle parole "Internet Archive". Questi possono essere scaricati in modo permanente o presi in prestito per un periodo, a seconda dell'articolo. Sono disponibili anche funzioni di ricerca avanzata .
Il futuro della Wayback Machine
Graham dice che la cosa più sorprendente della Wayback Machine è che esiste e quanta parte del web pubblico è in grado di preservare, dato che ha un piccolo team e budget. (Usano anche volontari .)
"Con un maggiore supporto possiamo fare un lavoro [ancora] migliore nel supportare una parte maggiore del Web pubblico", afferma. "I finanziamenti per Internet Archive provengono da una combinazione di 'reddito guadagnato' dal nostro servizio di archiviazione web basato su abbonamento, Archive-It.org , dai principali donatori e fondazioni, nonché dai contributi di oltre 100.000 donatori individuali. Ci piace essere in grado di offrire i nostri servizi e non pubblicare annunci sulle nostre pagine web ".
È sicuro che la Wayback Machine diventerà ancora più importante in futuro.
"Con l'evolversi della natura del modo in cui le persone comunicano e condividono le informazioni, anche noi dovremo costruire tecnologie, processi e partnership per continuare a fare il miglior lavoro possibile per preservare la maggior parte possibile di queste informazioni pubbliche", afferma. "Tutto a sostegno della missione della Wayback Machine di 'Contribuire a rendere il web più utile e affidabile' e, in particolare, aiutare a sostenere giornalisti, attivisti, accademici, storie, ricercatori e il pubblico in generale".
Nota del redattore: il 13 ° paragrafo di questo articolo è stato aggiornato su richiesta dello staff di Wayback Machine.
ORA CHE È INTERESSANTE
Mark Graham afferma che più di 11 milioni di pagine web a cui si fa riferimento negli articoli di Wikipedia sono andate male nel corso degli anni (in altre parole, ora restituiscono un 404 o "Pagina non trovata"). Poiché erano stati archiviati nella Wayback Machine, i tecnici erano in grado di modificare quelle pagine di Wikipedia, quindi i riferimenti ora puntano a versioni archiviate di quegli URL defunti.