
Wenn ein Baum in einen Wald fällt, macht er dann wirklich ein Geräusch? Und wenn sich eine Website über Nacht ändert, gab es ihre vorherige Homepage überhaupt? Weil so viel von unserer Welt zunehmend digital - und kurzlebig - ist, ist es nicht nur eine philosophische Frage, sondern auch eine einfache Frage der Geschichte. Aus diesem Grund bietet die Wayback-Maschine, die Schnappschüsse von Websites enthält, wenn diese altern und sich ändern, einen faszinierenden Einblick in die staubigen Ecken des Webs.
Die Wayback-Maschine ist ein riesiges digitales Archiv, das Webseiten bewahren soll, die sonst für die Zeit dauerhaft verloren gehen würden. Ohne diesen Datenschatz würde eine Seite jedes Mal, wenn sie aktualisiert oder gelöscht wurde, einfach verschwinden, als wäre sie nie da.
Die durchschnittliche Lebenserwartung einer Webseite beträgt etwa 100 Tage , wie Mark Graham, Direktor der Wayback-Maschine, in einem Unternehmerartikel von 2016 feststellte. Es gibt eine Vielzahl von Gründen, warum diese Webseiten verschwinden. Site-Ersteller wechseln zu anderen Projekten. Webhosting-Unternehmen gehen bankrott. Oder die Seite wird verschoben oder durch neue Daten und Inhalte ersetzt.
Wie die Wayback-Maschine gestartet wurde
Die Wayback-Maschine ist eine Idee von Brewster Kahle und Bruce Gilliat, die auch das Internet Archive gegründet haben , eine digitale Bibliothek mit Websites, Büchern, Audio- und Videoaufzeichnungen und Softwareprogrammen. Beide Projekte sind gemeinnützige Organisationen mit Sitz in San Francisco. Die Wayback-Maschine ist ein Projekt des Internet-Archivs. (Kahle und Gilliat haben auch Alexa Internet erstellt, das Web-Traffic-Muster analysiert und an Amazon verkauft wurde.)
"Sie [Kahle und Gilliat] hatten 1996 mit der Archivierung von Webseiten begonnen und 2001 die Wayback-Maschine gestartet, um die Entdeckung und Wiedergabe dieser archivierten Webressourcen zu unterstützen", sagte Graham kürzlich in einem E-Mail-Interview. "Und ja, der Name wurde von der Zeichentrickserie 'The Rocky and Bullwinkle Show' aus den 1960er Jahren inspiriert. In dem Cartoon war die WABAC-Maschine (beachten Sie den Unterschied in der Rechtschreibung) ein Plotgerät, mit dem die Charaktere Mr. Peabody und Sherman in die Vergangenheit versetzt wurden, um wichtige Ereignisse in der Geschichte der Menschheit zu besuchen. "
Wie kann man in einer Welt mit mehr als 1,7 Milliarden Websites, deren Zahl von Tag zu Tag dramatisch steigt, hoffen, so viele Webseiten zu katalogisieren? Die Wayback-Maschine verwendet sogenannte "Crawler", eine Art Software, die sich automatisch durch das Web bewegt und dabei Schnappschüsse von Milliarden von Websites erstellt. Ein Teil des Prozesses ist automatisiert, aber viele der Anfragen werden manuell von einem Netzwerk von Bibliothekaren generiert, die bestimmte Arten von Websites priorisieren, die ihrer Meinung nach für die Nachwelt und zukünftige Generationen wichtig sind.
Die Crawler erfassen nicht jede Iteration von Websites. Die Häufigkeit von Schnappschüssen hängt von der Bedeutung der Site ab. Sehr wichtige Sites werden möglicherweise alle paar Stunden aufgezeichnet. Andere können im Abstand von Wochen oder Monaten protokolliert werden. Die meisten sind überhaupt nicht angemeldet (also keine Sorge, die peinliche Fan-Website, die Sie in der High School erstellt haben, ist wahrscheinlich schon lange nicht mehr vorhanden). Wayback Machine zielt darauf ab, Schnappschüsse wichtiger Inhalte zu erfassen , beispielsweise die Schlagzeilen, die von großen Medienunternehmen erstellt wurden.
Darüber hinaus wird nicht unbedingt die gesamte Site neu erstellt, und die Daten werden nicht so gespeichert, wie Sie es mit Ihrem Browser erleben würden. Möglicherweise werden nur einige Bilder von wenigen Seiten erfasst und keine Inhalte beibehalten, die mit anderen Websites außerhalb der Domain verknüpft sind.
Verwenden der Wayback-Maschine
Sie haben wahrscheinlich die Erfahrung gemacht, auf einen Link auf einer Webseite zu klicken und die Notation "404" oder "Seite nicht gefunden" zu erhalten. Jetzt fragen Sie sich, was ursprünglich auf der Seite war. Hier kann die Wayback-Maschine helfen.
Um die Wayback-Maschine zu verwenden , gehen Sie zu https://archive.org/web/. Geben Sie die URL der Site, die Sie untersuchen möchten, in die Suchleiste "Verlauf durchsuchen" ein. Wir werden unsere Lieblingswebsite https://www.howstuffworks.com/ für unser Beispiel verwenden. In den Ergebnissen sehen Sie ein chronologisches Balkendiagramm, das zeigt, wie oft die Site in einem bestimmten Jahr gecrawlt (und gespeichert) wurde.

Klicken Sie auf das Jahr und unten wird ein 12-Monats-Kalender mit verschiedenen hervorgehobenen Daten angezeigt. Blaue Markierungen bedeuten, dass die Site ordnungsgemäß gespeichert wurde. rot bedeutet, dass es nicht war. Klicken Sie auf eines der hervorgehobenen Daten. Die Schnappschüsse der Site werden angezeigt. Klicken Sie auf einen dieser Schnappschüsse und - einfach so - sind Sie in der Zeit zurück zu dieser älteren Version der Site gereist.
Wenn Sie sicherstellen möchten, dass eine bestimmte Site im Archiv aufgezeichnet wird, können Sie dies manuell tun. Verwenden Sie die Option "Seite jetzt speichern", um eine bestimmte Seite einmal zu speichern. Beachten Sie jedoch, dass dadurch nur diese eine Seite (nicht die gesamte Website) gespeichert wird und nicht garantiert wird, dass die Website in Zukunft gecrawlt wird.
Wenn Inhaltsinhaber möchten, dass ihr Material von der Wayback-Maschine ausgeschlossen wird, können sie eine Anfrage senden, indem sie eine E-Mail an [email protected] senden.
Sie können auch nach Büchern, Videos, Audioaufnahmen und Softwareprogrammen suchen, indem Sie auf die Symbole oben auf der Wayback Machine-Homepage neben den Worten "Internetarchiv" klicken. Diese können je nach Artikel dauerhaft heruntergeladen oder für einen bestimmten Zeitraum ausgeliehen werden. Erweiterte Suchfunktionen sind ebenfalls verfügbar.
Die Zukunft der Wayback-Maschine
Graham sagt, das Erstaunlichste an der Wayback-Maschine ist, dass sie überhaupt existiert und wie viel von dem öffentlichen Web sie erhalten kann, da sie ein kleines Team und ein kleines Budget hat. (Sie benutzen auch Freiwillige .)
"Mit mehr Unterstützung können wir das öffentliche Web [noch] besser sichern", sagt er. "Die Finanzierung des Internetarchivs erfolgt durch eine Kombination aus 'verdienten Einnahmen' aus unserem abonnementbasierten Web-Arching-Service Archive-It.org , wichtigen Spendern und Stiftungen sowie Beiträgen von mehr als 100.000 einzelnen Spendern. Wir lieben es zu sein in der Lage, unsere Dienste zu verschenken und keine Anzeigen auf unseren Webseiten zu schalten. "
Er ist sicher, dass die Wayback-Maschine in Zukunft noch wichtiger wird.
"Da sich auch die Art und Weise, wie Menschen kommunizieren und Informationen austauschen, weiterentwickelt, müssen wir Technologien, Prozesse und Partnerschaften aufbauen, um weiterhin die bestmögliche Arbeit zu leisten, um so viele dieser öffentlichen Informationen wie möglich zu erhalten", sagt er. "Alle unterstützen die Mission der Wayback Machine, das Internet nützlicher und zuverlässiger zu machen und insbesondere Journalisten, Aktivisten, Akademiker, Geschichtsschreiber, Forscher und die breite Öffentlichkeit zu unterstützen."
Anmerkung des Herausgebers: Der 13. Absatz dieses Artikels wurde auf Anfrage der Mitarbeiter von Wayback Machine aktualisiert.
JETZT IST DAS INTERESSANT
Mark Graham sagt, dass mehr als 11 Millionen Webseiten, auf die in Wikipedia-Artikeln verwiesen wird, im Laufe der Jahre schlecht geworden sind (mit anderen Worten, sie geben jetzt eine 404 oder "Seite nicht gefunden" zurück). Da sie in der Wayback-Maschine archiviert wurden, konnten die Techniker dort diese Wikipedia-Seiten bearbeiten, sodass die Verweise jetzt auf archivierte Versionen dieser nicht mehr existierenden URLs verweisen.