Ten Dead Weblink można ożywić dzięki Wayback Machine

Dec 19 2019
Czy kiedykolwiek kliknąłeś artykuł internetowy z niedziałającym linkiem i zastanawiałeś się, co jest pod tym linkiem? Możesz cofnąć się w czasie i zobaczyć tę starą stronę internetową dzięki Wayback Machine.
Cofnij się w czasie i odwiedź tę starą stronę internetową, nad którą się zastanawiałeś. Ja_inter / Getty Images

Jeśli drzewo upadnie w lesie, czy naprawdę wydaje dźwięk? A jeśli witryna zmienia się z dnia na dzień, czy jej poprzednia strona główna naprawdę istniała? Ponieważ tak duża część naszego świata jest coraz bardziej cyfrowa - i efemeryczna - to nie tylko kwestia filozoficzna, to także prosta sprawa historyczna. Dlatego Wayback Machine, który zawiera migawki stron internetowych w miarę ich starzenia i zmian, jest tak fascynującym wglądem w zakurzone zakątki sieci.

Wayback Machine to ogromne cyfrowe archiwum przeznaczone do przechowywania stron internetowych, które w innym przypadku zostałyby trwale utracone. Bez tego zbioru danych za każdym razem, gdy strona była aktualizowana lub usuwana, po prostu znikałaby, jakby jej nigdy nie było.

Średnia długość życia strony internetowej to około 100 dni , zauważył Mark Graham, dyrektor Wayback Machine w artykule Entrepreneur z 2016 roku. Istnieje wiele powodów, dla których te strony internetowe znikają. Twórcy witryn przechodzą do innych projektów. Firmy hostingowe zbankrutowały. A może strona zostanie przeniesiona lub zastąpiona nowymi danymi i treścią.

Jak zaczęła się maszyna Wayback

Wayback Maszyna jest pomysłem Brewster Kahle i Bruce Gilliata który również założył Internet Archive , cyfrową bibliotekę stron internetowych, książek, nagrań audio i wideo oraz programów. Oba projekty są organizacjami non-profit z siedzibą w San Francisco. Wayback Machine to projekt Internet Archive. (Kahle i Gilliat stworzyli również Alexa Internet, która analizuje wzorce ruchu w sieci i została sprzedana firmie Amazon.)

„Oni [Kahle i Gilliat] zaczęli archiwizować strony internetowe w 1996 roku, aw 2001 roku uruchomili Wayback Machine, aby wspierać wykrywanie i odtwarzanie tych zarchiwizowanych zasobów sieciowych” - mówi Graham w niedawnym wywiadzie e-mailowym. „I tak, nazwa została zainspirowana serialem animowanym„ The Rocky and Bullwinkle Show ”z lat 60. W kreskówce Maszyna WABAC (zwróć uwagę na różnicę w pisowni) była narzędziem fabularnym używanym do przeniesienia postaci, pana Peabody'ego i Shermana w przeszłość, w celu odwiedzenia ważnych wydarzeń w historii ludzkości ”.

W świecie, w którym istnieje ponad 1,7 miliarda stron internetowych, a ich liczba rośnie dramatycznie z dnia na dzień , jak ktokolwiek może mieć nadzieję na skatalogowanie tak wielu stron? Wayback Machine korzysta z tak zwanych „robotów”, czyli oprogramowania, które automatycznie porusza się po sieci, wykonując migawki miliardów witryn. Część procesu jest zautomatyzowana, ale wiele żądań jest generowanych ręcznie przez sieć bibliotekarzy, którzy nadają priorytet określonym typom witryn, które ich zdaniem są ważne dla potomności i przyszłych pokoleń.

Roboty nie przechwytują wszystkich iteracji witryn. Częstotliwość tworzenia migawek różni się w zależności od znaczenia witryny - bardzo ważne witryny mogą być rejestrowane co kilka godzin. Inne mogą być rejestrowane w odstępach tygodni lub miesięcy. Większość z nich w ogóle nie jest rejestrowana (więc nie martw się, ta żenująca strona dla fanów, którą stworzyłeś w liceum, prawdopodobnie już dawno zniknęła). Celem Wayback Machine jest przechwytywanie migawek ważnych treści, na przykład najświeższych nagłówków wiadomości tworzonych przez główne firmy medialne.

Co więcej, niekoniecznie odtwarza całą witrynę i nie zachowuje danych w sposób, w jaki można to zobaczyć w przeglądarce. Może przechwytywać tylko kilka obrazów kilku stron i nie zachowywać treści, które zawierają linki do innych witryn spoza domeny.

Korzystanie z Wayback Machine

Prawdopodobnie zdarzyło Ci się kliknąć łącze na stronie internetowej i otrzymać notację „404” lub „nie znaleziono strony”. Teraz zastanawiasz się, co było pierwotnie na stronie. Tutaj może pomóc Wayback Machine.

Aby skorzystać z Wayback Machine , przejdź do https://archive.org/web/. Wpisz adres URL witryny, którą chcesz zbadać, w pasku wyszukiwania „Historia przeglądania”. W naszym przykładzie wykorzystamy naszą ulubioną stronę internetową https://www.howstuffworks.com/. W wynikach zobaczysz chronologiczny wykres słupkowy, który pokazuje, ile razy witryna została przeszukana (i zapisana) w danym roku.

Strona główna serwisu Wayback Machine.

Kliknij rok, a poniżej zobaczysz 12-miesięczny kalendarz z podświetlonymi różnymi datami. Niebieskie podświetlenia oznaczają, że witryna została prawidłowo zapisana; czerwony oznacza, że ​​tak nie było. Kliknij jedną z podświetlonych dat, a pojawią się migawki witryny. Kliknij jedną z tych migawek i - tak po prostu - cofnąłeś się w czasie do starszej wersji witryny.

Jeśli chcesz mieć pewność, że określona witryna jest zapisana w archiwum, możesz to zrobić ręcznie. Skorzystaj z opcji Zapisz stronę teraz, aby raz zapisać określoną stronę - ale pamiętaj, że spowoduje to zapisanie tylko tej jednej strony (nie całej witryny) i nie gwarantuje, że witryna zostanie zindeksowana w przyszłości.

A jeśli właściciele treści chcą, aby ich materiały zostały wyłączone z Wayback Machine, mogą przesłać prośbę, wysyłając wiadomość e-mail na adres [email protected].

Możesz także przeszukiwać książki, filmy, nagrania audio i programy, klikając ikony u góry strony głównej Wayback Machine, obok słów „Archiwum internetowe”. W zależności od elementu można je pobrać na stałe lub wypożyczyć na pewien okres. Dostępne są również zaawansowane funkcje wyszukiwania .

Przyszłość maszyny Wayback

Graham mówi, że najbardziej zdumiewającą rzeczą w Wayback Machine jest to, że w ogóle istnieje i ile publicznej sieci jest w stanie zachować, biorąc pod uwagę, że ma mały zespół i budżet. (Oni też korzystają z ochotników ).

„Przy większym wsparciu możemy wykonać [jeszcze] lepszą pracę polegającą na tworzeniu kopii zapasowych większej ilości publicznej sieci” - mówi. „Fundusze na Internet Archive pochodzą z połączenia„ dochodu zarobionego ”z naszej usługi archiwizacji internetowej opartej na subskrypcji Archive-It.org , głównych darczyńców i fundacji, a także składek od ponad 100 000 indywidualnych darczyńców. Uwielbiamy być może udostępniać nasze usługi i nie wyświetlać reklam na naszych stronach internetowych ”.

Jest pewien, że Wayback Machine stanie się jeszcze ważniejszy w przyszłości.

„W miarę jak zmienia się charakter sposobu, w jaki ludzie komunikują się i udostępniają informacje, będziemy musieli budować technologie, procesy i partnerstwa, aby nadal robić wszystko, co w naszej mocy, aby zachować jak najwięcej informacji publicznych” - mówi. „Wszystko to wspiera misję Wayback Machine, polegającą na 'pomocy w uczynieniu sieci bardziej użyteczną i niezawodną', a zwłaszcza w celu wsparcia dziennikarzy, aktywistów, naukowców, historii, badaczy i ogółu społeczeństwa”.

Uwaga redaktora: 13. akapit tego artykułu został zaktualizowany na prośbę personelu Wayback Machine.

TERAZ TO CIEKAWE

Mark Graham mówi, że ponad 11 milionów stron internetowych, do których odnoszą się artykuły Wikipedii, zepsuło się na przestrzeni lat (innymi słowy, teraz zwracają błąd 404 lub „Nie znaleziono strony”). Ponieważ zostały zarchiwizowane w Wayback Machine, tamtejsi technicy mogli edytować te strony Wikipedii, więc odniesienia wskazują teraz na zarchiwizowane wersje tych nieaktualnych adresów URL.