
Si un árbol cae en un bosque, ¿realmente emite algún sonido? Y si un sitio web cambia de la noche a la mañana, ¿existió realmente su página de inicio anterior? Debido a que gran parte de nuestro mundo es cada vez más digital, y efímero, no es solo una cuestión filosófica, también es una simple cuestión de historia. Es por eso que Wayback Machine, que presenta instantáneas de sitios web a medida que envejecen y cambian, es un vistazo tan fascinante a los polvorientos rincones de la web.
Wayback Machine es un archivo digital masivo destinado a preservar las páginas web que de otro modo se perderían permanentemente en el tiempo. Sin este cúmulo de datos, cada vez que se actualizaba o eliminaba una página, simplemente desaparecía, como si nunca hubiera estado allí.
La esperanza de vida promedio de una página web es de unos 100 días , señaló Mark Graham, director de Wayback Machine, en un artículo de Entrepreneur de 2016. Hay una multitud de razones por las que estas páginas web desaparecen. Los creadores de sitios pasan a otros proyectos. Las empresas de alojamiento web quebran. O tal vez la página se mueva o se reemplace con nuevos datos y contenido.
Cómo se inició la Wayback Machine
La Wayback Machine es una idea original de Brewster Kahle y Bruce Gilliat, quien también fundó el Archivo de Internet , una biblioteca digital de sitios web, libros, grabaciones de audio y vídeo y programas de software. Ambos proyectos son organizaciones sin fines de lucro con sede en San Francisco. Wayback Machine es un proyecto de Internet Archive. (Kahle y Gilliat también crearon Alexa Internet, que analiza los patrones de tráfico web y se vendió a Amazon).
"Ellos [Kahle y Gilliat] habían comenzado a archivar páginas web en 1996, y en 2001 lanzaron Wayback Machine para apoyar el descubrimiento y reproducción de esos recursos web archivados", dice Graham en una reciente entrevista por correo electrónico. “Y, sí, el nombre se inspiró en la serie de dibujos animados de los años 60 'The Rocky and Bullwinkle Show'. En la caricatura, la máquina WABAC (tenga en cuenta la diferencia de ortografía) era un dispositivo de trama utilizado para transportar a los personajes, el Sr. Peabody y Sherman, al pasado para visitar eventos importantes en la historia de la humanidad ".
En un mundo donde hay más de 1.700 millones de sitios web, y el número aumenta drásticamente cada día , ¿cómo puede alguien esperar catalogar tantas páginas web? Wayback Machine utiliza lo que se denomina "rastreadores", un tipo de software que se mueve automáticamente a través de la web, tomando instantáneas de miles de millones de sitios a medida que avanza. Parte del proceso está automatizado, pero muchas de las solicitudes son generadas manualmente por una red de bibliotecarios, que priorizan ciertos tipos de sitios que creen que son importantes para preservar para la posteridad y para las generaciones futuras.
Los rastreadores no capturan todas las iteraciones de sitios. La frecuencia de las instantáneas varía según la importancia del sitio; es posible que se registren sitios muy importantes cada pocas horas. Otros pueden registrarse con semanas o meses de diferencia. La mayoría no está registrada (así que no te preocupes, ese sitio web de fans vergonzoso que creaste en la escuela secundaria probablemente ya no está) Wayback Machine tiene como objetivo capturar instantáneas de contenido importante, por ejemplo, los titulares de noticias de última hora creados por las principales empresas de medios.
Además, no necesariamente recrea todo el sitio y no preserva los datos de una manera que los experimentarías con tu navegador. Es posible que solo capture algunas imágenes de algunas páginas y no conserve el contenido que está vinculado a otros sitios fuera del dominio.
Usando la Wayback Machine
Probablemente haya tenido la experiencia de hacer clic en un enlace en una página web y obtener una notación "404" o "página no encontrada". Ahora te estás preguntando qué había originalmente en la página. Ahí es donde Wayback Machine puede ayudar.
Para usar Wayback Machine , vaya a https://archive.org/web/. Escriba la URL del sitio que desea investigar en la barra de búsqueda "Historial de exploración". Usaremos nuestro sitio web favorito https://www.howstuffworks.com/ para nuestro ejemplo. En los resultados, verá un gráfico de barras cronológico que muestra cuántas veces se rastreó (y guardó) el sitio en un año determinado.

Haga clic en el año y, a continuación, verá un calendario de 12 meses con varias fechas resaltadas. Los resaltes azules significan que el sitio se guardó correctamente; rojo significa que no lo fue. Haga clic en una de las fechas resaltadas y aparecerán las instantáneas del sitio. Haga clic en una de esas instantáneas y, sin más, habrá viajado en el tiempo a esa versión anterior del sitio.
Si desea asegurarse de que un sitio en particular se registre en el archivo, puede hacerlo manualmente. Use la opción Guardar página ahora para guardar una página específica una vez, pero tenga en cuenta que hacerlo solo guarda esa página (no un sitio web completo) y no garantiza que el sitio se rastreará en el futuro.
Y, si los propietarios de contenido quieren que su material sea excluido de Wayback Machine, pueden enviar una solicitud enviando un correo electrónico a [email protected].
También puede buscar libros, videos, grabaciones de audio y programas de software haciendo clic en los íconos en la parte superior de la página de inicio de Wayback Machine, junto a las palabras "Archivo de Internet". Estos se pueden descargar de forma permanente o tomar prestados durante un período, según el artículo. Las funciones de búsqueda avanzada también están disponibles.
El futuro de la Wayback Machine.
Graham dice que lo más sorprendente de Wayback Machine es que existe y la cantidad de web pública que puede preservar, dado que tiene un equipo y un presupuesto pequeños. (También usan voluntarios ).
"Con más soporte podemos hacer un [aún] mejor trabajo de hacer más copias de seguridad de la web pública", dice. "La financiación de Internet Archive proviene de una combinación de 'ingresos obtenidos' de nuestro servicio de archivado web basado en suscripción, Archive-It.org , de los principales donantes y fundaciones, así como de las contribuciones de más de 100.000 donantes individuales. Nos encanta ser capaz de regalar nuestros servicios y no publicar anuncios en nuestras páginas web ".
Está seguro de que Wayback Machine será aún más importante en el futuro.
"A medida que evoluciona la naturaleza de cómo las personas se comunican y comparten información, también necesitaremos crear tecnologías, procesos y asociaciones para continuar haciendo el mejor trabajo posible para preservar la mayor cantidad posible de esta información pública", dice. "Todos en apoyo a la misión de Wayback Machine de 'Ayudar a que la web sea más útil y confiable' y, en particular, para ayudar a apoyar a periodistas, activistas, académicos, historiadores, investigadores y el público en general".
Nota del editor: El párrafo 13 de este artículo se ha actualizado a petición del personal de Wayback Machine.
AHORA ESO INTERESANTE
Mark Graham dice que más de 11 millones de páginas web a las que se hace referencia en los artículos de Wikipedia se han estropeado a lo largo de los años (en otras palabras, ahora devuelven un 404 o "Página no encontrada"). Debido a que se habían archivado en Wayback Machine, los técnicos pudieron editar esas páginas de Wikipedia, por lo que las referencias ahora apuntan a versiones archivadas de esas URL desaparecidas.