Weblink ที่ตายแล้วอาจได้รับการฟื้นฟูด้วย Wayback Machine

Dec 19 2019
เคยคลิกบทความบนเว็บที่มีลิงก์เสียและสงสัยว่ามีอะไรอยู่ในลิงก์นั้นหรือไม่? คุณสามารถย้อนเวลากลับไปและดูหน้าเว็บเก่านั้นได้ด้วย Wayback Machine
ย้อนเวลากลับไปและเยี่ยมชมเว็บไซต์เก่า ๆ ที่คุณเคยสงสัย รูปภาพ Ja_inter / Getty

ถ้าต้นไม้ล้มในป่ามันส่งเสียงจริงหรือ? และหากเว็บไซต์เปลี่ยนไปในชั่วข้ามคืนโฮมเพจก่อนหน้านี้เคยมีอยู่จริงตั้งแต่แรกหรือไม่? เนื่องจากโลกของเราส่วนใหญ่เปลี่ยนเป็นดิจิทัลมากขึ้นและไม่จีรัง - ไม่ใช่แค่คำถามเชิงปรัชญาเท่านั้น แต่ยังเป็นเรื่องธรรมดาของประวัติศาสตร์อีกด้วย นั่นเป็นเหตุผลที่ Wayback Machine ซึ่งมีภาพรวมของเว็บไซต์ตามอายุและการเปลี่ยนแปลงจึงเป็นภาพที่น่าสนใจในมุมที่เต็มไปด้วยฝุ่นของเว็บ

Wayback Machine เป็นไฟล์เก็บถาวรดิจิทัลขนาดใหญ่ที่มีไว้เพื่อรักษาหน้าเว็บที่อาจสูญหายไปอย่างถาวรเมื่อเวลาผ่านไป หากไม่มีการกักตุนข้อมูลนี้ทุกครั้งที่มีการอัปเดตหรือลบเพจมันก็จะหายไปราวกับว่าไม่เคยมีมาก่อน

อายุขัยเฉลี่ยของหน้าเว็บอยู่ที่ประมาณ 100 วัน Mark Graham ผู้อำนวยการ Wayback Machine กล่าวไว้ในบทความ Entrepreneur ปี 2016 มีสาเหตุหลายประการที่ทำให้หน้าเว็บเหล่านี้หายไป ผู้สร้างไซต์ย้ายไปยังโครงการอื่น ๆ บริษัท เว็บโฮสติ้งล้มละลาย หรืออาจมีการย้ายหน้าหรือแทนที่ด้วยข้อมูลและเนื้อหาใหม่

เครื่อง Wayback เริ่มต้นอย่างไร

Wayback เครื่องเป็นผลิตผลของเบียร์ Kahle และบรูซกิลเลียต, ผู้ก่อตั้งที่อินเทอร์เน็ต Archive , ห้องสมุดดิจิตอลของเว็บไซต์, หนังสือ, การบันทึกเสียงและวิดีโอและโปรแกรมซอฟต์แวร์ ทั้งสองโครงการเป็นองค์กรไม่แสวงหาผลกำไรในซานฟรานซิสโก Wayback Machine เป็นโครงการของ Internet Archive (Kahle และ Gilliat ยังสร้าง Alexa Internet ซึ่งวิเคราะห์รูปแบบการเข้าชมเว็บและขายให้กับ Amazon)

"พวกเขา [Kahle and Gilliat] ได้เริ่มจัดเก็บหน้าเว็บในปี 1996 และในปี 2001 ได้เปิดตัว Wayback Machine เพื่อสนับสนุนการค้นพบและการเล่นทรัพยากรบนเว็บที่เก็บถาวรเหล่านั้น" Graham กล่าวในการให้สัมภาษณ์ทางอีเมลเมื่อเร็ว ๆ นี้ "และใช่ชื่อนี้ได้รับแรงบันดาลใจจากซีรีส์การ์ตูนปี 1960 'The Rocky and Bullwinkle Show' ในการ์ตูนเรื่อง WABAC Machine (สังเกตความแตกต่างของการสะกดคำ) เป็นอุปกรณ์พล็อตที่ใช้ในการขนส่งตัวละครมิสเตอร์พีบอดี้และเชอร์แมนย้อนเวลากลับไปเยี่ยมชมเหตุการณ์สำคัญในประวัติศาสตร์ของมนุษย์ "

ในโลกที่มีเว็บไซต์มากกว่า 1.7 พันล้านเว็บไซต์ด้วยจำนวนที่เพิ่มขึ้นอย่างรวดเร็วในแต่ละวันใคร ๆ จะหวังว่าจะทำแคตตาล็อกหน้าเว็บจำนวนมากได้อย่างไร? Wayback Machine ใช้สิ่งที่เรียกว่า "ซอฟต์แวร์รวบรวมข้อมูล" ซึ่งเป็นซอฟต์แวร์ประเภทหนึ่งที่เคลื่อนที่ผ่านเว็บโดยอัตโนมัติโดยใช้ภาพรวมของไซต์หลายพันล้านไซต์ กระบวนการบางอย่างเป็นไปโดยอัตโนมัติ แต่คำขอจำนวนมากถูกสร้างขึ้นด้วยตนเองโดยเครือข่ายบรรณารักษ์ซึ่งจัดลำดับความสำคัญของไซต์บางประเภทที่พวกเขาคิดว่ามีความสำคัญในการอนุรักษ์ไว้เพื่อลูกหลานและสำหรับคนรุ่นต่อไป

โปรแกรมรวบรวมข้อมูลจะไม่ตรวจจับการวนซ้ำของไซต์ทุกครั้ง ความถี่ของสแนปชอตแตกต่างกันไปตามความสำคัญของไซต์ไซต์ที่สำคัญมากอาจได้รับการบันทึกทุกๆสองสามชั่วโมง คนอื่น ๆ อาจบันทึกไว้เป็นสัปดาห์หรือหลายเดือน ส่วนใหญ่ไม่ได้เข้าสู่ระบบเลย (ไม่ต้องกังวลเว็บไซต์แฟน ๆ ที่น่าอับอายที่คุณสร้างในโรงเรียนมัธยมปลายอาจจะหายไปนานแล้ว) Wayback Machine มีจุดมุ่งหมายเพื่อจับภาพรวมของเนื้อหาที่สำคัญเช่นหัวข้อข่าวด่วนที่สร้างโดย บริษัท สื่อรายใหญ่

นอกจากนี้ยังไม่จำเป็นต้องสร้างใหม่ทั้งไซต์และไม่ได้เก็บรักษาข้อมูลในลักษณะที่คุณได้สัมผัสกับเบราว์เซอร์ของคุณ อาจจับภาพได้เพียงไม่กี่ภาพจากไม่กี่หน้าและไม่เก็บรักษาเนื้อหาที่เชื่อมโยงกับไซต์อื่นนอกโดเมน

การใช้เครื่อง Wayback

คุณอาจเคยมีประสบการณ์ในการคลิกลิงก์บนหน้าเว็บและได้รับสัญลักษณ์ "404" หรือ "ไม่พบหน้าเว็บ" ตอนนี้คุณกำลังสงสัยว่ามีอะไรอยู่ในหน้าเดิม นั่นคือสิ่งที่ Wayback Machine สามารถช่วยได้

หากต้องการใช้ Wayback Machineให้ไปที่ https://archive.org/web/ พิมพ์ URL ของไซต์ที่คุณต้องการตรวจสอบในแถบค้นหา "ประวัติการเรียกดู" เราจะใช้เว็บไซต์โปรดของเรา https://www.howstuffworks.com/ เป็นตัวอย่าง ในผลลัพธ์คุณจะเห็นกราฟแท่งตามลำดับเวลาที่แสดงจำนวนครั้งที่มีการรวบรวมข้อมูลไซต์ (และบันทึก) ในปีหนึ่ง ๆ

หน้าแรกของเว็บไซต์ Wayback Machine

คลิกปีและด้านล่างคุณจะเห็นปฏิทิน 12 เดือนพร้อมวันที่ต่างๆที่ไฮไลต์ไว้ ไฮไลต์สีน้ำเงินหมายความว่าไซต์ได้รับการบันทึกอย่างถูกต้อง สีแดงหมายความว่าไม่ใช่ คลิกหนึ่งในวันที่ที่ไฮไลต์จากนั้นสแนปชอตของไซต์จะปรากฏขึ้น คลิกที่หนึ่งในภาพรวมเหล่านั้นและเช่นเดียวกับที่คุณได้ย้อนเวลากลับไปยังไซต์เวอร์ชันเก่านั้น

หากคุณต้องการตรวจสอบให้แน่ใจว่ามีการบันทึกไซต์ใดไซต์หนึ่งลงในที่เก็บถาวรคุณสามารถทำได้ด้วยตนเอง ใช้ตัวเลือกบันทึกหน้าทันทีเพื่อบันทึกหน้าหนึ่งครั้ง แต่โปรดทราบว่าการทำเช่นนั้นจะบันทึกหน้านั้นเพียงหน้าเดียว (ไม่ใช่ทั้งเว็บไซต์) และไม่รับประกันว่าไซต์จะได้รับการรวบรวมข้อมูลในอนาคต

และหากเจ้าของเนื้อหาต้องการให้เนื้อหาของพวกเขาถูกแยกออกจาก Wayback Machine พวกเขาสามารถส่งคำขอโดยส่งอีเมลไปที่ [email protected]

คุณยังสามารถค้นหาหนังสือวิดีโอการบันทึกเสียงและโปรแกรมซอฟต์แวร์ได้โดยคลิกที่ไอคอนที่ด้านบนของหน้าแรกของ Wayback Machine ถัดจากคำว่า "Internet Archive" สิ่งเหล่านี้สามารถดาวน์โหลดได้อย่างถาวรหรือยืมเป็นช่วงเวลาขึ้นอยู่กับรายการ นอกจากนี้ยังมีคุณสมบัติการค้นหาขั้นสูง

อนาคตของเครื่องจักร Wayback

Graham กล่าวว่าสิ่งที่น่าทึ่งที่สุดเกี่ยวกับ Wayback Machine คือมันมีอยู่จริงและมีเว็บสาธารณะเท่าไหร่ที่สามารถรักษาได้เนื่องจากมีทีมงานและงบประมาณเพียงเล็กน้อย (พวกเขาใช้อาสาสมัครด้วย )

"ด้วยการสนับสนุนที่มากขึ้นเราสามารถ [แม้] งานที่ดีขึ้นในการสำรองข้อมูลเว็บสาธารณะได้มากขึ้น" เขากล่าว "การระดมทุนสำหรับ Internet Archive มาจากการรวมกันของ 'รายได้ที่ได้รับ' จากบริการจัดทำเว็บแบบสมัครสมาชิกArchive-It.orgผู้บริจาครายใหญ่และมูลนิธิตลอดจนการบริจาคจากผู้บริจาครายบุคคลมากกว่า 100,000 รายเราชอบที่จะเป็น สามารถให้บริการของเราและไม่แสดงโฆษณาบนหน้าเว็บของเรา "

เขาแน่ใจว่า Wayback Machine จะมีความสำคัญมากยิ่งขึ้นในอนาคต

“ เนื่องจากธรรมชาติของวิธีที่ผู้คนสื่อสารและแบ่งปันข้อมูลมีวิวัฒนาการเช่นกันเราจะต้องสร้างเทคโนโลยีกระบวนการและความร่วมมือเพื่อทำงานอย่างดีที่สุดเท่าที่จะทำได้เพื่อรักษาข้อมูลสาธารณะนี้ไว้ให้มากที่สุดเท่าที่จะทำได้” เขากล่าว "ทั้งหมดนี้สนับสนุนภารกิจของ Wayback Machine ในการ 'ช่วยทำให้เว็บมีประโยชน์และเชื่อถือได้มากขึ้น' และโดยเฉพาะอย่างยิ่งเพื่อช่วยสนับสนุนนักข่าวนักเคลื่อนไหวนักวิชาการประวัติศาสตร์นักวิจัยและประชาชนทั่วไป"

หมายเหตุบรรณาธิการ: ย่อหน้าที่ 13 ของบทความนี้ได้รับการอัปเดตตามคำร้องขอของเจ้าหน้าที่ Wayback Machine

ตอนนี้ที่น่าสนใจ

Mark Graham กล่าวว่าหน้าเว็บที่อ้างถึงในบทความ Wikipedia มากกว่า 11 ล้านหน้าได้รับความเสียหายในช่วงหลายปีที่ผ่านมา (กล่าวอีกนัยหนึ่งคือตอนนี้ส่งคืน 404 หรือ "ไม่พบหน้าเว็บ") เนื่องจากพวกเขาถูกเก็บถาวรใน Wayback Machine เทคโนโลยีจึงสามารถแก้ไขหน้า Wikipedia เหล่านั้นได้ดังนั้นการอ้างอิงจึงชี้ไปที่ URL ที่เสียไปแล้วในเวอร์ชันที่เก็บถาวร