โบนัสการเชื่อมโยง (ตัวแทน +100) และข้อผิดพลาดการตัดการเชื่อมต่อไซต์?
ข้อบกพร่อง 1: โบนัสการเชื่อมโยงโดยไม่มีเหตุผลชัดเจน
ผู้ใช้รายนี้เข้าร่วมกองซ้อนของเราด้วยตัวแทน 101 คน (จากโบนัสการเชื่อมโยง) ในการตรวจสอบตัวแทนฉันเห็นอีกหนึ่งกองที่มีตัวแทน 101 คนและอีกหนึ่งกองกับ 1 ตัวแทน
101บนกองอื่น ๆ ดูเหมือนบังเอิญบิต (ตรง 10 upvotes อาจเป็นไปได้?.) เพื่อให้ผมตรวจสอบ - กิจกรรมใด ๆ นั่นเป็นโบนัสของสมาคมด้วย
ในไซต์ที่สามหน้าของผู้ใช้คือ 404
ดังนั้นฉันจึงคิดว่า "อืมอาจจะมีการห้ามชั่วคราวและตัวแทน 404/1 เป็นสิ่งประดิษฐ์ของการห้าม" ฉันจึงค้นหาไซต์นั้นหลายวิธี ไม่มีอะไร
จุดบกพร่อง 2: บัญชีไซต์แยก / ตัดการเชื่อมต่อจากกัน
สิ่งที่ฉันพบคือบัญชีไซต์ที่สี่ที่ "เกาะ" จากบัญชีอื่น ๆ มันไม่แสดงรายการอีก 3 กองและพวกเขาไม่แสดงรายการ (สังเกตว่าไอคอนผู้ใช้เหมือนกันบั้งสีม่วง) อีกครั้งโบนัสสมาคม; อีกครั้งมีกิจกรรมไซต์ไม่เพียงพอที่จะสนับสนุน
ดังที่ tinkeringbell กล่าวถึงการพิสูจน์ว่าบัญชีไซต์ "เกาะ" นั้นเป็นบัญชีที่ซ่อนอยู่ ฉันค้นพบสิ่งนี้ผ่านการค้นหาเว็บทั่วไปในเครื่องมือค้นหา [มีพฤติกรรมดี] [4] ดังนั้นสิ่งนี้อาจเปลี่ยนไปเป็นการร้องขอรายงานข้อบกพร่อง / คุณสมบัติเพื่อให้ยากขึ้น
คำตอบ
ผู้คนได้รับโบนัสการเชื่อมโยงของพวกเขาเพราะนั่นไม่ได้เชื่อมโยงกับโปรไฟล์ที่คุณได้รับ 200 ชื่อเสียง แต่กับบัญชีเครือข่าย :
แม้ว่าคุณจะลบทุกโปรไฟล์และโปรไฟล์บน stackexchange.com แต่บัญชีเครือข่ายพื้นฐานของคุณก็ยังคงอยู่และนั่นคือที่เก็บโบนัสการเชื่อมโยง
ดังนั้นในกรณีนี้จะมีโปรไฟล์ที่ถูกลบซึ่งครั้งหนึ่งเคยมีชื่อเสียงมากกว่า 200 รายการซึ่งทำให้แน่ใจได้ว่าเมื่อใดก็ตามที่ผู้ใช้รายนี้สร้างโปรไฟล์สำหรับไซต์พวกเขาจะได้รับโบนัสการเชื่อมโยง
โปรไฟล์ข้อมูลดูเหมือนจะถูกลบไปแม้ว่ามันจะค่อนข้างแปลก แต่ก็ยังคงปรากฏอยู่ ดูเหมือนจะมีการแคชบางอย่างที่เกี่ยวข้องซึ่งอาจหมายความว่าสิ่งนี้ยังคงต้องถูกลบออกจากรายการโปรไฟล์เครือข่าย
สำหรับสอง 'ข้อผิดพลาด' ที่เกิดจากชุมชนที่หลบซ่อนตัว ผู้ดูแลยังคงเห็นสิ่งเหล่านี้นั่นคือสิ่งที่ฉันรู้แน่นอน
ขณะที่ทิงเกอริงเบลล์พูดถึงฉันเห็นว่ามีอะไรซ่อนอยู่
ฉันแก้ปัญหาแบบนั้นเพื่อหาเลี้ยงชีพดังนั้นฉันจึงพูดได้ว่ามันเกิดขึ้นได้อย่างไรและจะทำอย่างไรกับมัน ฉันค้นพบสิ่งนี้ในเครื่องมือค้นหาเว็บทั่วไปที่มีความประพฤติดีซึ่งหมายความว่ามันเป็นไปตามกฎในการกำหนดทิศทางทั้งเว็บและการรวมเนื้อหาในเครื่องมือค้นหา โปรดทราบว่านี่เป็นกฎโดยสมัครใจและแมงมุมสีดำอาจไม่ปฏิบัติตาม
แมงมุมพบได้อย่างไร
- พบลิงก์ร่วมสมัยไปยังหน้าเว็บใน StackExchange
- พบลิงค์ร่วมสมัยบนเว็บไซต์ของบุคคลที่สาม
- มันรู้แล้วเกี่ยวกับการมีอยู่ของเพจจากการรวบรวมข้อมูลในอดีต
ฉันแยกสิ่งเหล่านี้ออกเป็น 3 กรณีเพื่อที่ฉันจะได้จัดการกับความเข้าใจผิดที่พบบ่อย
กรณีที่สองคือกรณีที่ผู้ดูแลเว็บ (เช่น StackExchange) ไม่สร้างลิงก์ภายในใด ๆ แต่บุคคลภายนอกทำ หน้าผู้ใช้ของใครบางคนสมมติว่าเชื่อมโยงไปยังหน้าเว็บของพวกเขาที่sfu.edu ไม่เป็นที่รู้จักสำหรับพวกเขา SFU เผยแพร่ข้อมูลรวมจากบันทึกเว็บของพวกเขารวมถึงผู้อ้างอิง เครื่องมือค้นหาถือว่าสิ่งเหล่านี้เป็นแหล่งข้อมูลที่สมบูรณ์สำหรับการค้นพบ URL (แม้ว่าจะไม่ใช่สำหรับความเกี่ยวข้องของลิงก์หรือที่เรียกว่า PageRank) SFU ใช้rel=nofollow
แต่นั่นไม่ใช่คำสั่ง "อย่าไปตามลิงก์" นั่นคือคำสั่ง "ไม่คำนึงถึงความเกี่ยวข้องของลิงก์"
กรณีที่สามเป็นกรณีที่ชอบที่สุดที่นี่ เมื่อเครื่องมือค้นหามี URL แล้วจะไม่ทิ้ง URL เมื่อลิงก์ทั้งหมดไปยัง URL นั้นหายไป ซึ่งจะมีผลต่อความเกี่ยวข้องของลิงก์ แต่มีผลต่อการจัดอันดับเท่านั้น หากผู้ค้นหาก็เพียงพอที่เฉพาะเจาะจงเพื่อที่เฉพาะหลายสิบของผลที่มีอยู่แม้จะเป็นหน้าต่ำการจัดอันดับจะพื้นผิว
วิธีซ่อนจากเครื่องยนต์ที่มีพฤติกรรมดี
... สมมติว่า StackExchange มีความประสงค์ที่จะ มีข้อโต้แย้งทั้งสองทาง
ตัวเลือกที่ดีที่สุดคือเมตาแท็ก HTML "noindex" (หรือ X-Robots เทียบเท่าใน HTTP) ดังต่อไปนี้
<meta name="robots" content="noindex">
แท็กนี้ระบุว่า "ไม่รวมหน้านี้ในผลการค้นหา" แท็กยังสามารถมีองค์ประกอบต่างๆเช่นnofollow
(ซึ่งจริงๆแล้วหมายถึง "โปรแกรมรวบรวมข้อมูลควรไม่สนใจลิงก์ที่พบในหน้านี้" ซึ่งแตกต่างจากrel=
)
โปรดทราบว่าเครื่องมือค้นหาต้องดึงข้อมูลหน้าเว็บเพื่อดูแท็กนี้ ไม่มีอะไรต้องกังวล ฉันคิดว่าคุณสามารถให้บริการในฟิลด์ X-Robots HTTP และแสดงเนื้อหาหน้าว่างได้ อย่างไรก็ตามเมื่อถึงจุดนั้นคุณสามารถคืน 403 Forbidden, 404 Not Found หรือ 410 Gone ได้อย่างง่ายดาย โปรดทราบว่า 410 Gone หมายถึง URL ที่ถูกวางแผนไว้ว่าจะหายไปตลอดกาล สิ่งนี้มีความสำคัญกับเครื่องมือค้นหาบางประเภท
การบล็อกเครื่องมือไม่ให้รวบรวมข้อมูลหน้าเช่นการยกเว้นหน้าใน robots.txt จะไม่ทำงาน Robots.txt กำหนดทิศทางการรวบรวมข้อมูลเท่านั้นไม่ใช่การจัดทำดัชนี เครื่องมือค้นหาอาจยังคงสร้างผลการค้นหาสำหรับเพจโดยอนุมานเนื้อหาของเพจจากลิงก์และข้อมูลที่เก็บถาวร