โบนัสการเชื่อมโยง (ตัวแทน +100) และข้อผิดพลาดการตัดการเชื่อมต่อไซต์?

Aug 17 2020

ข้อบกพร่อง 1: โบนัสการเชื่อมโยงโดยไม่มีเหตุผลชัดเจน

ผู้ใช้รายนี้เข้าร่วมกองซ้อนของเราด้วยตัวแทน 101 คน (จากโบนัสการเชื่อมโยง) ในการตรวจสอบตัวแทนฉันเห็นอีกหนึ่งกองที่มีตัวแทน 101 คนและอีกหนึ่งกองกับ 1 ตัวแทน

101บนกองอื่น ๆ ดูเหมือนบังเอิญบิต (ตรง 10 upvotes อาจเป็นไปได้?.) เพื่อให้ผมตรวจสอบ - กิจกรรมใด ๆ นั่นเป็นโบนัสของสมาคมด้วย

ในไซต์ที่สามหน้าของผู้ใช้คือ 404

ดังนั้นฉันจึงคิดว่า "อืมอาจจะมีการห้ามชั่วคราวและตัวแทน 404/1 เป็นสิ่งประดิษฐ์ของการห้าม" ฉันจึงค้นหาไซต์นั้นหลายวิธี ไม่มีอะไร

จุดบกพร่อง 2: บัญชีไซต์แยก / ตัดการเชื่อมต่อจากกัน

สิ่งที่ฉันพบคือบัญชีไซต์ที่สี่ที่ "เกาะ" จากบัญชีอื่น ๆ มันไม่แสดงรายการอีก 3 กองและพวกเขาไม่แสดงรายการ (สังเกตว่าไอคอนผู้ใช้เหมือนกันบั้งสีม่วง) อีกครั้งโบนัสสมาคม; อีกครั้งมีกิจกรรมไซต์ไม่เพียงพอที่จะสนับสนุน

ดังที่ tinkeringbell กล่าวถึงการพิสูจน์ว่าบัญชีไซต์ "เกาะ" นั้นเป็นบัญชีที่ซ่อนอยู่ ฉันค้นพบสิ่งนี้ผ่านการค้นหาเว็บทั่วไปในเครื่องมือค้นหา [มีพฤติกรรมดี] [4] ดังนั้นสิ่งนี้อาจเปลี่ยนไปเป็นการร้องขอรายงานข้อบกพร่อง / คุณสมบัติเพื่อให้ยากขึ้น

คำตอบ

11 Tinkeringbell Aug 17 2020 at 18:43

ผู้คนได้รับโบนัสการเชื่อมโยงของพวกเขาเพราะนั่นไม่ได้เชื่อมโยงกับโปรไฟล์ที่คุณได้รับ 200 ชื่อเสียง แต่กับบัญชีเครือข่าย :

แม้ว่าคุณจะลบทุกโปรไฟล์และโปรไฟล์บน stackexchange.com แต่บัญชีเครือข่ายพื้นฐานของคุณก็ยังคงอยู่และนั่นคือที่เก็บโบนัสการเชื่อมโยง

ดังนั้นในกรณีนี้จะมีโปรไฟล์ที่ถูกลบซึ่งครั้งหนึ่งเคยมีชื่อเสียงมากกว่า 200 รายการซึ่งทำให้แน่ใจได้ว่าเมื่อใดก็ตามที่ผู้ใช้รายนี้สร้างโปรไฟล์สำหรับไซต์พวกเขาจะได้รับโบนัสการเชื่อมโยง

โปรไฟล์ข้อมูลดูเหมือนจะถูกลบไปแม้ว่ามันจะค่อนข้างแปลก แต่ก็ยังคงปรากฏอยู่ ดูเหมือนจะมีการแคชบางอย่างที่เกี่ยวข้องซึ่งอาจหมายความว่าสิ่งนี้ยังคงต้องถูกลบออกจากรายการโปรไฟล์เครือข่าย

สำหรับสอง 'ข้อผิดพลาด' ที่เกิดจากชุมชนที่หลบซ่อนตัว ผู้ดูแลยังคงเห็นสิ่งเหล่านี้นั่นคือสิ่งที่ฉันรู้แน่นอน

5 Harper-ReinstateMonica Aug 18 2020 at 00:16

ขณะที่ทิงเกอริงเบลล์พูดถึงฉันเห็นว่ามีอะไรซ่อนอยู่

ฉันแก้ปัญหาแบบนั้นเพื่อหาเลี้ยงชีพดังนั้นฉันจึงพูดได้ว่ามันเกิดขึ้นได้อย่างไรและจะทำอย่างไรกับมัน ฉันค้นพบสิ่งนี้ในเครื่องมือค้นหาเว็บทั่วไปที่มีความประพฤติดีซึ่งหมายความว่ามันเป็นไปตามกฎในการกำหนดทิศทางทั้งเว็บและการรวมเนื้อหาในเครื่องมือค้นหา โปรดทราบว่านี่เป็นกฎโดยสมัครใจและแมงมุมสีดำอาจไม่ปฏิบัติตาม

แมงมุมพบได้อย่างไร

พบลิงก์ร่วมสมัยไปยังหน้าเว็บใน StackExchange
พบลิงค์ร่วมสมัยบนเว็บไซต์ของบุคคลที่สาม
มันรู้แล้วเกี่ยวกับการมีอยู่ของเพจจากการรวบรวมข้อมูลในอดีต

ฉันแยกสิ่งเหล่านี้ออกเป็น 3 กรณีเพื่อที่ฉันจะได้จัดการกับความเข้าใจผิดที่พบบ่อย

กรณีที่สองคือกรณีที่ผู้ดูแลเว็บ (เช่น StackExchange) ไม่สร้างลิงก์ภายในใด ๆ แต่บุคคลภายนอกทำ หน้าผู้ใช้ของใครบางคนสมมติว่าเชื่อมโยงไปยังหน้าเว็บของพวกเขาที่sfu.edu ไม่เป็นที่รู้จักสำหรับพวกเขา SFU เผยแพร่ข้อมูลรวมจากบันทึกเว็บของพวกเขารวมถึงผู้อ้างอิง เครื่องมือค้นหาถือว่าสิ่งเหล่านี้เป็นแหล่งข้อมูลที่สมบูรณ์สำหรับการค้นพบ URL (แม้ว่าจะไม่ใช่สำหรับความเกี่ยวข้องของลิงก์หรือที่เรียกว่า PageRank) SFU ใช้rel=nofollowแต่นั่นไม่ใช่คำสั่ง "อย่าไปตามลิงก์" นั่นคือคำสั่ง "ไม่คำนึงถึงความเกี่ยวข้องของลิงก์"

กรณีที่สามเป็นกรณีที่ชอบที่สุดที่นี่ เมื่อเครื่องมือค้นหามี URL แล้วจะไม่ทิ้ง URL เมื่อลิงก์ทั้งหมดไปยัง URL นั้นหายไป ซึ่งจะมีผลต่อความเกี่ยวข้องของลิงก์ แต่มีผลต่อการจัดอันดับเท่านั้น หากผู้ค้นหาก็เพียงพอที่เฉพาะเจาะจงเพื่อที่เฉพาะหลายสิบของผลที่มีอยู่แม้จะเป็นหน้าต่ำการจัดอันดับจะพื้นผิว

วิธีซ่อนจากเครื่องยนต์ที่มีพฤติกรรมดี

... สมมติว่า StackExchange มีความประสงค์ที่จะ มีข้อโต้แย้งทั้งสองทาง

ตัวเลือกที่ดีที่สุดคือเมตาแท็ก HTML "noindex" (หรือ X-Robots เทียบเท่าใน HTTP) ดังต่อไปนี้

  <meta name="robots" content="noindex">

แท็กนี้ระบุว่า "ไม่รวมหน้านี้ในผลการค้นหา" แท็กยังสามารถมีองค์ประกอบต่างๆเช่นnofollow(ซึ่งจริงๆแล้วหมายถึง "โปรแกรมรวบรวมข้อมูลควรไม่สนใจลิงก์ที่พบในหน้านี้" ซึ่งแตกต่างจากrel=)

โปรดทราบว่าเครื่องมือค้นหาต้องดึงข้อมูลหน้าเว็บเพื่อดูแท็กนี้ ไม่มีอะไรต้องกังวล ฉันคิดว่าคุณสามารถให้บริการในฟิลด์ X-Robots HTTP และแสดงเนื้อหาหน้าว่างได้ อย่างไรก็ตามเมื่อถึงจุดนั้นคุณสามารถคืน 403 Forbidden, 404 Not Found หรือ 410 Gone ได้อย่างง่ายดาย โปรดทราบว่า 410 Gone หมายถึง URL ที่ถูกวางแผนไว้ว่าจะหายไปตลอดกาล สิ่งนี้มีความสำคัญกับเครื่องมือค้นหาบางประเภท

การบล็อกเครื่องมือไม่ให้รวบรวมข้อมูลหน้าเช่นการยกเว้นหน้าใน robots.txt จะไม่ทำงาน Robots.txt กำหนดทิศทางการรวบรวมข้อมูลเท่านั้นไม่ใช่การจัดทำดัชนี เครื่องมือค้นหาอาจยังคงสร้างผลการค้นหาสำหรับเพจโดยอนุมานเนื้อหาของเพจจากลิงก์และข้อมูลที่เก็บถาวร