İlişkilendirme bonusu (+100 rep) ve site bağlantı kesme hatası?
Hata 1: Görünür bir neden olmadan ilişkilendirme bonusları.
Bu kullanıcı yığınımıza 101 temsilci ile katıldı (ilişkilendirme bonusundan). Tekrarı kontrol ederken 101 tekrarlı başka bir yığın ve 1 tekrarlı bir yığın görüyorum.
101 diğer yığın biraz tesadüfi gibiydi ben kontrol yüzden (? Muhtemelen tam olarak 10 upvotes.) - hiç bir aktivite. Yani bu da bir dernek bonusuydu.
Üçüncü sitede, kullanıcının sayfası 404'tür.
Ben de "belki geçici bir yasaklama vardır ve 404/1 tekrarı yasağın bir eseri" diye düşündüm. Bu yüzden o siteyi birkaç şekilde aradım; hiçbir şey değil.
Hata 2: Site hesapları birbirinden ayrılmış / bağlantısı kesilmiş
Bulduğum şey, diğerlerinden "ayrılmış" dördüncü bir site hesabıydı, diğer 3 yığını listelemiyor ve onlar da listelemiyor. (kullanıcı simgesinin aynı olduğunu unutmayın; mor köşeli çift ayraçlar). Yine dernek bonusu; yine onu desteklemek için yeterli site etkinliği yok.
Tinkeringbell'in tartıştığı gibi, "ada" site hesabının aslında gizli bir hesap olduğunu kanıtlıyor. Bunu, [iyi huylu] [4] bir arama motorunda genel bir web aramasıyla keşfettim. Dolayısıyla bu, bunu daha zor hale getirmek için bir hata raporu / özellik isteğine dönüşüyor olabilir.
Yanıtlar
İnsanlar dernek bonuslarını koruyabilirler çünkü bu, 200 itibar kazandığınız profile değil, ağ hesabına bağlı :
Her bir profili ve stackexchange.com'daki profili silseniz bile, temel ağ hesabınız hala var ve ilişkilendirme bonusunun saklandığı yer burasıdır.
Bu durumda, bir zamanlar 200'den fazla itibara sahip olan silinmiş bir profil var ve bu da artık bu kullanıcının bir site için bir profil oluşturduğu her seferinde ilişkilendirme bonusunu kazanmasını sağlıyor.
Veri bilimi profili silinmiş görünüyor, ancak yine de görünmesi biraz tuhaf. Görünüşe göre, bunun hala ağ profilleri listesinden silinmesi gerektiği anlamına gelebilecek bir tür önbelleğe alma var .
İkinci 'böcek' ise, bu toplulukların gizlenmesinden kaynaklanıyor . Moderatörler hala bunları görebiliyor , bundan eminim.
Tinkeringbell'in tartıştığı gibi, gizlenmesi gereken şeyler görüyorum.
Böyle sorunları yaşamak için çözerim, böylece bunun nasıl olduğunu ve bu konuda ne yapacağımı konuşabilirim. Bunu, iyi huylu genel bir web arama motorunda keşfettim , yani arama motorlarında hem web örümceklerini hem de içeriğin dahil edilmesini yönetme kurallarına uyuyor . Bunların gönüllü kurallar olduğunu ve siyah şapkalı bir örümceğin itaat etmeyebileceğini unutmayın.
Örümcek onu nasıl buldu
- StackExchange'de bir yerde sayfaya çağdaş bir bağlantı buldu ,
- üçüncü taraf bir web sitesinde çağdaş bir bağlantı buldu ,
- o zaten biliyordum geçmiş tarama gelen sayfanın varlığı hakkında.
Bunları 3 vakaya böldüm, böylece yaygın yanlış anlamaları ele alabilirim.
İkinci durum, bir web yöneticisinin (yani StackExchange) herhangi bir dahili bağlantı oluşturmadığı, ancak dışarıdan birinin yaptığı durumdur. Birinin kullanıcı sayfasının sfu.edu adresindeki Web sayfasına bağlantı verdiğini varsayalım . SFU, onların haberi olmadan, Referer da dahil olmak üzere web günlüklerinden toplu verileri yayınlar . Arama motoru, bunları URL keşfi için zengin bir veri kaynağı olarak kabul eder (bağlantı alaka düzeyi diğer adıyla PageRank için olmasa da). SFU kullanır rel=nofollow
, ama yani değil bir "göz ardı bağlantı alaka" yönergesi bir "bağlantısını takip etmeyin" yönergesi.
Üçüncü vaka, buradaki en olası durumdur. Bir arama motorunun bir URL'si olduğunda, URL'ye giden tüm bağlantılar kaybolduğunda URL'yi bırakmaz. Bunun bağlantı alaka düzeyi üzerinde bir etkisi vardır, ancak bu yalnızca sıralamayı etkiler . Arama sonuçlarının sadece onlarca nerede özgü yeterliyse var , hatta düşük rütbeli sayfa şekilde göstereceğiz.
İyi huylu motorlardan nasıl gizlenir
... StackExchange'in istediği varsayılır. Her iki yönde de argümanlar var.
En iyi seçenek, "noindex" HTML meta etiketidir (veya HTTP'deki X-Robots eşdeğeri):
<meta name="robots" content="noindex">
Bu etiket "bu sayfayı arama sonuçlarına dahil etme" diyor. Etikette, nofollow
( aslında "tarayıcının bu sayfada bulunan bağlantıları göz ardı etmesi gerektiği anlamına gelir" gibi) gibi öğeler de olabilir rel=
.
Bu etiketi görebilmek için arama motorunun sayfayı getirmesi gerektiğini unutmayın; endişelenecek bir şey yok. Sanırım onu X-Robots HTTP alanında sunabilir ve boş sayfa içeriği sunabilirsiniz. Ancak bu noktada, kolayca 403 Yasak, 404 Bulunamadı veya 410 Gitti döndürebilirsiniz. 410 Gitti'nin URL'nin sonsuza kadar gitmesinin planlandığı anlamına geldiğini unutmayın; bu bazı arama motorları için önemlidir.
Motorun bir sayfayı taramasını engellemek, örneğin sayfayı robots.txt dosyasında hariç tutmak işe yaramayacaktır. Robots.txt dizine eklemeyi değil, yalnızca taramayı yönlendirir. Bir arama motoru, sayfa içeriğini bağlantılardan ve arşivlenmiş verilerden çıkararak yine de sayfa için bir arama sonucu oluşturabilir.