Bonus d'association (+100 rep) et bug de déconnexion du site?

Aug 17 2020

Bug 1: bonus d'association sans raison apparente.

Cet utilisateur a rejoint notre stack avec 101 rep (du bonus d'association). En vérifiant le représentant, je vois une autre pile avec 101 répétitions et une pile avec 1 répétition.

Le 101 sur l'autre pile semblait un peu une coïncidence (exactement 10 votes positifs? Peut-être.) Alors j'ai vérifié - aucune activité. C'était donc aussi un bonus d'association.

Sur le troisième site, la page de l' utilisateur est 404.

Alors j'ai pensé "bien, peut-être qu'il y a une interdiction temporaire et 404/1 rep est un artefact de l'interdiction". J'ai donc cherché sur ce site de plusieurs manières; rien.

Bug 2: comptes de site séparés / déconnectés les uns des autres

Ce que j'ai trouvé, c'est un quatrième compte de site qui est "isolé" des autres, il ne répertorie pas les 3 autres piles et ils ne le listent pas. (notez que l'icône de l'utilisateur est la même; chevrons violets). Encore une fois le bonus d'association; encore une fois pas assez d'activité du site pour le soutenir.

Comme le dit Tinkeringbell, cela prouve que le compte de site "insulaire" est en fait un compte caché. J'ai découvert cela grâce à une recherche générale sur le Web sur un moteur de recherche [bien élevé] [4]. Cela peut donc se transformer en un rapport de bogue / une demande de fonctionnalité pour rendre cela plus difficile.

Réponses

11 Tinkeringbell Aug 17 2020 at 18:43

Les gens peuvent conserver leur bonus d'association, car cela n'est pas lié au profil sur lequel vous gagnez 200 points de réputation, mais au compte réseau :

Même si vous supprimez chaque profil et celui sur stackexchange.com, votre compte réseau sous-jacent existe toujours, et c'est là que le bonus d'association est stocké.

Donc, dans ce cas, il y a un profil supprimé qui avait autrefois plus de 200 points de réputation, ce qui garantit désormais que chaque fois que cet utilisateur crée un profil pour un site, il gagne le bonus d'association.

Le profil datascience semble supprimé, même si c'est un peu étrange, il apparaît toujours. Il semble y avoir une sorte de mise en cache impliquée qui peut signifier que cela doit encore être supprimé de la liste des profils réseau.

Quant au deuxième «bug», il est causé par la dissimulation des communautés . Les modérateurs peuvent toujours les voir , c'est comme ça que j'en suis sûr.

5 Harper-ReinstateMonica Aug 18 2020 at 00:16

Pendant que Tinkeringbell discute, je vois des choses censées être cachées.

Je résous des problèmes comme celui-là pour gagner ma vie, donc je peux expliquer comment cela s'est produit et comment y remédier. J'ai découvert cela dans un moteur de recherche Web général qui se comporte bien , ce qui signifie qu'il obéit aux règles pour diriger à la fois l'araignée Web et l'inclusion de contenu dans les moteurs de recherche. Notez que ce sont des règles volontaires et qu'une araignée blackhat ne peut pas obéir.

Comment l'araignée l'a trouvée

il a trouvé un lien contemporain vers la page quelque part sur StackExchange,
il a trouvé un lien contemporain sur un site Web tiers,
il connaissait déjà l'existence de la page grâce à l'exploration passée.

Je les ai divisés en 3 cas afin de pouvoir aborder les idées fausses courantes.

Le deuxième cas est celui où un webmaster (ie StackExchange) ne crée aucun lien interne, mais un étranger le fait. Supposons que la page utilisateur de quelqu'un renvoie à sa page Web sur sfu.edu . À leur insu, SFU publie des données agrégées à partir de leurs journaux Web, y compris Referer . Le moteur de recherche les considère comme une source de données riche, pour la découverte d'URL (mais pas pour la pertinence des liens aka PageRank). SFU utilise rel=nofollow, mais ce n'est pas une directive «ne pas suivre le lien», c'est une directive «ignorer la pertinence du lien».

Le troisième cas est le plus probable ici. Une fois qu'un moteur de recherche a une URL, il ne supprime pas l'URL lorsque tous les liens vers l'URL disparaissent. Cela a un effet sur la pertinence du lien, mais cela n'affecte que le classement . Si le chercheur est suffisamment spécifique là où seulement des dizaines de résultats existent , même une page de bas classement apparaîtra.

Comment le cacher des moteurs bien comportés

... En supposant que StackExchange le souhaite. Il y a des arguments dans les deux sens.

La meilleure option est la balise meta HTML "noindex" (ou l'équivalent X-Robots en HTTP), en tant que telle:

  <meta name="robots" content="noindex">

Cette balise indique "ne pas inclure cette page dans les résultats de recherche". La balise peut également contenir des éléments tels que nofollow(ce qui signifie en fait "le robot doit ignorer les liens trouvés sur cette page", contrairement à rel=).

Notez que le moteur de recherche doit récupérer la page pour voir cette balise; il n'y a pas de quoi s'inquiéter. Je suppose que vous pourriez le servir dans le champ HTTP X-Robots et servir du contenu de page vierge. Cependant, à ce stade, vous pouvez tout aussi facilement renvoyer 403 Forbidden, 404 Not Found ou 410 Gone. Notez qu'un 410 Gone signifie que l'URL est censée disparaître pour toujours; c'est important pour certains moteurs de recherche.

Empêcher le moteur d'explorer une page, par exemple en excluant la page dans le fichier robots.txt, ne fonctionnera pas. Robots.txt dirige uniquement l'exploration, pas l'indexation. Un moteur de recherche peut toujours créer un résultat de recherche pour la page, en déduisant le contenu de la page à partir de liens et de données archivées.