¿Cómo / por qué se indexó la versión sin www de la página de mi sitio?

Aug 21 2020

Por alguna razón, hay 3 o 4 páginas en mi sitio para las que Google ha indexado la versión sin www.

Redirijo 301 todas las solicitudes a https y www en .htaccess, pero me resulta muy extraño que cuando busco My Company Name demoeso, el único resultado para la página correspondiente en mi sitio no tiene www ( https://my-company-name.com/request-demo). Sin embargo si busco My Company Name free trial, el resultado de la página correspondiente hace incluirá la www ( https://www.my-company-name.com/free-trial). Las páginas son casi idénticas en código ... de hecho, la página de prueba gratuita se creó clonando la página de demostración en WordPress.

Ahora que tengo el redireccionamiento a www, esto ya no es problemático, pero en aras de la coherencia, la curiosidad y para evitar la introducción de problemas potenciales en el futuro (para SEO, la versión www de esta página se considerará "contenido duplicado" ?), Me encantaría "des-indexar" la versión sin www y que los resultados de la búsqueda muestren (y enlacen a) la versión www.

¿Alguna idea sobre cómo puedo lograrlo? Y quizás lo más importante, ¿alguien tiene una explicación de por qué / cómo está sucediendo esto?

Respuestas

4 MrWhite Aug 21 2020 at 18:45

Si hay algún enlace a la versión no www de la URL desde cualquier lugar , puede resultar en la indexación de la URL no canónica.

Comprueba también que tienes:

  • el rel="canonical"elemento de enlace correcto en sus páginas (y / o Linkencabezado de respuesta HTTP).

  • la URL correcta indicada en sus mapas de sitio XML, feeds RSS, etc.

  • el conjunto de preferencias correcto en Google Search Console: www vs non-www

Ahora que tengo el redireccionamiento a www, esto ya no es problemático.

Aunque todavía necesita asegurarse de que no tiene enlaces internos a la URL no canónica.

3 FluffyKitten Aug 22 2020 at 01:47

MrWhite ha dado una buena respuesta sobre por qué podría estar sucediendo esto, pero solo quería abordar la otra parte que mencionaste:

... y evitando la introducción de problemas potenciales en el futuro (para SEO, ¿la versión www de esta página se considerará "contenido duplicado"?), me encantaría "des-indexar" la versión sin www y hacer la búsqueda Los resultados muestran (y enlazan a) la versión www.

Si se indexan tanto las páginas www como las que no lo son, entonces sí, Google consideraría este contenido duplicado.

Sin embargo, si la redirección 301 está configurada correctamente, Google eventualmente recogerá esta redirección y cambiará la lista en las SERP en lugar de indexar ambas.

Puede tomar algún tiempo para que lo recoja automáticamente, así que sugiero enviar la página www para volver a indexar usando Google Search Console.

También puede usar Google Search Console para solicitar que la página que no es www se elimine de los listados; podría ser una acción drástica, pero si le preocupa el contenido duplicado o que el redireccionamiento no esté funcionando correctamente, podría valer la pena. considerando después de tomar los pasos que MrWhite describió en su respuesta.