Cómo excluir o etiquetar contenido generado por el usuario que comparte el nombre de host con un sitio de origen
Estoy ejecutando una aplicación SaaS example.com
, que además de sus páginas de destino tiene varias páginas de contenido "propio", por ejemplo:
example.com/features
example.com/pricing
example.com/support
Una vez que un cliente se registra, el diseño de la aplicación es que pueden nombrar y usar una subruta, donde administran el contenido personalizado. Por ejemplo:
example.com/joes-place
example.com/bobs-place
Para ver un ejemplo del mundo real de este patrón, mira GitHub: te registras y luego obtienes github.com/:username
.
Desafío: estoy buscando las mejores prácticas para distinguir claramente el contenido de origen (me gusta /pricing
) del contenido de terceros (me gusta /joes-place
), cuando se trata de búsqueda y SEO. Específicamente:
- Google ha decidido ocasionalmente que los clientes auto-onebox les gusten
/joes-place
; Me gustaría que no hiciera eso. - Quiero que los motores de búsqueda sigan rastreando contenido de terceros, ya que es importante para los clientes que aparezcan en la búsqueda.
- Por motivos de vanidad / estética, no puedo mover contenido de terceros a su propio dominio (por ejemplo, quiero seguir haciendo lo que hace github).
Hasta ahora lo que he hecho:
- El contenido propio y del cliente utiliza diferentes cuentas de Google Analytics
- El contenido de origen está disponible
sitemap.xml
, el contenido del cliente no se menciona en absoluto.
¿Existen otras prácticas recomendadas que debería seguir aquí?
Respuestas
Puede excluir el contenido de terceros de la búsqueda o incluirlo. Por lo que sé, no existe una forma especial de etiquetar desde la perspectiva de un motor de búsqueda. Desde la perspectiva del usuario, puede diferenciar visualmente entre contenido propio y de terceros.
A continuación se muestran mis opiniones en respuesta a sus puntos.
Google ha decidido ocasionalmente que los clientes auto-onebox les gusten
/joes-place
; Me gustaría que no hiciera eso.
No creo que puedas controlar eso. Sin embargo, Google solo muestra un cuadro cuando cree que el fragmento / extracto responde bien a la consulta.
Quiero que los motores de búsqueda sigan rastreando contenido de terceros, ya que es importante para los clientes que aparezcan en la búsqueda.
A menos que esté evitando deliberadamente el rastreo (como usar robots.txt), no debe preocuparse. (Supongo que el contenido de terceros no está detrás de los inicios de sesión).
Por motivos de vanidad / estética, no puedo mover contenido de terceros a su propio dominio (por ejemplo, quiero seguir haciendo lo que hace github).
Eso está perfectamente bien. Nunca tienes que buscar dominios separados. (De hecho, tener un solo dominio puede ayudar a aumentar la autoridad del dominio de manera colectiva. El contenido excepcional en páginas de terceros puede ayudar a la autoridad del dominio general).
El contenido propio y del cliente utiliza diferentes cuentas de Google Analytics
GA no tiene nada que ver con SEO.
El contenido de origen está en sitemap.xml, el contenido del cliente no se menciona en absoluto.
El mapa del sitio no es una preocupación siempre que el contenido de terceros se pueda encontrar en lugares como la página de inicio, páginas populares, etc. Google nunca puede encontrar páginas huérfanas.
Ref: La paradoja del mapa del sitio
Parece que está buscando evitar que estas páginas de "terceros" aparezcan como fragmentos destacados o resultados. Lily Ray de Search Engine Land publicó una recomendación sobre eso:
Para evitar que solo aparezca contenido en fragmentos destacados, pero permitir que se muestren fragmentos regulares, experimente con la etiqueta max-snippet, que se utiliza para especificar la cantidad máxima de caracteres que se pueden mostrar en un fragmento. Esto permite que las meta descripciones se sigan mostrando, pero bloquea la aparición de otro contenido en los fragmentos destacados, siempre que el contenido seleccionado tenga más caracteres que el fragmento máximo especificado.
(https://www.searchenginejournal.com/google-featured-snippets-guide/351272/#:~:text=To%20only%20prevent%20content%20from%20appearing)
Dado que el límite superior de una metadescripción mostrada tiene alrededor de 160 caracteres de longitud, intentaría poner la siguiente etiqueta en las secciones <head> de esas páginas de terceros:
<meta name="robots" content="max-snippet:160">
Editar : si sus metadescripciones son más largas que eso por cualquier motivo, entonces averigüe cuál es la más larga y use su valor de longitud. ¡Sin embargo, no deberían serlo! ;)