Come escludere o taggare i contenuti generati dagli utenti che condividono il nome host con il sito proprietario

Aug 16 2020

Sto eseguendo un'applicazione SaaS example.com, che oltre alle sue pagine di destinazione ha diverse pagine di contenuti "proprietari", ad esempio:

  • example.com/features
  • example.com/pricing
  • example.com/support

Una volta che un cliente si iscrive, il design dell'applicazione è che può nominare e utilizzare un sottopercorso, dove gestiscono i contenuti personalizzati. Per esempio:

  • example.com/joes-place
  • example.com/bobs-place

Per un esempio del mondo reale di questo modello, guarda GitHub: ti iscrivi e poi ricevi github.com/:username.

Sfida: sto cercando le migliori pratiche per distinguere chiaramente i contenuti di prima parte (come /pricing) da quelli di terze parti (come /joes-place), quando si tratta di ricerca e SEO. Nello specifico:

  • Di tanto in tanto Google ha deciso di auto-onebox come i clienti /joes-place; Mi piacerebbe che non lo facesse.
  • Voglio che i motori di ricerca continuino a eseguire la scansione di contenuti di terze parti, poiché è importante per i clienti che vengano visualizzati nella ricerca.
  • Per motivi di vanità / estetici, non posso spostare contenuti di terze parti nel proprio dominio (ad esempio, voglio continuare a fare ciò che fa GitHub).

Finora cosa ho fatto:

  • I contenuti proprietari e dei clienti utilizzano account Google Analytics diversi
  • Il contenuto di prima parte è presente sitemap.xml, il contenuto del cliente non viene menzionato affatto.

Ci sono altre best practice che dovrei seguire qui?

Risposte

2 Kannan Aug 23 2020 at 12:15

Puoi escludere il contenuto di terze parti dalla ricerca o includere. Da quello che so, non esiste un modo speciale per taggare dal punto di vista di un motore di ricerca. Dal punto di vista dell'utente, puoi distinguere visivamente tra contenuti proprietari e di terze parti.

Di seguito sono riportate le mie opinioni in risposta ai tuoi punti.

Di tanto in tanto Google ha deciso di auto-onebox come i clienti /joes-place; Mi piacerebbe che non lo facesse.

Non credo che tu possa controllarlo. Tuttavia, Google visualizza solo una casella singola ogni volta che ritiene che lo snippet / estratto risponda bene alla query.

Voglio che i motori di ricerca continuino a eseguire la scansione di contenuti di terze parti, poiché è importante per i clienti che vengano visualizzati nella ricerca.

A meno che tu non stia deliberatamente impedendo la scansione (come usare robots.txt), non dovresti essere preoccupato. (Presumo che il contenuto di terze parti non sia dietro gli accessi.)

Per motivi di vanità / estetici, non posso spostare contenuti di terze parti nel proprio dominio (ad esempio, voglio continuare a fare ciò che fa GitHub).

Va benissimo. Non devi mai andare per domini separati. (In effetti, avere un singolo dominio può aiutare ad aumentare l'autorità del dominio in modo collettivo. Contenuti eccezionali in pagine di terze parti possono aiutare l'autorità del dominio generale.)

I contenuti proprietari e dei clienti utilizzano account Google Analytics diversi

GA non ha nulla a che fare con la SEO.

Il contenuto di prima parte è in sitemap.xml, il contenuto del cliente non viene menzionato affatto.

La mappa del sito non è un problema purché il contenuto di terze parti sia rilevabile da luoghi come home page, pagine popolari, ecc. Le pagine orfane non possono essere trovate da Google.

Rif: The Sitemap Paradox

ICapulet Aug 23 2020 at 15:07

Sembra che tu stia cercando di impedire che queste pagine "di terze parti" vengano visualizzate come snippet o risultati in primo piano. Lily Ray di Search Engine Land ha pubblicato una raccomandazione proprio su questo:

Per impedire solo la visualizzazione di contenuti negli snippet in primo piano, ma consentire la visualizzazione di snippet regolari, sperimentare con il tag max-snippet, che viene utilizzato per specificare il numero massimo di caratteri che possono essere visualizzati in uno snippet. Ciò consente la visualizzazione delle meta descrizioni, ma impedisce la visualizzazione di altri contenuti negli snippet in primo piano, a condizione che il contenuto selezionato abbia più caratteri del max-snippet specificato.

(https://www.searchenginejournal.com/google-featured-snippets-guide/351272/#:~:text=To%20only%20prevent%20content%20from%20appearing)

Poiché il limite superiore su una meta-descrizione mostrata è lungo circa 160 caratteri, proverei a inserire il seguente tag nelle sezioni <head> di quelle pagine di terze parti:

<meta name="robots" content="max-snippet:160">

Modifica : se le tue meta-descrizioni sono più lunghe di quella per qualsiasi motivo, individua quella più lunga e usa il suo valore di lunghezza. Non dovrebbero essere però! ;)