私のウェブサイトは10ページ未満です:なぜ私のサイトマップには448の検出されたURLがあるのですか?

Dec 12 2020

Google Search Consoleにサイトマップを送信して、ウェブサイトのSEOを改善しようとしました。

ステータスは成功ですが、ウェブサイトに10ページ未満のURLが448個見つかりました:clientsforcounsellors.com/sitemap.xml

また、アドレスバーにドメイン名を入力し、その後にslug(clientsforcounsellors.com/sdlkgrなど)を入力すると、404ページが表示されるのではなく、ホームページにリダイレクトされます。

ここで何が問題なのですか?ソフト404はこれと関係がありますか?

回答

4 StephenOstermiller Dec 12 2020 at 18:38

ソフト404はこの問題とは何の関係もありませんが、使いやすさとSEOのために、ホームページにリダイレクトする代わりに404エラーを表示する必要があります。

このサイトマップはクローラーによって生成されたようです。あなたはそれをすべきではありません。グーグルはそれは良い考えではないと言います:グーグルはサイトマップファイルを構築するためにあなたのサイトをクロールしないと言います。サイトに10ページしかない場合は、それらの10ページのみをリストするサイトマップが必要です。10ページで、そのサイトマップを手動で作成できます。コンテンツ管理システムには、データベースからサイトマップを作成するプラグインが含まれている場合もあります。

また、XMLサイトマップはSEOとはほとんど関係がないことも知っておく必要があります。Googlebotにすべてのページをクロールさせることはできますが、コンテンツのインデックス作成やランク付けには役立ちません。サイトがクロール可能である(そしてあなたのサイトがクロール可能であるように見える)場合、Googlebotはとにかくすべてのページを見つけてクロールできます。XMLサイトマップの利点は、Google Search Consoleの追加の統計情報と、どのURLを選択するかについてのGoogleへのシグナルです(サイトマップを10ページに絞り込んだ後)。詳細については、サイトマップのパラドックスを参照してください。

あなたのウェブサイトに対してSEOクローラーを実行することは価値があります。これにより、修正が必要な問題を明らかにすることができます。サイトマップを生成したクローラーで、サイトのクロールで問題が発生しました。Googlebotやその他の検索エンジンクローラーにもこれらの問題が発生します。サイトマップに含まれているページのいくつかを見てみましょう。

  • /blog/counsellor-needs-website.html
  • /blog/blog/counsellor-needs-website.html
  • /blog/blog/blog/counsellor-needs-website.html
  • /blog/blog/blog/blog/counsellor-needs-website.html
  • /blog/blog/blog/blog/blog/counsellor-needs-website.html
  • ..。

同じページが何度も含ま/blogれ、パスの繰り返しが増えるのはなぜですか?あなたのサイトのリンクが壊れています。あなたのリンクは次のようになります

<a href="blog/counsellor-needs-website.html">

これは相対リンクです。あなたがでたらblog/すでにディレクトリ、それは別のブログのディレクトリを追加します。これをスラッシュで始まる「ルート相対リンク」に変更することをお勧めします。このタイプのリンクは、現在のページではなく、ドメイン名に関連しています。

<a href="/blog/counsellor-needs-website.html">

画像とCSSにも同様の問題があります。それらはすべてルート相対リンクを使用する必要があります

  • <img src="/images/main/money-icon.png" の代わりに <img src="images/main/money-icon.png"
  • href="/css/style.css" の代わりに href="css/style.css"

HTMLURLでスラッシュをリードする目的は何ですか?を参照してください。また、Webサイトクローラーは、重複するディレクトリを含む存在しないページに対して数百の404エラーを返します。この場合、誰かがほぼ同じ問題を抱えていますが、「会社概要」ページに問題があります。


これらのリンクを使用してサイトが公開されたので、不正な形式のURLをすべて優先形式にリダイレクトする必要があります。Apacheを使用している場合は、.htaccessファイルの先頭で次のようなことができるはずです。

RewriteEngine On
# Redirect /blog/blog/blog/... URLs
RewriteRule (blog/)+((blog|images|css)/.*) /$2 [R=301,L]

どこ

  • RewriteEngine Onmod_rewriteのルールを有効にします
  • (blog/)+1つ以上の追加/blogディレクトリに一致します
  • (blog|images|css) 保持する必要がある最終ディレクトリと一致します
  • /.* 後に続くすべてに一致します
  • $2括弧の2番目のセットのすべてに一致します((blog|images|css)/.*
  • [R=301] 永続的なリダイレクトになります
  • [L] これを最後の書き換えルールにします(したがって、後の書き換えルールも適用しようとしません)