मेरी वेबसाइट में 10 से कम पृष्ठ हैं: मेरे साइटमैप में 448 URL क्यों खोजे गए हैं?

Dec 12 2020

मैंने Google Search Console में साइटमैप सबमिट करके अपनी वेबसाइट का SEO सुधारने का प्रयास किया है।

स्थिति एक सफल है, लेकिन मैंने अपनी वेबसाइट पर 10 से कम पृष्ठों वाले 448 URL खोजे हैं: clientsforcounsellors.com/sitemap.xml

इसके अलावा, जब मैं पता बार में अपना डोमेन नाम टाइप करता हूं, उसके बाद किसी भी स्लग, जैसे क्लाइंटफोर्सऑनसेलर्स.com/sdlkgr, मैं 404 पेज प्रदर्शित होने के बजाय अपने होमपेज पर रीडायरेक्ट होता हूं।

यहाँ क्या समस्या है? क्या नरम 404 का इससे कोई लेना-देना है?

जवाब

4 StephenOstermiller Dec 12 2020 at 18:38

सॉफ्ट 404 का इस समस्या से कोई लेना-देना नहीं है, हालांकि प्रयोज्य और एसईओ के लिए आपको होम पेज पर रीडायरेक्ट करने के बजाय 404 त्रुटियां दिखानी चाहिए।

यह साइटमैप क्रॉलर द्वारा उत्पन्न किया गया प्रतीत होता है। आपको ऐसा नहीं करना चाहिए। Google का कहना है कि यह एक अच्छा विचार नहीं है: Google साइट को एक साइटमैप फ़ाइल बनाने के लिए आपकी साइट को क्रॉल नहीं करता है । यदि आपकी साइट पर केवल 10 पृष्ठ हैं, तो आपके पास एक साइटमैप होना चाहिए जो केवल उन 10 पृष्ठों को सूचीबद्ध करता है। 10 पृष्ठों पर, आप उस साइटमैप को हाथ से बना सकते हैं। आपकी सामग्री प्रबंधन प्रणाली में आपके डेटाबेस से आपके लिए साइटमैप बनाने वाले प्लगइन्स भी हो सकते हैं।

आपको यह भी पता होना चाहिए कि XML साइटमैप का SEO से कोई लेना देना नहीं है। वे आपके सभी पृष्ठों को क्रॉल करने के लिए Googlebot प्राप्त कर सकते हैं, हालांकि वे आपकी सामग्री को अनुक्रमित या अच्छी तरह से रैंक करने में मदद नहीं करते हैं। यदि आपकी साइट क्रॉलेबल है (और आपका प्रतीत होता है), तो Googlebot आपके सभी पेजों को वैसे भी ढूंढ और क्रॉल कर सकता है। XML साइटमैप के लाभ Google खोज कंसोल में अतिरिक्त आँकड़े हैं और Google के लिए एक संकेत है जिसके बारे में आप जो URL पसंद करते हैं (एक बार जब आप साइटमैप को केवल अपने 10 पृष्ठों तक ले जाते हैं।) अधिक विवरण के लिए साइटमैप विरोधाभास देखें।

अपनी वेबसाइट के विरुद्ध SEO क्रॉलर चलाना सार्थक है। यह उन समस्याओं को उजागर कर सकता है जिन्हें ठीक करने की आवश्यकता है। आपके साइटमैप को बनाने वाले क्रॉलर को आपकी साइट को क्रॉल करने में समस्याओं का सामना करना पड़ा। Googlebot और अन्य खोज इंजन क्रॉलर को भी ये समस्याएं होने वाली हैं। आपके साइटमैप में शामिल किए गए कुछ पृष्ठों पर एक नज़र डालें:

  • /blog/counsellor-needs-website.html
  • /blog/blog/counsellor-needs-website.html
  • /blog/blog/blog/counsellor-needs-website.html
  • /blog/blog/blog/blog/counsellor-needs-website.html
  • /blog/blog/blog/blog/blog/counsellor-needs-website.html
  • ...

एक ही पृष्ठ /blogको पथ में अधिक से अधिक दोहराव के साथ कई बार क्यों शामिल किया जा रहा है? आपने अपनी साइट पर लिंक तोड़ दिए हैं। आपके लिंक जैसे दिखते हैं

<a href="blog/counsellor-needs-website.html">

जो एक सापेक्ष लिंक है। एक बार जब आप blog/पहले से ही निर्देशिका में होते हैं , तो यह एक और ब्लॉग निर्देशिका को जोड़ देगा। इसे "रूट रिलेटिव लिंक" में बदलना बेहतर होगा जो स्लैश से शुरू होता है। उस प्रकार का लिंक वर्तमान पृष्ठ के बजाय आपके डोमेन नाम के सापेक्ष है:

<a href="/blog/counsellor-needs-website.html">

आपको अपनी छवियों और CSS के साथ समान समस्याएं हैं। वे सभी रूट रिश्तेदार जोड़ने का उपयोग करना चाहिए

  • <img src="/images/main/money-icon.png" की बजाय <img src="images/main/money-icon.png"
  • href="/css/style.css" की बजाय href="css/style.css"

देखें कि HTML URL में प्रमुख स्लैश का उद्देश्य क्या है? और वेबसाइट क्रॉलर उन पृष्ठों के लिए 404 त्रुटियों को लौटाता है जो डुप्लिकेट निर्देशिकाओं में मौजूद नहीं होते हैं , जिसमें किसी को बहुत ही समस्या होती है, लेकिन उनके "हमारे बारे में" पृष्ठ के साथ।


अब जब आपकी साइट इन लिंक्स के साथ प्रकाशित हो गई है, तो आपको सभी विकृत URL को उनके पसंदीदा रूप में पुनर्निर्देशित करना चाहिए। यदि आप अपाचे का उपयोग कर रहे हैं तो आपको अपनी .htaccessफ़ाइल के शीर्ष पर ऐसा कुछ करने में सक्षम होना चाहिए :

RewriteEngine On
# Redirect /blog/blog/blog/... URLs
RewriteRule (blog/)+((blog|images|css)/.*) /$2 [R=301,L]

कहा पे

  • RewriteEngine Onmod_rewrite के नियमों को सक्षम करता है
  • (blog/)+एक या अधिक अतिरिक्त /blogनिर्देशिकाओं से मेल खाता है
  • (blog|images|css) अंतिम निर्देशिका से मेल खाता है जिसे रखा जाना चाहिए
  • /.* उसके बाद आने वाली हर चीज से मेल खाता है
  • $2कोष्ठक के दूसरे सेट में सब कुछ मेल खाता है ( (blog|images|css)/.*)
  • [R=301] यह एक स्थायी पुनर्निर्देशित करता है
  • [L] इसे अंतिम पुनर्लेखन नियम बनाता है (इसलिए बाद में कोई भी नियम फिर से लागू करने की कोशिश नहीं करता)