मेरी वेबसाइट में 10 से कम पृष्ठ हैं: मेरे साइटमैप में 448 URL क्यों खोजे गए हैं?
मैंने Google Search Console में साइटमैप सबमिट करके अपनी वेबसाइट का SEO सुधारने का प्रयास किया है।
स्थिति एक सफल है, लेकिन मैंने अपनी वेबसाइट पर 10 से कम पृष्ठों वाले 448 URL खोजे हैं: clientsforcounsellors.com/sitemap.xml
इसके अलावा, जब मैं पता बार में अपना डोमेन नाम टाइप करता हूं, उसके बाद किसी भी स्लग, जैसे क्लाइंटफोर्सऑनसेलर्स.com/sdlkgr, मैं 404 पेज प्रदर्शित होने के बजाय अपने होमपेज पर रीडायरेक्ट होता हूं।
यहाँ क्या समस्या है? क्या नरम 404 का इससे कोई लेना-देना है?
जवाब
सॉफ्ट 404 का इस समस्या से कोई लेना-देना नहीं है, हालांकि प्रयोज्य और एसईओ के लिए आपको होम पेज पर रीडायरेक्ट करने के बजाय 404 त्रुटियां दिखानी चाहिए।
यह साइटमैप क्रॉलर द्वारा उत्पन्न किया गया प्रतीत होता है। आपको ऐसा नहीं करना चाहिए। Google का कहना है कि यह एक अच्छा विचार नहीं है: Google साइट को एक साइटमैप फ़ाइल बनाने के लिए आपकी साइट को क्रॉल नहीं करता है । यदि आपकी साइट पर केवल 10 पृष्ठ हैं, तो आपके पास एक साइटमैप होना चाहिए जो केवल उन 10 पृष्ठों को सूचीबद्ध करता है। 10 पृष्ठों पर, आप उस साइटमैप को हाथ से बना सकते हैं। आपकी सामग्री प्रबंधन प्रणाली में आपके डेटाबेस से आपके लिए साइटमैप बनाने वाले प्लगइन्स भी हो सकते हैं।
आपको यह भी पता होना चाहिए कि XML साइटमैप का SEO से कोई लेना देना नहीं है। वे आपके सभी पृष्ठों को क्रॉल करने के लिए Googlebot प्राप्त कर सकते हैं, हालांकि वे आपकी सामग्री को अनुक्रमित या अच्छी तरह से रैंक करने में मदद नहीं करते हैं। यदि आपकी साइट क्रॉलेबल है (और आपका प्रतीत होता है), तो Googlebot आपके सभी पेजों को वैसे भी ढूंढ और क्रॉल कर सकता है। XML साइटमैप के लाभ Google खोज कंसोल में अतिरिक्त आँकड़े हैं और Google के लिए एक संकेत है जिसके बारे में आप जो URL पसंद करते हैं (एक बार जब आप साइटमैप को केवल अपने 10 पृष्ठों तक ले जाते हैं।) अधिक विवरण के लिए साइटमैप विरोधाभास देखें।
अपनी वेबसाइट के विरुद्ध SEO क्रॉलर चलाना सार्थक है। यह उन समस्याओं को उजागर कर सकता है जिन्हें ठीक करने की आवश्यकता है। आपके साइटमैप को बनाने वाले क्रॉलर को आपकी साइट को क्रॉल करने में समस्याओं का सामना करना पड़ा। Googlebot और अन्य खोज इंजन क्रॉलर को भी ये समस्याएं होने वाली हैं। आपके साइटमैप में शामिल किए गए कुछ पृष्ठों पर एक नज़र डालें:
/blog/counsellor-needs-website.html
/blog/blog/counsellor-needs-website.html
/blog/blog/blog/counsellor-needs-website.html
/blog/blog/blog/blog/counsellor-needs-website.html
/blog/blog/blog/blog/blog/counsellor-needs-website.html
- ...
एक ही पृष्ठ /blog
को पथ में अधिक से अधिक दोहराव के साथ कई बार क्यों शामिल किया जा रहा है? आपने अपनी साइट पर लिंक तोड़ दिए हैं। आपके लिंक जैसे दिखते हैं
<a href="blog/counsellor-needs-website.html">
जो एक सापेक्ष लिंक है। एक बार जब आप blog/
पहले से ही निर्देशिका में होते हैं , तो यह एक और ब्लॉग निर्देशिका को जोड़ देगा। इसे "रूट रिलेटिव लिंक" में बदलना बेहतर होगा जो स्लैश से शुरू होता है। उस प्रकार का लिंक वर्तमान पृष्ठ के बजाय आपके डोमेन नाम के सापेक्ष है:
<a href="/blog/counsellor-needs-website.html">
आपको अपनी छवियों और CSS के साथ समान समस्याएं हैं। वे सभी रूट रिश्तेदार जोड़ने का उपयोग करना चाहिए
<img src="/images/main/money-icon.png"
की बजाय<img src="images/main/money-icon.png"
href="/css/style.css"
की बजायhref="css/style.css"
देखें कि HTML URL में प्रमुख स्लैश का उद्देश्य क्या है? और वेबसाइट क्रॉलर उन पृष्ठों के लिए 404 त्रुटियों को लौटाता है जो डुप्लिकेट निर्देशिकाओं में मौजूद नहीं होते हैं , जिसमें किसी को बहुत ही समस्या होती है, लेकिन उनके "हमारे बारे में" पृष्ठ के साथ।
अब जब आपकी साइट इन लिंक्स के साथ प्रकाशित हो गई है, तो आपको सभी विकृत URL को उनके पसंदीदा रूप में पुनर्निर्देशित करना चाहिए। यदि आप अपाचे का उपयोग कर रहे हैं तो आपको अपनी .htaccess
फ़ाइल के शीर्ष पर ऐसा कुछ करने में सक्षम होना चाहिए :
RewriteEngine On
# Redirect /blog/blog/blog/... URLs
RewriteRule (blog/)+((blog|images|css)/.*) /$2 [R=301,L]
कहा पे
RewriteEngine On
mod_rewrite के नियमों को सक्षम करता है(blog/)+
एक या अधिक अतिरिक्त/blog
निर्देशिकाओं से मेल खाता है(blog|images|css)
अंतिम निर्देशिका से मेल खाता है जिसे रखा जाना चाहिए/.*
उसके बाद आने वाली हर चीज से मेल खाता है$2
कोष्ठक के दूसरे सेट में सब कुछ मेल खाता है ((blog|images|css)/.*
)[R=301]
यह एक स्थायी पुनर्निर्देशित करता है[L]
इसे अंतिम पुनर्लेखन नियम बनाता है (इसलिए बाद में कोई भी नियम फिर से लागू करने की कोशिश नहीं करता)