MongoDB - पाठ खोज

2.4 संस्करण से शुरू, MongoDB ने स्ट्रिंग सामग्री के अंदर खोज करने के लिए टेक्स्ट इंडेक्स का समर्थन करना शुरू किया। Text Search उपजी शब्दों को रोककर स्ट्रिंग क्षेत्रों में निर्दिष्ट शब्दों को देखने के लिए स्टेमिंग तकनीकों का उपयोग करता है a, an, the, आदि वर्तमान में, MongoDB लगभग 15 भाषाओं का समर्थन करता है।

पाठ खोज सक्षम करना

प्रारंभ में, पाठ खोज एक प्रयोगात्मक विशेषता थी लेकिन संस्करण 2.6 से शुरू होकर, कॉन्फ़िगरेशन डिफ़ॉल्ट रूप से सक्षम है।

पाठ सूचकांक बनाना

निम्नलिखित दस्तावेज़ पर विचार करें posts पोस्ट पाठ और इसके टैग युक्त संग्रह -

> db.posts.insert({
   "post_text": "enjoy the mongodb articles on tutorialspoint",
   "tags": ["mongodb", "tutorialspoint"]
}
{
	"post_text" : "writing tutorials on mongodb",
	"tags" : [ "mongodb", "tutorial" ]
})
WriteResult({ "nInserted" : 1 })

हम post_text फ़ील्ड पर एक टेक्स्ट इंडेक्स बनाएंगे ताकि हम अपने पोस्ट के टेक्स्ट के अंदर खोज कर सकें -

>db.posts.createIndex({post_text:"text"})
{
	"createdCollectionAutomatically" : true,
	"numIndexesBefore" : 1,
	"numIndexesAfter" : 2,
	"ok" : 1
}

पाठ सूचकांक का उपयोग करना

अब जब हमने post_text फ़ील्ड पर टेक्स्ट इंडेक्स बनाया है, तो हम शब्द वाले सभी पदों की खोज करेंगे tutorialspoint उनके पाठ में।

> db.posts.find({$text:{$search:"tutorialspoint"}}).pretty()
{
	"_id" : ObjectId("5dd7ce28f1dd4583e7103fe0"),
	"post_text" : "enjoy the mongodb articles on tutorialspoint",
	"tags" : [
		"mongodb",
		"tutorialspoint"
	]
}

उपरोक्त आदेश में शब्द होने वाले निम्नलिखित परिणाम दस्तावेज दिए गए हैं tutorialspoint उनके पाठ में -

{ 
   "_id" : ObjectId("53493d14d852429c10000002"), 
   "post_text" : "enjoy the mongodb articles on tutorialspoint", 
   "tags" : [ "mongodb", "tutorialspoint" ]
}

पाठ सूचकांक हटाना

मौजूदा टेक्स्ट इंडेक्स को हटाने के लिए, पहले निम्नलिखित क्वेरी का उपयोग करके इंडेक्स का नाम खोजें -

>db.posts.getIndexes()
[
	{
		"v" : 2,
		"key" : {
			"_id" : 1
		},
		"name" : "_id_",
		"ns" : "mydb.posts"
	},
	{
		"v" : 2,
		"key" : {
			"fts" : "text",
			"ftsx" : 1
		},
		"name" : "post_text_text",
		"ns" : "mydb.posts",
		"weights" : {
			"post_text" : 1
		},
		"default_language" : "english",
		"language_override" : "language",
		"textIndexVersion" : 3
	}
]
>

उपरोक्त क्वेरी से अपने सूचकांक का नाम प्राप्त करने के बाद, निम्न कमांड चलाएँ। यहाँ,post_text_text सूचकांक का नाम है।

>db.posts.dropIndex("post_text_text")
{ "nIndexesWas" : 2, "ok" : 1 }