पायथन के साथ एआई - प्राकृतिक भाषा प्रसंस्करण
प्राकृतिक भाषा प्रसंस्करण (एनएलपी) एआई को संदर्भित करता है जो अंग्रेजी जैसी प्राकृतिक भाषा का उपयोग करते हुए बुद्धिमान प्रणालियों के साथ संचार करने की विधि है।
प्राकृतिक भाषा के प्रसंस्करण की आवश्यकता तब होती है जब आप अपने निर्देशों के अनुसार रोबोट जैसी एक बुद्धिमान प्रणाली चाहते हैं, जब आप संवाद आधारित नैदानिक विशेषज्ञ प्रणाली, आदि से निर्णय सुनना चाहते हैं।
एनएलपी के क्षेत्र में कंप्यूटर को मानव भाषाओं के उपयोग के साथ उपयोगी कार्यों में सुधार करना शामिल है। एनएलपी प्रणाली का इनपुट और आउटपुट हो सकता है -
- Speech
- लिखित पाठ
एनएलपी के घटक
इस खंड में, हम एनएलपी के विभिन्न घटकों के बारे में जानेंगे। एनएलपी के दो घटक हैं। घटक नीचे वर्णित हैं -
प्राकृतिक भाषा समझ (NLU)
इसमें निम्नलिखित कार्य शामिल हैं -
दी गई इनपुट को प्राकृतिक भाषा में उपयोगी अभ्यावेदन में मैप करना।
भाषा के विभिन्न पहलुओं का विश्लेषण।
प्राकृतिक भाषा पीढ़ी (एनएलजी)
यह कुछ आंतरिक प्रतिनिधित्व से प्राकृतिक भाषा के रूप में सार्थक वाक्यांशों और वाक्यों के उत्पादन की प्रक्रिया है। इसमें शामिल है -
Text planning - इसमें ज्ञान आधार से संबंधित सामग्री को पुनः प्राप्त करना शामिल है।
Sentence planning - इसमें आवश्यक शब्द चुनना, अर्थपूर्ण वाक्यांश बनाना, वाक्य के स्वर सेट करना शामिल है।
Text Realization - यह वाक्य संरचना में वाक्य योजना की मैपिंग है।
एनएलयू में कठिनाइयाँ
एनएलयू फॉर्म और संरचना में बहुत समृद्ध है; हालाँकि, यह अस्पष्ट है। अस्पष्टता के विभिन्न स्तर हो सकते हैं -
लयात्मक अस्पष्टता
यह शब्द-स्तर जैसे बहुत ही आदिम स्तर पर है। उदाहरण के लिए, शब्द "बोर्ड" को संज्ञा या क्रिया मानते हैं?
सिंटेक्स स्तर अस्पष्टता
एक वाक्य को विभिन्न तरीकों से पार्स किया जा सकता है। उदाहरण के लिए, "उन्होंने लाल टोपी के साथ बीटल उठाया।" - क्या उन्होंने बीटल को उठाने के लिए कैप का इस्तेमाल किया था या उन्होंने लाल रंग की कैप वाली बीटल को उठाया था?
अधिमान्य अस्पष्टता
सर्वनामों का उपयोग करके किसी चीज़ का जिक्र करना। उदाहरण के लिए, रीमा गौरी के पास गई। उसने कहा, "मैं थक गई हूं।" - बिल्कुल थका हुआ कौन है?
एनएलपी शब्दावली
आइए अब हम एनएलपी शब्दावली में कुछ महत्वपूर्ण शब्द देखते हैं।
Phonology - यह व्यवस्थित रूप से ध्वनि के आयोजन का अध्ययन है।
Morphology - यह आदिम सार्थक इकाइयों से शब्दों के निर्माण का अध्ययन है।
Morpheme - यह एक भाषा में अर्थ की एक आदिम इकाई है।
Syntax- यह एक वाक्य बनाने के लिए शब्दों को व्यवस्थित करने को संदर्भित करता है। इसमें वाक्य में और वाक्यांशों में शब्दों की संरचनात्मक भूमिका का निर्धारण भी शामिल है।
Semantics - यह शब्दों के अर्थ और शब्दों को सार्थक वाक्यांशों और वाक्यों में संयोजित करने के तरीके से संबंधित है।
Pragmatics - यह विभिन्न स्थितियों में वाक्यों के उपयोग और समझ से संबंधित है और वाक्य की व्याख्या कैसे प्रभावित होती है।
Discourse - यह इस बात से संबंधित है कि तत्काल पूर्ववर्ती वाक्य अगले वाक्य की व्याख्या को कैसे प्रभावित कर सकता है।
World Knowledge - इसमें दुनिया के बारे में सामान्य ज्ञान शामिल है।
एनएलपी में कदम
यह अनुभाग एनएलपी में विभिन्न चरणों को दर्शाता है।
लेक्सिकल विश्लेषण
इसमें शब्दों की संरचना की पहचान और विश्लेषण करना शामिल है। किसी भाषा के लेक्सिकन का अर्थ है किसी भाषा में शब्दों और वाक्यांशों का संग्रह। लेक्सिकल विश्लेषण txt के पूरे भाग को पैराग्राफ, वाक्यों और शब्दों में विभाजित कर रहा है।
सिंथेटिक विश्लेषण (पार्सिंग)
इसमें व्याकरण के लिए वाक्य में शब्दों का विश्लेषण और शब्दों को शब्दों में व्यवस्थित करना शामिल है जो शब्दों के बीच संबंध को दर्शाता है। “स्कूल जाता है लड़का” जैसे वाक्य को अंग्रेजी के सिंटैक्टिक एनालाइज़र ने खारिज कर दिया है।
शब्दार्थ विश्लेषण
यह पाठ से सटीक अर्थ या शब्दकोश अर्थ निकालता है। पाठ को अर्थपूर्णता के लिए जाँचा जाता है। यह कार्य डोमेन में वाक्यात्मक संरचनाओं और वस्तुओं की मैपिंग द्वारा किया जाता है। सिमेंटिक एनालाइजर वाक्य "हॉट आइसक्रीम" के रूप में अवहेलना करता है।
प्रवचन एकता
किसी भी वाक्य का अर्थ उसके ठीक पहले के वाक्य के अर्थ पर निर्भर करता है। इसके अलावा, यह तुरंत सफल वाक्य का अर्थ भी बताता है।
व्यावहारिक विश्लेषण
इस दौरान, जो कहा गया था, उस पर फिर से व्याख्या की गई कि इसका वास्तव में क्या मतलब है। इसमें भाषा के उन पहलुओं को प्राप्त करना शामिल है जिनके लिए वास्तविक विश्व ज्ञान की आवश्यकता होती है।