प्राकृतिक भाषा प्रसंस्करण - शब्दार्थ विश्लेषण

शब्दार्थ विश्लेषण का उद्देश्य सटीक अर्थ निकालना है, या आप पाठ से शब्दकोष कह सकते हैं। अर्थ विश्लेषक के लिए अर्थ की जांच के लिए शब्दार्थ विश्लेषक का काम है।

हम पहले से ही जानते हैं कि शब्द के अर्थ के साथ भी शाब्दिक विश्लेषण होता है, फिर अर्थ विश्लेषण कैसे शाब्दिक विश्लेषण से अलग है? लेक्सिकल विश्लेषण छोटे टोकन पर आधारित है, लेकिन दूसरी तरफ अर्थ विश्लेषण बड़े चूजों पर केंद्रित है। इसीलिए शब्दार्थ विश्लेषण को निम्नलिखित दो भागों में विभाजित किया जा सकता है -

व्यक्तिगत शब्द का अर्थ अध्ययन

यह शब्दार्थ विश्लेषण का पहला भाग है जिसमें व्यक्तिगत शब्दों के अर्थ का अध्ययन किया जाता है। इस भाग को लेक्सिकल शब्दार्थ कहते हैं।

व्यक्तिगत शब्दों के संयोजन का अध्ययन

दूसरे भाग में, व्यक्तिगत शब्दों को वाक्यों में अर्थ प्रदान करने के लिए संयोजित किया जाएगा।

शब्दार्थ विश्लेषण का सबसे महत्वपूर्ण कार्य वाक्य का उचित अर्थ प्राप्त करना है। उदाहरण के लिए, वाक्य का विश्लेषण करें“Ram is great.”इस वाक्य में, वक्ता भगवान राम के बारे में या ऐसे व्यक्ति के बारे में बात कर रहा है जिसका नाम राम है। इसीलिए, शब्द का उचित अर्थ प्राप्त करने के लिए नौकरी, शब्दार्थ विश्लेषक का होना जरूरी है।

अर्थ विश्लेषण के तत्व

अनुगामी विश्लेषण के कुछ महत्वपूर्ण तत्व निम्नलिखित हैं -

Hyponymy

इसे एक सामान्य शब्द और उस सामान्य शब्द के उदाहरणों के बीच संबंध के रूप में परिभाषित किया जा सकता है। यहां जेनेरिक शब्द को हाइपरनीम कहा जाता है और इसके उदाहरणों को सम्मोहन कहा जाता है। उदाहरण के लिए, शब्द का रंग हाइपरनीम है और रंग नीला, पीला आदि सम्मोहन हैं।

निराकरण

इसे एक ही वर्तनी या समान रूप वाले शब्दों के रूप में परिभाषित किया जा सकता है, लेकिन अलग और असंबंधित अर्थ। उदाहरण के लिए, शब्द "चमगादड़" एक सजातीय शब्द है क्योंकि चमगादड़ एक गेंद को हिट करने के लिए एक कार्यान्वयन हो सकता है या चमगादड़ एक निशाचर उड़ान स्तनपायी भी है।

अनेक मतलब का गुण

पोलीसिम एक ग्रीक शब्द है, जिसका अर्थ है "कई संकेत"। यह एक शब्द या वाक्यांश है जिसमें विभिन्न लेकिन संबंधित अर्थ हैं। दूसरे शब्दों में, हम कह सकते हैं कि पॉलिसमी की वर्तनी समान है लेकिन अलग और संबंधित अर्थ है। उदाहरण के लिए, शब्द "बैंक" एक पॉलीसिम शब्द है जिसके निम्नलिखित अर्थ हैं -

  • एक वित्तीय संस्थान।

  • जिस भवन में ऐसी संस्था स्थित है।

  • "पर भरोसा करने के लिए" का एक पर्याय।

Polysemy और Homonymy के बीच अंतर

पॉलीसिम और होमोजी दोनों शब्दों में एक ही वाक्यविन्यास या वर्तनी है। उनके बीच मुख्य अंतर यह है कि पोलीसिम में, शब्दों के अर्थ संबंधित हैं लेकिन गृहविज्ञान में, शब्दों के अर्थ संबंधित नहीं हैं। उदाहरण के लिए, यदि हम एक ही शब्द "बैंक" के बारे में बात करते हैं, तो हम 'एक वित्तीय संस्थान' या 'एक नदी बैंक' का अर्थ लिख सकते हैं। उस मामले में यह घर का उदाहरण होगा क्योंकि अर्थ एक दूसरे से असंबंधित हैं।

synonymy

यह दो शाब्दिक वस्तुओं के बीच विभिन्न रूपों वाले संबंध हैं लेकिन समान या निकट अर्थ व्यक्त करते हैं। उदाहरण 'लेखक / लेखक', 'भाग्य / भाग्य' हैं।

Antonymy

यह एक अक्ष के सापेक्ष उनके शब्दार्थ घटकों के बीच समरूपता रखने वाले दो शाब्दिक वस्तुओं के बीच का संबंध है। एन्टोनॉमी का दायरा इस प्रकार है -

  • Application of property or not - उदाहरण है 'जीवन / मृत्यु', 'प्रमाण / असंयम'

  • Application of scalable property - उदाहरण 'अमीर / गरीब', 'गर्म / ठंडा' है

  • Application of a usage - उदाहरण 'पिता / पुत्र', 'चंद्रमा / सूर्य' है।

मतलब प्रतिनिधित्व

शब्दार्थ विश्लेषण एक वाक्य के अर्थ का प्रतिनिधित्व करता है। लेकिन अर्थ प्रतिनिधित्व से संबंधित अवधारणा और दृष्टिकोण में आने से पहले, हमें शब्दार्थ प्रणाली के निर्माण ब्लॉकों को समझने की आवश्यकता है।

सिमेंटिक सिस्टम के बिल्डिंग ब्लॉक्स

शब्द प्रतिनिधित्व या शब्दों के अर्थ का प्रतिनिधित्व करने में, निम्नलिखित बिल्डिंग ब्लॉक एक महत्वपूर्ण भूमिका निभाते हैं -

  • Entities- यह व्यक्ति का प्रतिनिधित्व करता है जैसे किसी विशेष व्यक्ति, स्थान आदि। उदाहरण के लिए, हरियाणा। भारत, राम सभी संस्थाएं हैं।

  • Concepts - यह व्यक्तियों की सामान्य श्रेणी का प्रतिनिधित्व करता है जैसे व्यक्ति, शहर इत्यादि।

  • Relations- यह संस्थाओं और अवधारणा के बीच संबंधों का प्रतिनिधित्व करता है। उदाहरण के लिए, राम एक व्यक्ति हैं।

  • Predicates- यह क्रिया संरचनाओं का प्रतिनिधित्व करता है। उदाहरण के लिए, शब्दार्थ भूमिका और केस व्याकरण विधेय के उदाहरण हैं।

अब, हम समझ सकते हैं कि अर्थ निरूपण दिखाता है कि सिमेंटिक सिस्टम के बिल्डिंग ब्लॉक्स को एक साथ कैसे रखा जाए। दूसरे शब्दों में, यह दिखाता है कि किसी स्थिति का वर्णन करने के लिए संस्थाओं, अवधारणाओं, संबंध और भविष्यवाणी को एक साथ कैसे रखा जाए। यह अर्थ संसार के बारे में तर्क करने में भी सक्षम बनाता है।

अर्थ प्रतिनिधित्व के लिए दृष्टिकोण

अर्थ के निरूपण के लिए शब्दार्थ विश्लेषण निम्नलिखित दृष्टिकोणों का उपयोग करता है -

  • पहले आदेश की भविष्यवाणी करें (FOPL)

  • शब्दार्थ जाल

  • Frames

  • वैचारिक निर्भरता (सीडी)

  • नियम आधारित वास्तुकला

  • केस व्याकरण

  • वैचारिक रेखांकन

मतलब प्रतिनिधि की जरूरत

एक सवाल जो यहां उठता है, वह है कि हमें अर्थ प्रतिनिधित्व की आवश्यकता क्यों है? इसके पीछे कारण हैं -

भाषाई तत्वों को गैर-भाषाई तत्वों से जोड़ना

सबसे पहला कारण यह है कि अर्थ प्रतिनिधित्व की मदद से भाषाई तत्वों को गैर-भाषाई तत्वों से जोड़ने का काम किया जा सकता है।

लेक्सिकल स्तर पर विविधता का प्रतिनिधित्व करना

अर्थ निरूपण की सहायता से असंदिग्ध, कैनोनिकल रूपों को लेक्सिकल स्तर पर दर्शाया जा सकता है।

तर्क के लिए इस्तेमाल किया जा सकता है

अर्थ निरूपण का उपयोग दुनिया में क्या सच है और साथ ही शब्दार्थ निरूपण से ज्ञान का अनुमान लगाने के लिए किया जा सकता है।

लेक्सिकल शब्दार्थ

सिमेंटिक एनालिसिस का पहला भाग, व्यक्तिगत शब्दों के अर्थ का अध्ययन करना, शब्दार्थ शब्दार्थ कहलाता है। इसमें शब्द, उप-शब्द, प्रत्यय (उप-इकाइयां), यौगिक शब्द और वाक्यांश भी शामिल हैं। सभी शब्द, उप-शब्द इत्यादि को सामूहिक रूप से लेक्सिकल आइटम कहा जाता है। दूसरे शब्दों में, हम यह कह सकते हैं कि शाब्दिक शब्दार्थ शब्द के बीच का संबंध है, वाक्य का अर्थ और वाक्य का वाक्य-विन्यास।

लेक्सिकल शब्दार्थ में शामिल निम्नलिखित कदम हैं -

  • शब्द, उप-शब्द, प्रत्यय, आदि जैसे शाब्दिक वस्तुओं का वर्गीकरण शाब्दिक शब्दार्थ में किया जाता है।

  • शब्द, उप-शब्द, प्रत्यय आदि जैसे शाब्दिक वस्तुओं का अपघटन, शाब्दिक शब्दार्थ में किया जाता है।

  • विभिन्न लेक्सिकल सिमेंटिक संरचनाओं के बीच अंतर के साथ-साथ समानता का भी विश्लेषण किया जाता है।