द्वारपाल के रूप में शब्द: विद्वानों के प्रकाशनों में अनुशासन-विशिष्ट नियमों और अर्थों को मापना
विद्वानों का पाठ अक्सर शब्दजाल , या विशेष भाषा से भरा होता है जो क्षेत्रों के भीतर कुशल संचार की सुविधा प्रदान कर सकता है लेकिन बाहरी लोगों के लिए समझने में बाधा डालता है। शब्दजाल स्वाभाविक रूप से विकसित होता है ताकि शोधकर्ता और विद्वान संक्षेप में अर्थ बता सकें, लेकिन यह क्षेत्रों के बीच और वैज्ञानिकों और आम जनता के बीच एक बाधा बन सकता है।
उदाहरण के लिए, जंक्शन , डायोड और बायस जैसे शब्द ऑप्टोइलेक्ट्रॉनिक्स के क्षेत्र के लिए विशिष्ट हैं, जैसा कि ऊपर की आकृति में दिखाया गया है। विशेष रूप से, पक्षपात विभिन्न क्षेत्रों में विभिन्न अर्थों, या इंद्रियों से अधिभारित होता है , क्योंकि यह सामाजिक भेदभाव, सांख्यिकीय गलत आकलन, या विद्युत धाराओं का उल्लेख कर सकता है। हमारे पेपर में , हम शब्दों के अर्थों को अलग करने के लिए शब्द अर्थ प्रेरण नामक एक प्राकृतिक भाषा प्रसंस्करण (एनएलपी) दृष्टिकोण का उपयोग करते हैं , और दिखाते हैं कि वे क्षेत्र-विशिष्ट शब्द प्रकारों के रूप में विशिष्ट हो सकते हैं। हम शब्दजाल को अनुशासन-विशिष्ट शब्द और अनुशासन-विशिष्ट अर्थ दोनों के रूप में परिभाषित करते हैं। एसीएल 2023 पेपर के हमारे निष्कर्ष देखेंहम शब्दजाल के अपने माप को कैसे संचालित और मान्य करते हैं, इसके विस्तृत विवरण के लिए।
हम सिमेंटिक स्कॉलर ओपन रिसर्च कॉर्पस (S2ORC) से अध्ययन के तीन सौ क्षेत्रों में अंग्रेजी सार में शब्दजाल को मापते हैं । हम पाते हैं कि जबकि जैविक विज्ञान बहुत विशिष्ट शब्द प्रकारों का उपयोग करते हैं, जैसे कि अणुओं और रसायनों के नाम, गणित, प्रौद्योगिकी, भौतिकी और अर्थशास्त्र में उप-क्षेत्र विशिष्ट अर्थों के साथ मौजूदा शब्दों का पुन: उपयोग करते हैं। उदाहरण के लिए, गणितज्ञ शक्ति , ध्रुव , संघ , सतह और उत्पत्ति जैसे सामान्य शब्दों का पुनरुत्पादन करते हैं ।
हम "विज्ञान के विज्ञान" अनुसंधान और कम्प्यूटेशनल समाजशास्त्र के लिए हमारे मेट्रिक्स की उपयोगिता को प्रदर्शित करने के लिए विद्वानों के शब्दजाल के इन मापों को दो प्रमुख सामाजिक निहितार्थों से जोड़ते हैं, जो इस बात का अध्ययन है कि सामाजिक कारक भाषा से कैसे संबंधित हैं।
सबसे पहले, हम दर्शकों के डिजाइन को मापते हैं , या क्या विद्वान इस बात पर निर्भर करते हुए शब्दजाल का उपयोग कम करते हैं कि वे किसके लिए लिखते हैं। हम पाते हैं कि अधिकांश क्षेत्र सामान्य-उद्देश्य, प्रकृति जैसे बहु-विषयक पत्रिकाओं में प्रकाशित होने पर शब्दजाल को कम करते हैं , लेकिन कुछ क्षेत्र दूसरों की तुलना में ऐसा करते हैं। उदाहरण के लिए, उपरोक्त आंकड़े में, कंप्यूटर विज्ञान दवा और जीव विज्ञान की तुलना में स्थान के आधार पर अपनी प्रकाशित सामग्री को अधिक समायोजित करता है। इस व्यवहार के लिए एक संभावित स्पष्टीकरण यह है कि सामान्य-उद्देश्य वाले स्थानों का जैविक और भौतिक विज्ञानों द्वारा नेतृत्व और वर्चस्व का इतिहास रहा है। इसलिए, हालांकि "सामान्य-उद्देश्य" स्थानों का उद्देश्य सभी विज्ञानों के लिए हो सकता है,² कुछ क्षेत्रों की अपेक्षा की जाती है दूसरों की तुलना में अपनी भाषा को अधिक अनुकूलित करने के लिए।
दूसरा, हम जांच करते हैं कि कैसे विषय-विशिष्ट भाषा वैज्ञानिक सफलता के दो अलग-अलग उपायों से जुड़ी है: उद्धरण संख्या और अंतःविषय प्रभाव । अंतःविषय प्रभाव एक पेपर का हवाला देने वाले क्षेत्रों की विविधता को मापता है। हमने प्रत्येक क्षेत्र के लिए अलग-अलग प्रतिगमन मॉडल चलाए, यह देखने के लिए कि शब्दजाल और सफलता के बीच का संबंध उनके बीच कैसे भिन्न हो सकता है। यद्यपि शब्दजाल और उद्धरण दरों के बीच सहसंबंध की दिशा भिन्न होती है, लेकिन अंतःविषय प्रभाव के साथ शब्दजाल लगभग हमेशा नकारात्मक रूप से सहसंबद्ध होता है।³
संयुक्त रूप से, हमारे निष्कर्ष बताते हैं कि हालांकि कुछ क्षेत्र सामान्य-उद्देश्य वाले स्थानों में शब्दजाल के उपयोग को कम नहीं करते हैं, लेकिन यह अभ्यास अंतःविषय संचार को बाधित कर सकता है। यह अमूर्त लेखन मानदंडों पर पुनर्विचार के लिए एक संभावित अवसर खोलता है, विशेष रूप से उन स्थानों के लिए जो विषयों को पाटने का इरादा रखते हैं।
[1] पीएलओएस वन का संस्थापक पत्र और नेचर द्वारा साइंटिफिक रिपोर्ट्स का आरंभिक लॉन्च सामान्य-उद्देश्य वाले स्थानों की उत्पत्ति के दो उदाहरण हैं।
[2] उदाहरण के लिए, प्रकृति का " उद्देश्य और दायरा " देखें।
[3] हमारा अध्ययन कार्य-कारण नहीं है, लेकिन अंतःविषय कनेक्शन पर शब्दजाल के प्रभाव के आसपास भविष्य के अध्ययन के लिए एक मार्ग प्रदान करता है।
ट्विटर पर @allen_ai और @semanticscholar को फॉलो करें और AI2 से आने वाले समाचारों और शोधों पर अपडेट रहने के लिए AI2 न्यूज़लेटर की सदस्यता लें।