भाषा की सार्वभौमिक गति: 39 बिट्स प्रति सेकंड

May 09 2023
चाहे तेजी से जापानी बोलें या जानबूझकर जर्मन, सूचना देने की दर समान है।
"उह ..
Unsplash पर केविन कर्टिस द्वारा फोटो

"उह .. लो सिएंटो, नो एंटिएन्डो।" - मुझे

कई वर्षों तक स्पैनिश का अध्ययन करने के बावजूद, मैं देशी स्पैनिश बोलने वालों की विस्मयकारी बात करने की गति के साथ कभी नहीं रह सकता। इस वजह से, मैंने हमेशा यह मान लिया था कि सूचना प्रसारण की वास्तविक दर स्पेनिश में अधिक थी; दूसरे शब्दों में, स्पैनिश बोलने वाले अंग्रेजी बोलने वालों की तुलना में विचारों और विचारों को अधिक तेज़ी से व्यक्त करते हैं।

मैं दूर था। CNRS और Université Lumière Lyon 2 के एक अध्ययन के अनुसार, मानव भाषाओं में बोर्ड भर में समान सूचना दर होती है, भले ही उनकी भाषण दर और सूचना घनत्व भिन्न हो। सूचना घनत्व से तात्पर्य है कि किसी भाषा के प्रत्येक शब्दांश में कितनी जानकारी भरी हुई है।

उदाहरण के लिए, वियतनामी में एक उच्च सूचना घनत्व है, एक ही शब्दांश के विभिन्न अर्थों के बीच अंतर करने के लिए टोन का उपयोग करना। अंग्रेजी में कम सूचना घनत्व है क्योंकि इसमें अधिक शब्दांश और थोड़ी तानवाला भिन्नता है।

गणित के इच्छुक के लिए:

सूचना दर = भाषण दर * सूचना घनत्व

शोधकर्ताओं ने बास्क से मंदारिन तक की 17 भाषाओं की भाषण दर और सूचना घनत्व को मापा, और पाया कि उन सभी की औसत सूचना दर लगभग 39 बिट प्रति सेकंड थी। इसका मतलब यह है कि कोई भी भाषा कितनी भी तेज या धीमी क्यों न बोली जाए, वह लगभग उसी गति से जानकारी देती है।

सभी भाषाएँ 39 बिट प्रति सेकंड की गति से क्यों अभिसरित होती हैं?

शोधकर्ताओं का सुझाव है कि मनुष्य कितनी तेजी से भाषा को संसाधित कर सकता है, इसकी एक सीमा है, और इसलिए विभिन्न भाषाओं ने इस सीमा को अलग-अलग तरीकों से अनुकूलित किया है। कुछ भाषाएँ अधिक शब्दांशों का उपयोग करती हैं लेकिन प्रति शब्दांश कम जानकारी और इसके विपरीत। अंत में, वे सभी एक ही लक्ष्य प्राप्त करते हैं: कुशल संचार।

मुझे व्यक्तिगत रूप से यह आकर्षक लगता है, लेकिन यह मुझे उत्तर से अधिक प्रश्नों के साथ छोड़ देता है:

  • हमारे दिमाग ने यह क्यों तय किया कि प्रति सेकंड 39 बिट इष्टतम है?
  • क्या उच्च दरों पर भाषा को संप्रेषित और संसाधित करने के लिए अधिक दिमागी शक्ति की आवश्यकता होती है, और यही कारण है कि बोली जाने वाली भाषा इस औसत पर बसी है? यदि हां, तो क्या यह एक विकासवादी विशेषता है?
  • शुद्ध पढ़ने की दरों के बारे में क्या - कई लोग 1.5x या 2x गति पर पॉडकास्ट और ऑडियोबुक सुनते हैं
  • यह सीमा संचार के अन्य रूपों की तुलना कैसे करती है?

मैं कृत्रिम बुद्धि और प्राकृतिक भाषा प्रसंस्करण के लिए इस शोध के संभावित प्रभावों के बारे में उत्सुक हूं। यदि सभी मानव भाषाओं में एक समान सूचना दर है, तो क्या इसे एआई सिस्टम विकसित करने के लिए बेंचमार्क के रूप में इस्तेमाल किया जा सकता है जो मनुष्यों के साथ कुशलता से संवाद कर सकता है, एक अनजान घाटी से बच सकता है?

यह एक अव्यवस्थित पोस्ट था, लेकिन मैं बस शोध का एक रोमांचक टुकड़ा साझा करना चाहता था :)