Evrensel Dil Hızı: Saniyede 39 Bit

May 09 2023
İster hızlı Japonca konuşun ister kasıtlı Almanca konuşun, aktarılan bilginin oranı aynıdır.
“Hıh..
Unsplash'ta Kevin Curtis'in fotoğrafı

"Uhh.. lo siento, entiendo yok." - Ben

Yıllarca İspanyolca öğrenmeme rağmen, anadili İspanyolca olanların şaşırtıcı konuşma hızına asla yetişemiyorum. Bu nedenle, gerçek bilgi aktarım hızının her zaman İspanyolca'da daha yüksek olduğunu varsaymıştım; başka bir deyişle, İspanyolca konuşanlar, düşünce ve fikirleri, örneğin İngilizce konuşanlardan daha hızlı aktarırlar.

Çok uzaktaydım. CNRS ve Université Lumière Lyon 2 tarafından yapılan bir araştırmaya göre, konuşma hızları ve bilgi yoğunlukları değişse bile insan dilleri genel olarak benzer bilgi oranlarına sahiptir. Bilgi yoğunluğu, bir dilin her hecesine ne kadar bilgi sığdırıldığını ifade eder.

Örneğin, Vietnamca, aynı hecenin farklı anlamlarını ayırt etmek için tonları kullanan yüksek bir bilgi yoğunluğuna sahiptir. İngilizce daha az bilgi yoğunluğuna sahiptir çünkü daha fazla heceye ve çok az ton varyasyonuna sahiptir.

Matematik eğilimli için:

bilgi oranı = konuşma hızı * bilgi yoğunluğu

Araştırmacılar, Baskçadan Mandarin'e kadar 17 dilin konuşma hızını ve bilgi yoğunluğunu ölçtüler ve hepsinin saniyede yaklaşık 39 bit ortalama bilgi hızına sahip olduğunu buldular. Bu, bir dil ne kadar hızlı veya yavaş konuşulursa konuşulsun, bilgiyi aşağı yukarı aynı hızda ilettiği anlamına gelir.

Neden tüm diller saniyede 39 bit hızında birleşiyor?

Araştırmacılar, insanların dili rahatça işleyebilecekleri hızın bir sınırı olduğunu ve bu nedenle farklı dillerin bu sınıra farklı şekillerde uyum sağladığını öne sürüyor. Bazı diller daha fazla hece kullanır, ancak hece başına daha az bilgi kullanır ve bunun tersi de geçerlidir. Sonunda hepsi aynı hedefe ulaşır: verimli iletişim.

Şahsen bunu büyüleyici buluyorum, ancak bu beni cevaplardan çok sorularla baş başa bırakıyor:

  • Beynimiz neden saniyede 39 bitin optimum olduğuna karar verdi?
  • Dili daha yüksek oranlarda iletmek ve işlemek daha fazla beyin gücü gerektiriyor ve bu yüzden konuşma dili bu ortalamada mı sabitleniyor? Eğer öyleyse, bu evrimsel bir özellik midir?
  • Peki ya saf okuma hızları - çoğu kişi podcast'leri ve sesli kitapları 1,5x veya 2x hızında dinler
  • Bu sınır, diğer iletişim biçimleriyle karşılaştırıldığında nasıldır?

Bu araştırmanın yapay zeka ve doğal dil işleme üzerindeki olası etkilerini merak ediyorum. Tüm insan dillerinde benzer bir bilgi oranı varsa, bu, insanlarla verimli bir şekilde iletişim kurabilen ve tekinsiz bir vadiden kaçınabilen yapay zeka sistemleri geliştirmek için bir ölçüt olarak kullanılabilir mi?

Biraz dağınık bir yazı oldu ama ben sadece heyecan verici bir araştırmayı paylaşmak istedim :)