言語の世界的な速度: 39 ビット/秒

May 09 2023
早口の日本語を話しても、丁寧なドイツ語を話しても、伝わる情報の速度は同じです。
「うーん。
Unsplash の Kevin Curtis による写真

「うーん。ロシエント、ノーエンティエンド。」- 自分

数年間スペイン語を勉強しているにもかかわらず、スペイン語を母国語とする人々のめまぐるしい会話のスピードについていくことができません。このため、私は常に、実際の情報伝達速度はスペイン語の方が高いと思っていました。言い換えれば、スペイン語を話す人は、例えば英語を話す人よりも考えやアイデアを早く伝えます。

かなり外れていました。CNRS とリヨン第 2 リュミエール大学の研究によると、人間の言語は、音声速度や情報密度が異なる場合でも、全体的に同様の情報速度を持っています。情報密度とは、言語の各音節にどれだけの情報が詰め込まれているかを指します。

たとえば、ベトナム語は情報密度が高く、同じ音節の異なる意味を声調で区別します。英語は音節が多く、声調の変化が少ないため、情報密度が低くなります。

数学に興味のある人へ:

情報量 = 発話速度 * 情報密度

研究者らは、バスク語からマンダリンまでの 17 言語の音声速度と情報密度を測定したところ、すべての言語の平均情報速度が 1 秒あたり約 39 ビットであることがわかりました。これは、言語がどれほど速く話されるか遅くなるかに関係なく、情報はほぼ同じ速度で伝わることを意味します。

すべての言語が 39 ビット/秒に収束するのはなぜですか?

研究者らは、人間が言語を快適に処理できる速度には上限があり、言語ごとにさまざまな方法でこの制限に適応していると示唆しています。一部の言語では、より多くの音節を使用しますが、1 音節あたりの情報は少なくなり、その逆も同様です。最終的には、効率的なコミュニケーションという同じ目標を達成します。

私は個人的にこれは興味深いと思いますが、答えよりも多くの疑問が残ります。

  • なぜ私たちの脳は 39 ビット/秒が最適だと判断したのでしょうか?
  • 言語をより高い速度で伝え、処理するにはより多くの頭脳が必要であり、それが話し言葉がこの平均値に落ち着いた理由なのでしょうか? もしそうなら、これは進化上の特徴ですか?
  • 純粋な読書速度についてはどうでしょうか。多くの人はポッドキャストやオーディオブックを 1.5 倍または 2 倍の速度で聞いています。
  • この制限は他の通信形式とどう違うのでしょうか?

私はこの研究が人工知能と自然言語処理に与える潜在的な影響に興味があります。すべての人間の言語が同様の情報速度を持っている場合、これを、不気味の谷を回避して人間と効率的にコミュニケーションできる AI システムを開発するためのベンチマークとして使用できるでしょうか?

これは少し雑然とした投稿でしたが、私は単にエキサイティングな研究結果を共有したかっただけです :)