Универсальная скорость языка: 39 бит в секунду
«Э-э… lo siento, no entiendo». - мне
Несмотря на то, что я изучаю испанский язык в течение нескольких лет, я никак не могу угнаться за ошеломляющим темпом разговора носителей испанского языка. Из-за этого я всегда предполагал, что реальная скорость передачи информации на испанском выше; другими словами, носители испанского языка передают мысли и идеи быстрее, чем, скажем, носители английского языка.
Я был далеко. Согласно исследованию, проведенному CNRS и Университетом Люмьер Лион 2, человеческие языки имеют одинаковую скорость передачи информации по всем направлениям, даже если их скорость речи и плотность информации различаются. Плотность информации относится к тому, сколько информации упаковано в каждый слог языка.
Например, вьетнамский язык отличается высокой плотностью информации и использует тона для различения разных значений одного и того же слога. Английский язык имеет меньшую информационную плотность, потому что в нем больше слогов и мало тональных вариаций.
Для любителей математики:
скорость передачи информации = скорость речи * плотность информации
Исследователи измерили скорость речи и информационную плотность 17 языков, от баскского до китайского, и обнаружили, что все они имеют среднюю скорость передачи информации около 39 бит в секунду. Это означает, что независимо от того, насколько быстро или медленно говорят на языке, информация передается примерно с одинаковой скоростью.
Почему все языки сходятся на скорости 39 бит в секунду?
Исследователи предполагают, что существует потолок того, насколько быстро люди могут комфортно обрабатывать язык, и поэтому разные языки по-разному адаптировались к этому пределу. В некоторых языках используется больше слогов, но меньше информации на каждый слог, и наоборот. В конце концов, все они достигают одной цели: эффективной коммуникации.
Лично я нахожу это увлекательным, но у меня остается больше вопросов, чем ответов:
- Почему наш мозг решил, что 39 бит в секунду — это оптимум?
- Требуется ли больше умственных способностей, чтобы передавать и обрабатывать язык с более высокой скоростью, и поэтому разговорный язык остановился на таком среднем уровне? Если да, то является ли это эволюционной чертой?
- А как насчет чистой скорости чтения — многие слушают подкасты и аудиокниги на скорости 1,5x или 2x.
- Как это ограничение соотносится с другими формами общения?
Мне любопытны потенциальные последствия этого исследования для искусственного интеллекта и обработки естественного языка. Если все человеческие языки имеют одинаковую скорость передачи информации, можно ли использовать это в качестве эталона для разработки систем ИИ, которые могут эффективно общаться с людьми, избегая зловещей долины?
Это был немного загроможденный пост, но я просто хотел поделиться захватывающим исследованием :)