A velocidade universal da linguagem: 39 bits por segundo
“Uhh... lo siento, no entiendo.” - meu
Apesar de estudar espanhol por vários anos, nunca consigo acompanhar o ritmo desconcertante dos falantes nativos de espanhol. Por causa disso, sempre presumi que a taxa real de transmissão de informações era maior em espanhol; em outras palavras, falantes de espanhol transmitem pensamentos e ideias mais rapidamente do que, digamos, falantes de inglês.
Eu estava longe. De acordo com um estudo do CNRS e da Université Lumière Lyon 2, as línguas humanas têm taxas de informação semelhantes em todos os aspectos, mesmo que suas taxas de fala e densidades de informação variem. A densidade da informação refere-se à quantidade de informação contida em cada sílaba de um idioma.
Por exemplo, o vietnamita tem uma alta densidade de informação, usando tons para distinguir entre diferentes significados da mesma sílaba. O inglês tem uma densidade de informação menor porque tem mais sílabas e pouca variação tonal.
Para quem gosta de matemática:
taxa de informação = taxa de fala * densidade de informação
Os pesquisadores mediram a taxa de fala e a densidade de informações de 17 idiomas, variando do basco ao mandarim, e descobriram que todos eles tinham uma taxa média de informação de cerca de 39 bits por segundo. Isso significa que não importa quão rápido ou lento um idioma seja falado, ele transmite informações aproximadamente na mesma velocidade.
Por que todas as linguagens convergem a 39 bits por segundo?
Os pesquisadores sugerem que existe um limite para a rapidez com que os humanos podem processar confortavelmente a linguagem e, portanto, diferentes idiomas se adaptaram a esse limite de maneiras diferentes. Algumas línguas usam mais sílabas, mas menos informações por sílaba, e vice-versa. No final, todos alcançam o mesmo objetivo: comunicação eficiente.
Pessoalmente, acho isso fascinante, mas me deixa com mais perguntas do que respostas:
- Por que nossos cérebros decidiram que 39 bits por segundo é o ideal?
- É preciso mais inteligência para transmitir e processar a linguagem em taxas mais altas, e é por isso que a linguagem falada se estabeleceu nessa média? Se sim, isso é uma característica evolutiva?
- E as taxas de leitura pura - muitos ouvem podcasts e audiolivros em velocidades de 1,5x ou 2x
- Como esse limite se compara a outras formas de comunicação?
Estou curioso sobre as potenciais implicações desta pesquisa para inteligência artificial e processamento de linguagem natural. Se todas as línguas humanas tiverem uma taxa de informação semelhante, isso poderia ser usado como referência para o desenvolvimento de sistemas de IA que possam se comunicar com humanos de maneira eficiente, evitando um vale misterioso?
Este foi um post um pouco confuso, mas eu simplesmente queria compartilhar uma pesquisa interessante :)