La vitesse universelle du langage : 39 bits par seconde
"Euh.. lo siento, pas d'entiendo." - moi
Bien que j'aie étudié l'espagnol pendant plusieurs années, je n'arrive jamais à suivre le rythme de conversation déconcertant des hispanophones natifs. Pour cette raison, j'avais toujours supposé que le taux réel de transmission d'informations était plus élevé en espagnol ; en d'autres termes, les hispanophones transmettent leurs pensées et leurs idées plus rapidement que, disons, les anglophones.
J'étais loin. Selon une étude du CNRS et de l'Université Lumière Lyon 2, les langues humaines ont des taux d'information similaires dans tous les domaines, même si leurs débits de parole et leurs densités d'information varient. La densité d'information fait référence à la quantité d'informations contenues dans chaque syllabe d'une langue.
Par exemple, le vietnamien a une densité d'informations élevée, utilisant des tons pour distinguer les différentes significations de la même syllabe. L'anglais a une densité d'information plus faible car il a plus de syllabes et peu de variation tonale.
Aux mathématiciens :
débit d'information = débit de parole * densité d'information
Les chercheurs ont mesuré le débit de parole et la densité d'information de 17 langues, allant du basque au mandarin, et ont découvert qu'elles avaient toutes un débit d'information moyen d'environ 39 bits par seconde. Cela signifie que peu importe la rapidité ou la lenteur avec laquelle une langue est parlée, elle transmet des informations à peu près à la même vitesse.
Pourquoi toutes les langues convergent-elles à 39 bits par seconde ?
Les chercheurs suggèrent qu'il existe un plafond à la vitesse à laquelle les humains peuvent traiter confortablement le langage, et donc différentes langues se sont adaptées à cette limite de différentes manières. Certaines langues utilisent plus de syllabes mais moins d'informations par syllabe, et vice versa. Au final, ils atteignent tous le même objectif : une communication efficace.
Personnellement, je trouve cela fascinant, mais cela me laisse avec plus de questions que de réponses :
- Pourquoi notre cerveau a-t-il décidé que 39 bits par seconde était l'optimum ?
- Faut-il plus d'intelligence pour transmettre et traiter le langage à des taux plus élevés, et c'est pourquoi le langage parlé s'est établi à cette moyenne ? Si oui, est-ce un trait évolutif ?
- Qu'en est-il des taux de lecture pure - beaucoup écoutent des podcasts et des livres audio à des vitesses 1,5x ou 2x
- Comment cette limite se compare-t-elle à d'autres formes de communication ?
Je suis curieux de connaître les implications potentielles de cette recherche pour l'intelligence artificielle et le traitement du langage naturel. Si toutes les langues humaines ont un taux d'information similaire, cela pourrait-il être utilisé comme référence pour développer des systèmes d'IA capables de communiquer efficacement avec les humains, en évitant une étrange vallée ?
C'était un article un peu encombré, mais je voulais simplement partager une recherche passionnante :)