Analyse de la scène auditive : une brève introduction

Une brève introduction
Parallèles de la Gestalt
L'analyse de scène auditive peut être considérée comme une psychologie de la gestalt dans le domaine auditif plutôt que visuel. Vous vous souviendrez peut-être de la conception graphique ou de la théorie UX de l'ensemble des principes de Gestalt, tels que les « lois » de la proximité, de la similarité, de la continuation, de la fermeture, du destin commun, de la figure/fond, de la symétrie, de l'ordre, etc. Si vous avez besoin d'un rappel, ces sont faciles à trouver en ligne comme celui-ci .


L'analyse de scène auditive (ci-après ASA) explore des questions sur la façon dont nous sommes capables de percevoir des événements et des sources sonores uniques, lorsque notre environnement acoustique est plein de sons qui se chevauchent simultanément.
Pour dessiner un contraste visuel, si vous superposez de nombreuses images les unes sur les autres, par exemple en appliquant une certaine quantité de transparence à chacune d'elles, elles s'ajouteront à une sorte de bouillie visuelle et finiront par donner du noir ou au moins un brun foncé très peu attrayant. . Essayez ceci dans Photoshop ou dans n'importe quel éditeur d'images auquel vous pouvez accéder - chargez plusieurs images les unes sur les autres sous forme de calques et donnez à chacune une opacité de 50% - le résultat ne sera pas joli.
Avec les images, nous aimons généralement voir une seule image se produire à la fois. Mais il y a des exceptions notables qui méritent d'être discutées brièvement. On pourrait penser que le collage fait exception, puisqu'il présente des morceaux d'images en juxtaposition. Je dirais, cependant, qu'un collage n'est toujours qu'une seule image et qu'il n'est pas catégoriquement différent de toute autre image puisque toutes les images peuvent être considérées comme un tout composé de plusieurs parties.

La principale exception avec les médias visuels (à laquelle je peux penser actuellement) concerne les effets de double exposition, où la superposition soigneuse de deux images seulement nous permet d'en voir deux simultanément.


Mais notez le nom de l'effet - double exposition. Comme dans, juste deux images. Si vous recherchez sur Google des images à « triple exposition », vous obtenez à la place des exemples d'« images à exposition multiple » qui ne sont pour la plupart que des images à double exposition.

Avec le son, contrairement aux images, il est courant et tout à fait normal d'accumuler couche après couche de sons simultanés. Contrairement aux images, cela ne conduit pas au type de confusion dans les informations objet/événement/source que nous pourrions obtenir avec ce type d'approche de la photographie à expositions multiples :


La scène auditive
La scène auditive représente toutes les sources sonores se produisant dans l'environnement d'un auditeur. Alors qu'avec l'information visuelle, la psychologie perceptive dira que chaque chose que nous percevons est un « objet », en ce qui concerne le son, ASA propose que nous percevions des « flux ». Avec ASA, il y a un échange de termes de l' objet (visuel) pour le flux (auditif) . L'ASA étudie les processus neuro-cognitifs par lesquels les spectres de la scène auditive se séparent dans l'esprit en perceptions individuelles.
Si votre chien aboie pendant que la télévision est allumée et que l'alarme du poêle sonne, chacun d'eux est un flux auditif unique qui se produit dans votre scène auditive immédiate. Le concept quotidien le plus connu d'ASA est « l'effet cocktail ».

L'effet ou le phénomène de cocktail en psychologie est notre capacité à syntoniser une seule voix à partir de nombreuses conversations se déroulant dans une pièce bruyante. Pour les psychologues, « l'effet ou le phénomène de la soirée cocktail » est notre capacité impressionnante et sous-estimée à accorder notre attention à une seule voix parmi une multitude. Lors d'une fête, lorsque vous vous ennuyez avec votre partenaire de conversation actuel - et pour l'écouteur indiscret compulsif - permettre à l'attention auditive de se promener dans la pièce est une astuce pratique. ( source )

La capacité de l'esprit à former des flux d'événements et de sources sonores séparés se produit à un niveau cognitif - des phénomènes psychophysiques ou psychoacoustiques systématiquement ordonnés «supérieurs» ou «au-dessus». Au niveau cochléaire, par exemple, tous les sons uniques sont une «bouillie générale» de sons non individualisés, similaire à la photo en noir et blanc à exposition multiple ci-dessus. La ségrégation des flux est neuro-cognitive (post-cochlée) et fait donc partie du système nerveux central.

Ci-dessous, nous voyons comment les principes généraux de la Gestalt peuvent être appliqués dans le domaine auditif.

La recherche expérimentale de l'ASA analyse souvent notre perception des modèles ABA, qui sont des séquences sonores dans lesquelles les sources présentent une sorte de différences contrastées, telles que la hauteur, le tempo ou le volume. Les sujets sont ensuite invités à indiquer si les sons qu'ils entendent font partie du même flux ou de flux différents.

Ci-dessous, nous voyons comment un seul motif d'alternance de notes aiguës et graves peut être perçu comme deux flux auditifs distincts, un aigu et un grave.




Vous trouverez ci-dessous un schéma de tous les différents composants exécutés dans la ségrégation des flux. Vous ne serez pas interrogé sur ce diagramme, alors profitez simplement de la complexité de la science : )

Le diagramme ci-dessous est beaucoup plus simple à comprendre, et est donc potentiellement plus discutable : ) Il décompose l'ASA en une série de concepts contrastés qui définissent le niveau de complexité hiérarchique globale du système - par exemple biologique par rapport à culturel - dans le traitement cogntif qui est nécessaire pour produire des flux auditifs.


Et voici un autre schéma pour faire bonne mesure. Ceci est une introduction rapide après tout, pas un article scientifique :)

Vous trouverez ci-dessous deux des "classiques" de la psychologie si vous souhaitez en savoir plus sur le contexte théorique et expérimental de l'ASA, et sur la façon dont notre esprit divise les signaux environnementaux en perceptions d'objets (vision) et d'événements (audition).

Un guide de contenu complet pour le son et le design

Articles Liés
Colocation Audiovisuelle | Présentation du colloque de recherche
Outil de visualisation de la série de conférenciers distingués du CIRMMT
Les véhicules électriques sont des ÉVÉNEMENTS — Ils doivent produire des sons