Analyse de la scène auditive : une brève introduction

Dec 04 2022
Une brève introduction Gestalt Parallels L'analyse de scènes auditives peut être considérée comme une psychologie de la Gestalt dans le domaine auditif plutôt que visuel. Vous pouvez vous souvenir de la conception graphique ou de la théorie UX de l'ensemble des principes de la Gestalt, tels que les "lois" de la proximité, de la similarité, de la continuation, de la fermeture, du destin commun, de la figure/fond, de la symétrie, de l'ordre, etc.
l'effet cocktail

Une brève introduction

Parallèles de la Gestalt

L'analyse de scène auditive peut être considérée comme une psychologie de la gestalt dans le domaine auditif plutôt que visuel. Vous vous souviendrez peut-être de la conception graphique ou de la théorie UX de l'ensemble des principes de Gestalt, tels que les « lois » de la proximité, de la similarité, de la continuation, de la fermeture, du destin commun, de la figure/fond, de la symétrie, de l'ordre, etc. Si vous avez besoin d'un rappel, ces sont faciles à trouver en ligne comme celui-ci .

principes de la gestalt (source de l'image)

L'analyse de scène auditive (ci-après ASA) explore des questions sur la façon dont nous sommes capables de percevoir des événements et des sources sonores uniques, lorsque notre environnement acoustique est plein de sons qui se chevauchent simultanément.

Pour dessiner un contraste visuel, si vous superposez de nombreuses images les unes sur les autres, par exemple en appliquant une certaine quantité de transparence à chacune d'elles, elles s'ajouteront à une sorte de bouillie visuelle et finiront par donner du noir ou au moins un brun foncé très peu attrayant. . Essayez ceci dans Photoshop ou dans n'importe quel éditeur d'images auquel vous pouvez accéder - chargez plusieurs images les unes sur les autres sous forme de calques et donnez à chacune une opacité de 50% - le résultat ne sera pas joli.

Avec les images, nous aimons généralement voir une seule image se produire à la fois. Mais il y a des exceptions notables qui méritent d'être discutées brièvement. On pourrait penser que le collage fait exception, puisqu'il présente des morceaux d'images en juxtaposition. Je dirais, cependant, qu'un collage n'est toujours qu'une seule image et qu'il n'est pas catégoriquement différent de toute autre image puisque toutes les images peuvent être considérées comme un tout composé de plusieurs parties.

Télécharger un ebook gratuit

La principale exception avec les médias visuels (à laquelle je peux penser actuellement) concerne les effets de double exposition, où la superposition soigneuse de deux images seulement nous permet d'en voir deux simultanément.

Doubles expositions dans le domaine de l'image — deux images simultanées (source de l'image)
Doubles expositions dans le domaine de l'image — deux images simultanées (source de l'image)

Mais notez le nom de l'effet - double exposition. Comme dans, juste deux images. Si vous recherchez sur Google des images à « triple exposition », vous obtenez à la place des exemples d'« images à exposition multiple » qui ne sont pour la plupart que des images à double exposition.

Photographie virtuelle

Avec le son, contrairement aux images, il est courant et tout à fait normal d'accumuler couche après couche de sons simultanés. Contrairement aux images, cela ne conduit pas au type de confusion dans les informations objet/événement/source que nous pourrions obtenir avec ce type d'approche de la photographie à expositions multiples :

De Myk Eff @ Optophonia
Exposition multiple (plus de deux) en photographie. sources d'images

La scène auditive

La scène auditive représente toutes les sources sonores se produisant dans l'environnement d'un auditeur. Alors qu'avec l'information visuelle, la psychologie perceptive dira que chaque chose que nous percevons est un « objet », en ce qui concerne le son, ASA propose que nous percevions des « flux ». Avec ASA, il y a un échange de termes de l' objet (visuel) pour le flux (auditif) . L'ASA étudie les processus neuro-cognitifs par lesquels les spectres de la scène auditive se séparent dans l'esprit en perceptions individuelles.

Si votre chien aboie pendant que la télévision est allumée et que l'alarme du poêle sonne, chacun d'eux est un flux auditif unique qui se produit dans votre scène auditive immédiate. Le concept quotidien le plus connu d'ASA est « l'effet cocktail ».

Livres de conception sonore

L'effet ou le phénomène de cocktail en psychologie est notre capacité à syntoniser une seule voix à partir de nombreuses conversations se déroulant dans une pièce bruyante. Pour les psychologues, « l'effet ou le phénomène de la soirée cocktail » est notre capacité impressionnante et sous-estimée à accorder notre attention à une seule voix parmi une multitude. Lors d'une fête, lorsque vous vous ennuyez avec votre partenaire de conversation actuel - et pour l'écouteur indiscret compulsif - permettre à l'attention auditive de se promener dans la pièce est une astuce pratique. ( source )

Vidéos musicales

La capacité de l'esprit à former des flux d'événements et de sources sonores séparés se produit à un niveau cognitif - des phénomènes psychophysiques ou psychoacoustiques systématiquement ordonnés «supérieurs» ou «au-dessus». Au niveau cochléaire, par exemple, tous les sons uniques sont une «bouillie générale» de sons non individualisés, similaire à la photo en noir et blanc à exposition multiple ci-dessus. La ségrégation des flux est neuro-cognitive (post-cochlée) et fait donc partie du système nerveux central.

Au niveau cochléaire, tous les sons simultanés sont une « bouillie générale » qui n'est pas encore perceptiblement distinguée en tant qu'événements et sources sonores uniques dans l'environnement (source d'image 1, source d'image 2)

Ci-dessous, nous voyons comment les principes généraux de la Gestalt peuvent être appliqués dans le domaine auditif.

La recherche expérimentale de l'ASA analyse souvent notre perception des modèles ABA, qui sont des séquences sonores dans lesquelles les sources présentent une sorte de différences contrastées, telles que la hauteur, le tempo ou le volume. Les sujets sont ensuite invités à indiquer si les sons qu'ils entendent font partie du même flux ou de flux différents.

Vidéo Pixel Art

Ci-dessous, nous voyons comment un seul motif d'alternance de notes aiguës et graves peut être perçu comme deux flux auditifs distincts, un aigu et un grave.

un motif ABA se décomposant en deux flux perçus distincts (source de l'image)
Modèles ABA d'augmentation progressive du contraste dans leurs différences de hauteur (source de l'image)
Réinventer la série de livres sur la communication
six « interprétations » possibles de la réponse perceptuelle du « même » motif de stimulation ABA (source de l'image)

Vous trouverez ci-dessous un schéma de tous les différents composants exécutés dans la ségrégation des flux. Vous ne serez pas interrogé sur ce diagramme, alors profitez simplement de la complexité de la science : )

sources d'images

Le diagramme ci-dessous est beaucoup plus simple à comprendre, et est donc potentiellement plus discutable : ) Il décompose l'ASA en une série de concepts contrastés qui définissent le niveau de complexité hiérarchique globale du système - par exemple biologique par rapport à culturel - dans le traitement cogntif qui est nécessaire pour produire des flux auditifs.

Niveaux de complexité contrastés

Et voici un autre schéma pour faire bonne mesure. Ceci est une introduction rapide après tout, pas un article scientifique :)

sources d'images

Vous trouverez ci-dessous deux des "classiques" de la psychologie si vous souhaitez en savoir plus sur le contexte théorique et expérimental de l'ASA, et sur la façon dont notre esprit divise les signaux environnementaux en perceptions d'objets (vision) et d'événements (audition).

Un guide de contenu complet pour le son et le design

Articles Liés

Réinventer la communication

Colocation Audiovisuelle | Présentation du colloque de recherche

Outil de visualisation de la série de conférenciers distingués du CIRMMT

Les véhicules électriques sont des ÉVÉNEMENTS — Ils doivent produire des sons