Анализ слуховой сцены: краткое введение

Краткое введение
Гештальт-параллели
Анализ слуховой сцены можно рассматривать как гештальт-психологию в слуховой, а не визуальной сфере. Вы можете вспомнить из графического дизайна или теории UX набор гештальт-принципов, таких как «законы» близости, сходства, продолжения, закрытия, общей судьбы, фигуры/фона, симметрии, порядка и т. д. Если вам нужно освежить в памяти эти легко найти в Интернете, например, этот .


Анализ слуховой сцены (далее ASA) исследует вопрос о том, как мы можем воспринимать уникальные звуковые события и источники, когда наша акустическая среда полна одновременных перекрывающихся звуков.
Чтобы создать визуальный контраст, если вы наложите много изображений друг на друга, скажем, применив к каждому из них некоторую степень прозрачности, они будут складываться в своего рода визуальную кашу и в конечном итоге приведут к черному или, по крайней мере, к очень непривлекательному темно-коричневому цвету. . Попробуйте это в Photoshop или любом другом графическом редакторе, к которому у вас есть доступ — загрузите много изображений друг над другом в виде слоев и установите для каждого из них непрозрачность 50% — результат не будет красивым.
С изображениями нам обычно нравится видеть одно изображение за раз. Но есть заметные исключения, которые стоит кратко обсудить. Вы можете подумать, что коллаж может быть исключением, поскольку он представляет собой сопоставление фрагментов изображений. Я бы сказал, однако, что коллаж — это всего лишь одно изображение и не отличается категорически от любого другого изображения, поскольку можно сказать, что все изображения представляют собой единое целое, состоящее из нескольких частей.

Основное исключение для визуальных медиа (о котором я могу думать сейчас) — это эффекты двойной экспозиции, когда тщательное наслоение обычно только двух изображений позволяет нам видеть два из них одновременно.


Но обратите внимание на название эффекта — двойная экспозиция. То есть всего два изображения. Если вы погуглите изображения с «тройной экспозицией», вместо этого вы получите примеры «изображений с многократной экспозицией», которые в основном представляют собой просто изображения с двойной экспозицией.

Со звуком, в отличие от изображений, обычно и совершенно нормально накапливать слой за слоем сопутствующие звуки. В отличие от изображений, это не приводит к путанице в информации об объекте/событии/источнике, которую мы могли бы получить при таком подходе к фотографии с мультиэкспозицией:


Аудиальная сцена
Аудиальная сцена представляет собой все источники звука, происходящие в окружении слушателя. В то время как в отношении визуальной информации перцептивная психология скажет, что каждая вещь, которую мы воспринимаем, является «объектом», когда дело доходит до звука, ASA предполагает, что мы воспринимаем «потоки». В ASA происходит замена (визуального) объекта на (слуховой) поток . ASA изучает нейрокогнитивные процессы, посредством которых спектры звуковой сцены разделяются в сознании на отдельные восприятия.
Если ваша собака лает, когда играет телевизор, и подает сигнал будильник, каждый из этих звуков представляет собой уникальный слуховой поток, происходящий в вашей непосредственной слуховой сцене. Самая известная повседневная концепция ASA — это «эффект вечеринки с коктейлем».

Эффект коктейльной вечеринки или явление в психологии — это наша способность настраиваться на один голос из множества разговоров, происходящих в шумной комнате. Для психологов «эффект коктейльной вечеринки» или явление — это наша впечатляющая и недооцененная способность настраивать свое внимание только на один голос из множества. На вечеринке, когда скучно с нашим нынешним собеседником — и для навязчивого подслушивателя — позволить слуховому вниманию блуждать по комнате — удобный трюк. ( источник )

Способность разума формировать потоки отдельных звуковых событий и источников происходит на когнитивном уровне — системно упорядоченных «высших» или «выше» психофизических или психоакустических явлений. Например, на кохлеарном уровне все уникальные звуки представляют собой «общую кашу» из неиндивидуализированных звуков, как на черно-белой фотографии с многократной экспозицией выше. Разделение потоков является нейрокогнитивным (пост-улитковым) и, таким образом, является частью центральной нервной системы.

Ниже мы видим, как общие принципы гештальта могут быть применены в аудиальной сфере.

Экспериментальные исследования ASA часто анализируют наше восприятие паттернов ABA, которые представляют собой звуковые последовательности, в которых источники имеют некоторые контрастные различия, такие как высота, темп или громкость. Затем субъектов просят дать отчет о том, являются ли звуки, которые они слышат, частью одного и того же или разных потоков.

Ниже мы видим, как единый паттерн чередования высоких и низких нот может восприниматься как два отдельных слуховых потока — Высокий и Низкий.




Ниже представлена диаграмма всех различных компонентов, выполняемых при разделении потока. Вы не будете задавать вопросы по этой диаграмме, так что просто наслаждайтесь, насколько сложной может быть наука :)

Приведенная ниже диаграмма намного проще для понимания и, таким образом, потенциально более проста:) Она разбивает АСА на ряд контрастирующих понятий, которые определяют уровень общей системно-иерархической сложности — например, биологической или культурной — в необходимой когнитивной обработке. производить слуховые потоки.


А вот еще одна схема для наглядности. В конце концов, это краткое введение, а не научная статья :)

Ниже приведены две «классики» психологии, если вам интересно узнать больше о теоретических и экспериментальных основах ASA и о том, как наш разум разделяет сигналы окружающей среды на восприятие объектов (зрение) и событий (слух).

Полное руководство по звуку и дизайну

Статьи по Теме
Аудиовизуальное совместное размещение | Презентация исследовательского коллоквиума
Инструмент визуализации серии выдающихся докладчиков CIRMMT
Электромобили — это СОБЫТИЯ — им нужно издавать звуки