Аннотация:Отношения артикуляции и производимого в результате артикуляционных действий
акустического эффекта, как и извлечение полезных признаков из акустического сигнала
всегда стояло в ряду первоочередных задач фонетики и экспериментальной фонетики в том
числе. Для изучения возможной корреляции между базовыми параметрами динамических
артикуляторных моделей, описываемыми в терминах кинакемной теории, и акустическими
характеристиками звучащей речи нами было предпринято пилотное экспериментальное
исследование. В качестве экспериментального материала были взяты фонозаписи чтения в
нормальном и убыстренном темпе двумя дикторами (мужской и женский голоса) специально
подготовленного набора русских слов (280 слов), сбалансированного по представленности в
нем базовых параметров русской фонетической системы. В соответствии с кинакемной
теорией В.Я. Плоткина в качестве основы описания речевых артикуляций была взята система
кинакем, разработанная им для русского языка и изложенная в книге «Фонологические
кванты» [4]. В ней кинакема рассматривается как некоторый элемент речевой программы,
неразрывно связанный со звуком, который служит его реализации и опознанию, но это не
звук, а квант деятельности, работы по производству и восприятию звука, который
непосредственно связан также и с артикуляторными паттернами. Предметом нашего
исследования стал поиск возможных акустических коррелятов для следующих базовых
признаков системы кинакем русского языка: огубленность, узкорастворность,
широкорастворность, палатализация, активная предцентральность, активная
зацентральность, пассивная зацентральность, смычность, проточность, шумность,
сонорность.
В соответствии с поставленной задачей базовые параметры кинакемной теории были
положены в основу алгоритма полуавтоматической (исполняемой вручную в специальной
программной среде) разметки экспериментальных звуковых файлов. Предполагалось, что
для каждого кинакемного признака можно будет таким образом определить
соответствующие изменения в спектральной картине речевого сигнала, которые
непосредственно связаны с его реализацией. В качестве основной гипотезы предполагалось,
что наиболее адекватным способом отражения этих изменений является подсчет разностного
изменения спектра сигнала в заданном временном промежутке (временном окне).
Для достижения поставленных в ходе лингвистического анализа целей и
последующей математической обработки были созданы оригинальные программные
средства для визуализации, редактирования и разметки звуковых файлов. Соответствующая
программа представлена в виде открытого кода, работающего под управлением
программного пакета Matlab, и состоит из нескольких m-файлов. Она позволяет
одновременно проводить слуховой анализ речевого сигнала и анализ его акустического
представления, визуально представленный в виде спектрограммы (последовательного набора
мгновенных спектров), синхронизированного с ним графика интенсивности исходного
звукового сигнала (амплитудный график) и картинки мгновенного спектра в позиции
курсора. Имеется также средство для установления различных маркеров, которые далее
используются для сохранения и анализа данных о динамике спектральных изменений в
определенном (заданном заранее) временном окне в окрестностях каждого маркера. На
первой стадии исследования в качестве маркеров использовались перечисленные выше
кинакемные признаки. С помощью разработанного программного средства двумя
экспертами-фонетистами – сотрудниками филологического факультета МГУ была
осуществлена разметка подготовленных фонозаписей с целью временной фиксации
моментов реализации теоретически выделяемых речевых единиц низшего (субфонемного)
уровня – кинакем и их признаков.
В целом полученные на первом этапе экспериментального исследования данные
подтверждают выдвинутые нами гипотезы. В частности, они свидетельствуют о том, что
каждой выделяемой экспертом (в полуавтоматическом или в автоматическом режиме)
кинакеме из заявленного списка может быть поставлен в соответствие определенный
достаточно устойчивый паттерн спектральной динамики акустического представления
звукового сигнала. Этот паттерн достаточно стабилен как в нормальном темпе произнесения,
так и при убыстренном темпе речи (хотя и не для всех рассмотренных кинакем в равной
степени). Мы считаем, что, используя разработанные экспериментальные методики, такой
паттерн в дальнейшем может быть выделен экспертом (и/или в автоматическом режиме) по
разным образцам речи (например, с учетом разных типов эмоционально окрашенной речи), а
также – в перспективе – может быть применен для разработки антропоморфных моделей
автоматической идентификации артикуляторных моторных комплексов (как и
соответствующих им звукотипов и/или фонем).