Анализ нерегулярностей основного тона при исследовании речи

Лингвистическая экспертиза - Подать заявкуЛингвистическая экспертиза - Стоимость
Анализ нерегулярностей основного тона при исследовании речи

Анализ нерегулярностей основного тона при исследовании речи

Опыт исследования реальных звукозаписей, накопленный в РФЦСЭ при Минюсте России, показывает, что определение численных характеристик идентификационных признаков, связанных с анализом частоты основного тона фигуранта криминалистической экспертизы звукозаписи (КЭЗ), сопряжено со значительными трудностями. Эти трудности вызваны не только плохой сопоставимостью реального речевого материала исходных и сравнительных записей[1], но и тем, что наличие на фонограммах сильных шумов, помех и искажений ещѐ больше усложняет проведение инструментальных измерений. Заметим, что результаты измерений зависят также от принятой методики статистической обработки полученных данных.

Кроме того, в процессе инструментальной части идентификационного исследования личности говорящего требуется не только определить характеристики источника возбуждения его речевого тракта в соответствии с моделью Г. Гельмгольца[2], но и проанализировать (в случае их появления) нерегулярности основного тона (далее — ОТ) с целью контроля получаемых в процессе экспертного идентификационного исследования результатов.

Лингвистическая экспертиза - Онлайн-заявка

Всѐ это делает необходимым проверку экспертами КЭЗ достоверности получаемых характеристик частоты основного тона (далее — ЧОТ). Общепринятым (и наиболее простым и наглядным) контрольным методом определения характеристик ЧОТ по осциллограммам речевого сигнала является измерение интервалов между смежными пиками речевой волны, представляющими собой биения гармоник основного тона на звонких звуках речи. Оговоримся, что наблюдаемые флуктуации длительности интервалов могут значительно превышать соответствующие нерегулярности периодов основного тона, полученные на основе измерений ЧОТ по сигналам контактного микрофона — ларингофона, укрепленного на гортани диктора. Известно[3], что частотный диапазон изменения основного тона при телефонных разговорах для мужских голосов находится в пределах 70-180 Гц со средней частотой Fом = 129 Гц и для женских — в пределах 180-330 Гц со средней частотой Fож = 240 Гц. Средне-квадратическое отклонение sF0 равно 17 и 27 Гц соответственно[4]. Нетрудно подсчитать относительный диапазон изменения основного тона DFo с доверительной вероятностью p=0,95 для мужских голосов:

analiz-neregulyarnostey-osnovnogo-tona-pri-issledovanii-rechi-1

Для женских DFож =1,6. На начальных и конечных интервалах тональных участков речи скорость изменения частоты ОТ может достигать 1500-6000 Гц/с.

Значительная вариативность смежных периодов пиков речи затрудняет проведение точных измерений частоты и периодов основного тона, а в ряде случаев может привести к ошибкам. Так, в результате наблюдения осциллограмм английской речи Л. Долански[5] пришел к выводу, что участки, на которых интервалы между смежными пиками на звонких смычных иногда удваиваются, соответствуют удвоению интервалов колебаний голосовых складок, т.е. увеличению периодов ОТ в 2 раза. Причиной подобных нерегулярностей сигнала, по мнению этого автора, может быть большая скорость изменения частоты формант и низкая частота основного тона, особенно в конце фраз.

Интересные примеры нестабильности интервалов между пиками речевого сигнала на осциллограмме наблюдались в наших экспертных исследованиях. На рис. 1 изображен фрагмент осциллограммы слова работа, взятого из фразы диктора мужчины.

analiz-neregulyarnostey-osnovnogo-tona-pri-issledovanii-rechi-2

На участке осциллограммы соответствующем озвонченному согласному m (рис. 2) частота пиков равна 200 Гц против 100 Гц на соседних гласных.

analiz-neregulyarnostey-osnovnogo-tona-pri-issledovanii-rechi-3

Однако спектральный срез этих участков (сравним рис. 3 и 4) свидетельствует лишь об изменении соотношения амплитуд гармоник в соответствии с изменениями частоты первой форманты на гласном о и смычном т.

analiz-neregulyarnostey-osnovnogo-tona-pri-issledovanii-rechi-4

На рис. 5 приведен фрагмент осциллограммы слова бизнес в произношении диктора женщины.

analiz-neregulyarnostey-osnovnogo-tona-pri-issledovanii-rechi-5

Наглядно видно удвоение частоты основного тона — максимальная гармоника на гласном и равна 400 Гц (сравним рис. 6 и 7).

analiz-neregulyarnostey-osnovnogo-tona-pri-issledovanii-rechi-6

Известные выделители основного тона (например, многоканальный временной выделитель) неизбежно дают на таких участках сбои в виде удвоения частоты ОТ, хотя на слух скачка основного тона на речевом сигнале, конечно, не отмечается.

Таким образом, в процессе инструментального исследования параметров основного тона следует критически относиться к подобным данным и, исходя из природы явления, видеть отличие описанной нерегулярности основного тона по причине сбоя программы выделителя от «скачка» ОТ (последний может служить признаком монтажа анализируемой фонограммы). Оговоримся, что рассмотренные нерегулярности, конечно, не должны включаться в статистические показатели основного тона, которые используются в задаче криминалистической идентификации личности по голосу и звучащей речи.

Приведенные примеры показывают, что в процессе анализа индивидуальных акустических признаков, характеризующих функционирование источника возбуждения речевого тракта говорящего, эксперту необходимо надлежащим образом контролировать полученные результаты с целью избежания ошибок и обеспечения достоверности экспертного исследования.

Автор:
А. Ш. Каганов — Заведующий лабораторией РФЦСЭ при Минюсте России, канд. техн. наук, ст. науч. сотр.


  1. Каганов А.Ш., Михайлов В.Г. Особенности оценивания параметров основного тона при фонографической экспертизе // Тез. Международной конференции «Информатизация правоохранительных систем». М., 1999.
  2. Helmholts H. Die Lehre von den Tonempfindungen als physiologische Grundlage fur die Theorie der Musik. Braunschweig, 1870.
  3. Златоустова Л.В., Михайлов В.Г. Измерение параметров речи. М: Радио и связь, 1987.
  4. Среднестатистические данные для 50 дикторов каждого пола.
  5. Dolansky L. On certain irregularities of voiced speech waveforms // IEEE Tr. on Audio and El. 1968. V. AU-16. № 1.
Нашли в тексте ошибку? Выделите её, нажмите Ctrl + Enter, и мы всё исправим!