Лингвистический энциклопедический словарь

Аку́стика

речевая (от греч. ἀκουστικός — слуховой) — раздел общей акустики, изучающий структу­ру речевого сигнала, процессы рече­обра­зо­ва­ния и восприятия речи у человека и связанный с разра­бот­кой систем автоматического синтеза и распознавания речи. Процесс рече­обра­зо­ва­ния акустически состоит из двух относительно независимых этапов. Первый из них — возникновение звука в артикуляторном тракте (см. Органы речи, Артикуляция) — может реализоваться тремя способами: путём периоди­че­ской модуляции голосовыми складками воздушного потока, подаваемого из легких (голосовой источник); генерацией шума турбулентными завихрениями того же воздушного потока в сужениях рече­обра­зу­ю­ще­го аппарата (шумовой источник); возбуждением звука путём скачко­образ­но­го изменения давления воздуха при резком раскрытии смычки в артикуляторном тракте (импульсный, или взрывной, источник). Второй этап рече­обра­зо­ва­ния — формиро­ва­ние частотного состава возбуж­дён­но­го звука в акустическом фильтре, образованном активными и пассивными артику­ля­тор­ны­ми органами, и излуче­ние сформиро­ван­но­го звука в пространство через рот и нос.

В зависимости от типа источника возбуждения речевые звуки могут относиться к следующим классам: 1) голосовой источник — гласные и сонорные; 2) шумовой — глухие щелевые и аффрикаты; 3) импульсный — глухие взрывные; 4) голосовой совместно с шумным — звонкие щелевые и аффрикаты; 5) голосовой с импульсным — звонкие взрывные. При работе голосового источника спектр (частотный состав) звука носит дискретный (гармонический) характер. Самая низкая составляющая, соответ­ству­ю­щая частоте смыкания — размыкания голосовых складок, называется основным тоном F0. Частоты остальных дискретных составляющих голосовых звуков получаются умножением F0 на целые числа и называются гармониками основного тона, интенсивность их падает с увеличе­ни­ем частоты. Шумовой и импульсный источники дают спектр сплошного вида.

Речеобразующий тракт может рассматриваться как система акустических резонаторов, в которой могут усиливаться или подавляться отдельные составляющие возбуждённого звука. При этом форми­ру­ет­ся индивидуальное акустическое различие отдельных фонем. Классическая теория предполагает независимость работы механизмов возбуждения звука и резонансного форми­ро­ва­ния его фонемо-различительного облика. Резонансы, служащие для усиления спектральных составляющих излуча­е­мо­го звука, называются формантами, служащие же для подавления (что характерно для носовых и назализованных) — антиформантами. Форманты нумеруются по их частоте от низких к высоким Fк (к = 1, 2, 3, ...; обычно только три). Обычно при аппаратурном анализе речевых сигналов за форманты принимаются выраженные максимумы в амплитудно-частотном спектре. Гласные звуки отличаются от сонорных, имеющих тот же гармонический характер спектра, большей общей интенсивностью (благодаря широкому раскрытию артикуляторного тракта) и большей выражен­но­стью высоких формант. Как для гласных, так и для согласных характерно также противопоставление компактных и диффузных звуков по признаку большей или меньшей концентрации энергии в каком-либо участке спектра. Более тонкие различия звуков определяются конкретным положением формант или полос шумовых состав­ля­ю­щих спектра, а также соотношением интенсивности спектральных состав­ля­ю­щих звука.

Помимо спектрального состава, акустически фонемные различия определяются и временно́й структурой звуков. Для взрывных звуков характерно наличие двух временны́х сегментов — стоп-паузы или звонкой смычки (т. е. отсутствия звука вообще или только голосового звука) и взрыва (срабатывает либо только импульсный источник, либо совместно с голосовым), для аффрикат — постепенное изменение спектра по мере расширения щели в артикуляторном тракте.

В слитной речи реализуется непрерывный переход от одного артикуляторного уклада к другому, что приводит к непрерывному изменению акустической картины. С относительной достоверностью могут быть выделены стационарные и переходные участки. Последние характе­ри­зу­ют взаимо­дей­ствие двух артикуляторных укладов и являются источником дополнительной информации о фонемах, взаимо­дей­ству­ю­щих в потоке речи. В ряде случаев в потоке речи «стационарный» участок, харак­тер­ный для изолированного произнесения звука, может вырождать­ся вплоть до полного исчезновения.

Высказывание в целом характеризуется также просодической структурой, которая акустически проявляется в виде изменения частоты основного тона во времени, изменения длительности и интенсивности сегментов.

Основы речевой акустики были заложены Г. Л. Ф. Гельмгольцем. Важным этапом в её развитии явилась работа японских исследователей Ц. Тиба и М. Кадзияма (Chiba T., Kajiyama M., The vowel, its nature and structure, Tokyo, 1941), разработавших теорию расчёта акустического сигнала по данным о форме артикуляторного тракта. Дальнейшая конкретная разработка теории рече­обра­зо­ва­ния связана с именами Г. Фанта и Дж. Л. Фланагана.

В. И. Галунов.