- Акустика
-
Аку́стика
речевая (от греч. ἀκουστικός — слуховой) — раздел общей акустики, изучающий структуру речевого сигнала, процессы речеобразования и восприятия речи у человека и связанный с разработкой систем автоматического синтеза и распознавания речи. Процесс речеобразования акустически состоит из двух относительно независимых этапов. Первый из них — возникновение звука в артикуляторном тракте (см. Органы речи, Артикуляция) — может реализоваться тремя способами: путём периодической модуляции голосовыми складками воздушного потока, подаваемого из легких (голосовой источник); генерацией шума турбулентными завихрениями того же воздушного потока в сужениях речеобразующего аппарата (шумовой источник); возбуждением звука путём скачкообразного изменения давления воздуха при резком раскрытии смычки в артикуляторном тракте (импульсный, или взрывной, источник). Второй этап речеобразования — формирование частотного состава возбуждённого звука в акустическом фильтре, образованном активными и пассивными артикуляторными органами, и излучение сформированного звука в пространство через рот и нос.
В зависимости от типа источника возбуждения речевые звуки могут относиться к следующим классам: 1) голосовой источник — гласные и сонорные; 2) шумовой — глухие щелевые и аффрикаты; 3) импульсный — глухие взрывные; 4) голосовой совместно с шумным — звонкие щелевые и аффрикаты; 5) голосовой с импульсным — звонкие взрывные. При работе голосового источника спектр (частотный состав) звука носит дискретный (гармонический) характер. Самая низкая составляющая, соответствующая частоте смыкания — размыкания голосовых складок, называется основным тоном F0. Частоты остальных дискретных составляющих голосовых звуков получаются умножением F0 на целые числа и называются гармониками основного тона, интенсивность их падает с увеличением частоты. Шумовой и импульсный источники дают спектр сплошного вида.
Речеобразующий тракт может рассматриваться как система акустических резонаторов, в которой могут усиливаться или подавляться отдельные составляющие возбуждённого звука. При этом формируется индивидуальное акустическое различие отдельных фонем. Классическая теория предполагает независимость работы механизмов возбуждения звука и резонансного формирования его фонемо-различительного облика. Резонансы, служащие для усиления спектральных составляющих излучаемого звука, называются формантами, служащие же для подавления (что характерно для носовых и назализованных) — антиформантами. Форманты нумеруются по их частоте от низких к высоким Fк (к = 1, 2, 3, ...; обычно только три). Обычно при аппаратурном анализе речевых сигналов за форманты принимаются выраженные максимумы в амплитудно-частотном спектре. Гласные звуки отличаются от сонорных, имеющих тот же гармонический характер спектра, большей общей интенсивностью (благодаря широкому раскрытию артикуляторного тракта) и большей выраженностью высоких формант. Как для гласных, так и для согласных характерно также противопоставление компактных и диффузных звуков по признаку большей или меньшей концентрации энергии в каком-либо участке спектра. Более тонкие различия звуков определяются конкретным положением формант или полос шумовых составляющих спектра, а также соотношением интенсивности спектральных составляющих звука.
Помимо спектрального состава, акустически фонемные различия определяются и временно́й структурой звуков. Для взрывных звуков характерно наличие двух временны́х сегментов — стоп-паузы или звонкой смычки (т. е. отсутствия звука вообще или только голосового звука) и взрыва (срабатывает либо только импульсный источник, либо совместно с голосовым), для аффрикат — постепенное изменение спектра по мере расширения щели в артикуляторном тракте.
В слитной речи реализуется непрерывный переход от одного артикуляторного уклада к другому, что приводит к непрерывному изменению акустической картины. С относительной достоверностью могут быть выделены стационарные и переходные участки. Последние характеризуют взаимодействие двух артикуляторных укладов и являются источником дополнительной информации о фонемах, взаимодействующих в потоке речи. В ряде случаев в потоке речи «стационарный» участок, характерный для изолированного произнесения звука, может вырождаться вплоть до полного исчезновения.
Высказывание в целом характеризуется также просодической структурой, которая акустически проявляется в виде изменения частоты основного тона во времени, изменения длительности и интенсивности сегментов.
Основы речевой акустики были заложены Г. Л. Ф. Гельмгольцем. Важным этапом в её развитии явилась работа японских исследователей Ц. Тиба и М. Кадзияма (Chiba T., Kajiyama M., The vowel, its nature and structure, Tokyo, 1941), разработавших теорию расчёта акустического сигнала по данным о форме артикуляторного тракта. Дальнейшая конкретная разработка теории речеобразования связана с именами Г. Фанта и Дж. Л. Фланагана.
- Фант Г., Акустическая теория речеобразования, пер. с англ., М., 1964;
- Фланаган Д. Л., Анализ, синтез и восприятие речи, пер. с англ., М., 1968;
- Физиология речи. Восприятие речи человеком, под ред. Л. А. Чистович, Л., 1976;
- Бондарко Л. В., Фонетическое описание языка и фонологическое описание речи, Л., 1981;
- Сорокин В. Н., Теория речеобразования, М., 1985.
В. И. Галунов.
Лингвистический энциклопедический словарь. — М.: Советская энциклопедия. Гл. ред. В. Н. Ярцева. 1990.