Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Методы озвучивания речи






Рассмотрим какой-нибудь хотя бы минимально осмыслен­ный текст. Текст состоит из слов, разделенных пробелами и зна­ками препинания. Произнесение слов зависит от их расположения в предложении, а интонация фразы — от знаков препинания и довольно часто от типа применяемой грамматической конструкции — в ряде случаев при произнесении текста слышится явная пауза, хотя какие-либо знаки препинания отсутствуют. Произнесение зависит и от смысла слова — сравните, на­пример, выбор одного из вариантов «замок» или «замок» для од­ного и того же слова «замок».

Основная классификация стратегий, применяемых при озву­чивании речи — это разделение на две группы подходов:

• построение действующей модели речепроизводящей систе­мы человека;

• моделирование акустического сигнала как таковой.

Первый подход известен под названием артикуляторного синтеза. Второй подход представляется на сегодняш­ний день более простым, поэтому он гораздо лучше изучен и практически более успешен. Внутри него выделяется два основ­ных направления — формантный синтез по правилам и компилятивный синтез.

Формантные синтезаторы используют возбуждающий сиг­нал, который проходит через цифровой фильтр, построенный на нескольких резонаторах, похожих на резонансы голосового трак­та. Разделение возбуждающего сигнала и передаточной функции голосового тракта составляет основу классической акустической теории речеобразования. Компилятивный синтез осуществляется путем склейки нужных единиц компиляции из имеюще­гося инвентаря.

На этом принципе построен ряд систем, использующих раз­ные типы единиц и различные методы составления инвентаря. В таких системах необходимо применять обработку сигнала для приведения частоты основного тона, энергии и длительности единиц к тем, которыми должна характеризоваться синтезируе­мая речь. Кроме того, требуется, чтобы алгоритм обработки сиг­нала сглаживал разрывы в формантной (и спектральной в це­лом) структуре на границах сегментов.

И системах компилятивного синтеза применяются два разные типа алгоритмов обработки сигнала: LP (Linear Prediction — линейноe предсказание) и PSOLA (Pitch Synchronous Overlap

and Add). LP-синтез основан в значительной степени на акустической теории речеобразования, в отличие от PSOLA-синтеза, который действует путем простого разбиения звуковой волны,

составляющей единицу компиляции, на временные окна и их преобразования. Алгоритмы PSOLA позволяют добиваться хоро­шего сохранения естественности звучания при модификации исходной звуковой волны.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.