Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Оценивание артикуляционной и словесной разборчивости речи






При достаточно больших уровнях шума эффективный уровень ощущения речевого сигнала в каждом из частотных каналов равен отношению сигнал-шум в этом канале [1, 2]:

. (4)

Эффективный уровень ощущения формант вычисляют, уменьшая (4) на разницу спектральных уровней речи и формант:

, (5)

где - центральные частоты каналов;

. (6)

Артикуляционную (формантную) разборчивость вычисляют как сумму разборчивостей формант в каждой из полос:

, (7)

где - коэффициент восприятия речи:

, (8)

- вероятность пребывания формант в -том частотном диапазоне, ограниченном частотами и :

, (9)

. (10)

Словесная разборчивость может быть вычислена по формантной разборчивости:

. (11)

Учитывая громоздкость приведенных выше соотношений, вычисления проще реализовать в виде m-файла:

% ==============================================

% вычисление формантной и словесной разборчивости

% ==============================================

% ===== входные данные: ======

i = 1: 5;

Q(1) = q1(1, 1, end); Q(2) = q2(1, 1, end); Q(3) = q3(1, 1, end); Q(4) = q4(1, 1, end); Q(5) = q5(1, 1, end);

f0 = [250; 500; 1000; 2000; 4000]; % центральные частоты полос анализа

fn = [180; 355; 710; 1400; 2800]; % нижние граничн.частоты полос анализа

fv = [355; 710; 1400; 2800; 5600]; % верхние граничн.частоты полос анализа

%

% ===== уровни ощущен. ========

for i = 1: 5

if f0 < = 1000

E(i) = Q(i) - (200/f0(i).^0.43-0.37);

Else

E(i) = Q(i) - (1.37+1000/f0(i).^0.69);

End

End

%

% ===== коэф.воспр. =======

for i = 1: 5

if E(i) < = 0

P(i) = (0.78+5.46*exp(-4.3*10^(-3)*(27.3-abs(E(i))).^2))/(1+10^(0.1*abs(E(i))));

Else

P(i) = 1-(0.78+5.46*exp(-4.3*10^(-3)*(27.3-abs(E(i))).^2))/(1+10^(0.1*abs(E(i))));

End

End

%

% ======== вер-сти формант ======

for i = 1: 5

if f0(i) < = 400

pv(i) = 2.57*10^(-8)*(fv(i).^2.4-fn(i).^2.4);

Else

pv(i) = 1.074*(exp(-10^(-4)*fn(i).^1.18)-exp(-10^(-4)*fv(i).^1.18));

End

End

%

% ======== артикуляционная (формантная) разборчивость ========

A = sum(pv.*P);

%

% ======== словесная разборчивость =========

if A< 0.15

W = 1.54*A^0.25*(1-exp(-11*A));

Else

W = 1-exp(-11*A/(1+0.7*A));

End

% вывод результатов на дисплей

disp('Формантн.разборч. = '), disp(A);

disp('Словесн.разборч. = '), disp(W);

 

Пример 1. Для отношения сигнал-шум – 18, 7 дБ получены:

формантная разборчивость A = 0.0041, словесная разборчивость W = 0.0172.

Пример 2. Для отношения сигнал-шум – 14, 7 дБ получены:

формантная разборчивость A= 0.0104, словесная разборчивость W = 0.0531

Полученные результаты хорошо согласуются с таковыми для среднестатистического спектра речевого сигнала (полученного путем усреднения нескольких тысяч спектров речи разных дикторов).






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.