Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Документация программного средства






4.1 Техническое задание

Тема: Разработка программного средства идентификации личности по голосу.

Цель проекта: Целью проекта является разработка программного средства идентификации личности по голосу, вероятность ошибки которого сведена к минимуму.

Научный руководитель: Парсаев Николай Владимирович.

Область применения: Данное программное средство может использоваться на практике для доступа к компьютеру или определенных программных продуктов.

4.1.1 Основания для разработки

Разработка программного средства ведется на основании задания, полученного при выборе темы дипломного проекта.

Разработчиком программного средства является Стариков Константин Андреевич, студент Поволжского государственного технологического университета, факультета информатики и вычислительной техники, группа БИс-51.

4.1.2 Назначение разработки

Функциональным назначением программного средства является преобразование обычной записи речи человека в кестральные коэффициенты, необходимые для последующей идентификации.

Эксплуатационное назначение программного средства - это идентификация личности по голосу. Если быть точнее, то данная программа нужна для того, чтобы ограничивать доступ лицам, которые не зарегистрированы в базе данных.

4.1.3 Требования к программному средству

Разрабатываемое программное средство должно выполнять несколько функций:

· идентификация / не идентификация личности по голосу;

· доступ / запрет в доступе на основании результатов, полученных в пункте выше;

· выявлять незарегистрированных пользователей.

Программное средство должно иметь минимальную возможность ошибочной идентификации, при условии, что создать программу, которая бы на 100% давала правильный вывод невозможно.

Чтобы данная программа успешно работала на компьютере, необходимо выполнение рекомендуемых требований:

· тактовая частота процессора не менее 800 МГц;

· ОС Windows 7 и старше;

· не менее 512 Мб оперативной памяти;

· не менее 512 Мб графической памяти;

·.Net Framework версии 4.0 и старше;

· Super Video Graphics Array (SVGA) монитор;

· клавиатура любого производителя;

· компьютерная мышь любого производителя.

4.1.4 Требования к программной документации

Требования к программной документации - это перечень документов, которые прилагаются к программному средству:

· техническое задание (основания для разработки, назначение разработки, области применения, требования к программному средству);

· руководство системного программиста (информация о устройстве программы, основных функциях, возможных ошибках и путей их исправления);

· руководство администратора (информация об установке программного средства, его эксплуатации и обслуживании);

· руководство пользователя (информации, необходимая для упрощения эксплуатации программы пользователями).

4.2 Руководство системного программиста

4.2.1 Общие сведения о программном средстве

Программное средство предназначено для идентификации личности по голосу, запрета в доступе лиц не прошедших идентификацию, и допуск для тех, кто удачно прошел данный этап.

4.2.2 Структура программного средства

Программное средство состоит из 2 частей - основная программа и база данных.

Основная программа имеет графический интерфейс и предназначена для регистрации новых пользователей, а так же идентификации пользователя по голосу. На входе основной программы человеческая речь, а на выходе кепстральные коэффициенты, которые при сравнении дают результат: идентифицировать или не идентифицировать человека.

База данных состоит из главного файла, где хранятся все логины зарегистрированных пользователей, а так же файлы, в которых находятся все кепстральные коэффициенты каждого пользователя отдельно.

Во время работы программы идет прямое взаимодействие основной программы и базы данных. При регистрации в основной программе данные пользователя сохраняются в базе данных, а так же при идентификации идет прямое обращение к базе данных, чтобы сравнить кепстральные коэффициенты, которые там записаны, и вывести результат на экран.

В таблице 4.1 представлены все основные функции программного средства, а так же их описания.

Таблица 4.1 Основные функции программного средства

Название функции Описание функции
waveInOpen (& hWaveIn, WAVE_MAPPER, & pFormat, 0L, 0L, WAVE_FORMAT_DIRECT) Открывает устройство записи звука, то есть микрофон.
waveInPrepareHeader (hWaveIn, & WaveInHdr, sizeof(WAVEHDR)) Подготавливает буфер к передаче устройству записи. hWaveIn - идентификатор устройства, полученный функцией waveInOpen. В параметре & WaveInHdr программа передает в функцию указатель на структуру типа WAVEHDR, содержащую описание буфера и ссылку на массив передаваемых данных.
waveAddBuffer (hWaveIn, & waveInHdr, sizeof(WAVEHDR)) Передает подготовленный буфер памяти драйверу устройства ввода.
waveInStart (hwaveIn) Запускает процесс ввода данных.
waveInClose (hWaveIn) Закрывает устройство ввода.
fopen(fileToOpen, " r") Считывание файла с признаками из базы данных.
void WriteAudio (string name) Запись речи, произнесенной в микрофон.
int StartRecord (char* data, int lenght) Функция захвата аудио.
int StartPlayback (char* data, int lenght) Функция воспроизведения.
allocationSegment (SignalWavAddZero, NSegment, IndexSegment) Разбитие входного сигнала на перекрывающие области.
mFilter (n, N) Фильтр для каждого сегмента входной записи, с целью ликвидации посторонних шумов.
PSpectrSegment() Вычисляет спектр каждого сегмента.
Half(K_Filtr, C, 1, ff) Построение треугольных перекрывающих фильтров в мел-частотной области.
KepstrKoeffSegment (PSpectrSegment, NSpectrSegment, K_Filtr) Вычисление мел-частотных кепстральных коеффициентов для каждого сегмента.
Rasstmin (C1, C2) Расчет евклидового расстояния между двумя записями речи.

 

4.3 Руководство администратора

4.3.1 Назначение и условия применения

Программное средство предназначено для идентификации личности по голосу, запрета в доступе лиц не прошедших идентификацию, и допуск для тех, кто удачно прошел данный этап.

Чтобы данная программа успешно работала на компьютере, необходимо выполнение рекомендуемых требований:

· тактовая частота процессора не менее 800 МГц;

· ОС Windows 7 и выше;

· не менее 512 Мб оперативной памяти;

· не менее 512 Мб графической памяти;

·.Net Framework версии 4.0 и старше;

· Super Video Graphics Array (SVGA) монитор;

· клавиатура любого производителя;

· компьютерная мышь любого производителя.

4.3.2 Установка программного средства

Установка основной программы идентификации личности по голосу и базы данных не требуется.

4.3.3 Характеристики программного средства

Данное программное средство требовательно к записывающему устройству, а точнее: при идентификации оно должно быть тем же, что и при регистрации пользователя, во избежание некорректной идентификации.

4.3.4 Настройка программного средства

Настройка программы заключается в правильных настройках записывающего устройства - микрофона. Необходимые параметры для записи:

· частота дискретизации - 44100 Гц;

· число каналов - 1;

· кодирование 16 бит.

База данных располагается в директории с программой и не требует настройки.

4.3.5 Входные и выходные данные

Входные данные программного средства - это голос, который записан на микрофон во время работы программы

Выходными данными являются кепстральные коэффициенты, которые были получены в ходе выполнения алгоритма программы. Эти коэффициенты сравниваются с коэффициентами, полученными при регистрации пользователя, после чего на экран выводится сообщение о идентификации или не идентификации.

4.3.6 База данных программного средства

База данных программного средства хранится в файлах, которые зашифрованы. Она состоит из файла, где находятся все логины зарегистрированных пользователей (рисунок 4.1), а так же множества файлов, в которых хранятся мел-частотные кепстральные коэффициенты каждого пользователя по отдельности (рисунок 4.2).

Рисунок 4.1 Файл с логинами зарегистрированных пользователей

Рисунок 4.2 Файл с коэффициентами отдельного пользователя

Как мы видим, коэффициенты записаны по 12 в столбик, чтобы наглядно показать их количество на каждом отдельном сегменте речевого сигнала.

4.4 Руководство оператора

4.4.1 Назначение и условия применения

Программное средство предназначено для идентификации личности по голосу, запрета в доступе лиц не прошедших идентификацию, и допуск для тех, кто удачно прошел данный этап.

Чтобы данная программа успешно работала на компьютере, необходимо выполнение рекомендуемых требований:

· тактовая частота процессора не менее 800 МГц;

· ОС Windows 7 и выше;

· не менее 512 Мб оперативной памяти;

· не менее 512 Мб графической памяти;

·.Net Framework версии 4.0 и старше;

· Super Video Graphics Array (SVGA) монитор;

· клавиатура любого производителя;

· компьютерная мышь любого производителя.

4.4.2 Выполнение программного средства

Основная программа состоит из:

1. Панель инструментов, где можно совершить выход из программы, а так же узнать информацию о программе и кто ее написал:

- при нажатии на выход, осуществляется полный выход из программы (рисунок 4.3);


 

Рисунок 4.3 Меню с выходом из программы

- во вкладке " справка" можно узнать информацию о программе (рис.4.4);

Рисунок 4.4 Справка о программе

- окно с информацией о программе: название, кто разработал программу и в каком году (рисунок 4.5);

Рисунок 4.5 Информация о программе


 

2. Поле с вводом логина (рисунок 4.6):

Рисунок 4.6 Поле для ввода логина

Если введенный логин не найден в базе данных, то выводится сообщение " ПОЛЬЗОВАТЕЛЬ НЕ НАЙДЕН" (рисунок 4.7):

Рисунок 4.7 Регистрация нового пользователя

3. Если вы не зарегистрированы в системе, то вам следует пройти регистрацию нового пользователя (рисунок 4.8):

Рисунок 4.8 Регистрация нового пользователя

При нажатии на данную ссылку появится кнопка " ЗАПИСАТЬ ГОЛОС" (рисунок 4.9):

Рисунок 4.9 Запись голоса нового пользователя

В специально выделенное поле ввода записывается будущий логин пользователя. Далее, при нажатии на кнопку " Записать голос", пользователь должен произнести определенную фразу, будь то его имя и фамилия, либо что-то другое. При успешной регистрации всплывет окно " ПОЛЬЗОВАТЕЛЬ ДОБАВЛЕН" (рисунок 4.10):

Рисунок 4.10 Успешная регистрация пользователя

Из этого следует, что регистрация прошла успешна, пользователь добавлен в базу данных программы и может проходить процедуру идентификации.

4. После того, как был введен логин, следует нажать кнопку " идентификация". Далее вы снова произносите речь, которую говорили при регистрации нового пользователя. В случае, если вы не проходите идентификацию, появляется надпись " НЕ СОВПАДЕНИЕ", то есть записанный голос не совпадает с голом, который хранится в базе данных.Так же на экран выводятся спектрограммы записанного голоса и голоса из БД (рисунок 4.11):


 

Рисунок 4.11 Неудачная идентификация

Если ваши голоса совпали, то так же выводится сообщение " СОВПАДЕНИЕ" и на экран выводятся спектрограммы совпавших голосов (рисунок 4.12). Идентификация пройдена.

Рисунок 4.12 Успешная идентификация


 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.