Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Воспроизведение голосовых команд






Как же осуществляется «разговор» компьютера с оператором? Обычно применяется два метода преобразования текстовых команд в речь, которую слышит оператор: «Текст в речь» (Text-to-Speech, TTS) и «Цифровая запись речи» (Digitized Speech).

«Текст в речь» – наиболее широко используемая современная технология воспроизведения речевых команд в голосовых системах. Как следует из ее названия, программное обеспечение системы TTS преобразует текстовые команды, поступающие от WMS, в синтезированные (генерируемые компьютером) голосовые команды, которые содержат указания оператору, в том числе главные: где именно следует комплектовать следующий заказ и количество подбираемых продуктов. Генерируемая компьютером голосовая команда звучит как всем знакомый голос из телефона, сообщающий о неправильно набранном номере, или голос автомобильной навигационной системы, так что операторы привыкают к голосу за считанные минуты. Большинство операторов, ежедневно работающих с этой системой, предпочитают получать информацию очень быстро, поэтому голосовая система должна иметь простой и понятный регулятор темпа речи. Когда оператор становится более опытным или если того требует характер выполняемой работы, он может самостоятельно увеличивать темп поступления команд. Благодаря такой гибкости системы увеличивается производительность труда, причем точность выполнения заданий при этом не страдает.

Устройства преобразования текста в речь способны работать на многих языках, благодаря чему каждый член многонационального коллектива может получать информацию на понятном ему языке, регулируя к тому же и темп речи. Так, во многих существующих голосовых системах устройства преобразования текста в речь «знают» до 14 языков!

«Цифровая запись речи». Эта технология известна как система «Записи и воспроизведения» (Record and Playback), поскольку воспроизводит предварительно записанную речь реального человека. Запись хранится в виде цифровых файлов, фразы воспроизводятся по мере необходимости. В этом случае голос звучит гораздо «человечней», но возможности системы серьезно ограничиваются тем, что компьютер способен воспроизводить исключительно те фразы, что были заранее записаны. Например, если оператор следует к месту расположения товара и просит подробней описать груз, компьютер сможет выдать информацию лишь в том случае, если подробное описание товара было предварительно записано в голосовой системе. Учитывая динамичный характер работы абсолютного большинства складских комплексов с их постоянной сменой номенклатуры товаров, «лексикон» систем с «цифровой записью речи» весьма трудно поддерживать в адекватном состоянии. А если на складе трудится многонациональный коллектив, это вносит еще одну дополнительную проблему – новые команды придется записывать на многих языках! В результате пользование системой может вызвать недовольство работников, так как не обеспечит их полной информацией для выполнения профессиональных обязанностей. Кроме того, чтобы дать возможность операторам увеличивать темп аудиокоманд (а значит, и производительность), в некоторых системах «Записи и воспроизведения» требуется создавать и сохранять множество версий цифровых аудиофайлов разной «скорости». Таким образом, подобный метод увеличивает стоимость создания, эксплуатации и управления устройством воспроизведения команд голосовой системы.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.