Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Структура системы машинного перевода и назначение её основных блоков.






Системы машинного перевода (СМП) являются моделями, которые воспроизводят на ПК речевое поведение человека, переводящего текст с одного языка на другой язык.

 

1. В процессе морфологического анализа слов предложения исходного языка, каждое слово получает наборы лексико-грамматических признаков. ПК формирует эти наборы с опорой на двуязычный автоматический словарь.

2. Синтаксический анализ предложений исходного языка сводится к поиску основных членов предложения (выделения подлежащего, сказуемого и т.д.), формируется структура.

3. Синтаксический синтез предложений переводного языка заключается: а) в создании структуры предложений переводного языка, определяемый правилами ПЯ и ИЯ, что выполняется на основе блока «синтаксические соответствия»; б) замена слов исходного языка на их переводные эквиваленты.

4. Каждое слово предложения ПЯ ставится в нужную форму, для чего используется двуязычный словарь.

Успех СМП во многом зависит от автоматических словарей. При создании словаря решаются следующие задачи:

1. Выбор типа лексической единицы для словаря; используется два способа представления лексической единицы: а) в виде словоформ, т.е. в словарь заносятся всевозможные формы каждого слова и подаются гнёздами; б) в виде квазиосновы: выключ. # … 003 (числа, стоящие после решётки наборы лексико-грамматических признаков (суффикс, окончание и т.д.), которые необходимо присоединить к основе, чтобы получить соответствующие формы слов, они называются типами форм слов).

2. Отбор лексики для входного словаря и отбор переводных эквивалентов для выходного словаря.

При выборе лексической единицы словоформу целесообразно использовать для языков аналитического типа (английский, французский, т.е. те, которые имеют мало форм), а для флективных и аглюциативных целесообразно использовать квазиоснову (русский, немецкий, белорусский).

(Вывод) Обе технологии машинного перевода имеют свои положительные и отрицательные стороны. Поэтому наметилась тенденция объединить оба метода. Promt уже два года разрабатывает гибридную систему перевода, что позволит:

1. сохранить преимущества традиционной технологии (формирование синтаксически связанного и грамматически правильного текста)

2. получить преимущества (быстрая обучаемость)

3. получение данных из параллельных корпусов и гладкость текста.

Promt, Systran (на западе)

Преимущества использования СМП:

1. ускорение перевода à экономия времени

2. МП научно0технических документов приближается к переводу, выполненному человеком

3. можно доверить перевод конфиденциальной информации

4. экономия денег

5. облегчает просмотр веб-сайтов

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.