Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Основные направления современной прикладной лингвистики






В рамках направления компьютерная лингвистика в широком смысле слова объединяются как компьютерное моделирование с целью проверки адекватности теоретических формально-математических моделей языка и его отдельных уровней, так и применение различных математических методов для решения конкретных прикладных задач в различных системах обработки информации.
Среди современных направлений компьютерной лингвистики можно выделить следующие:

1. Машинный перевод

2. Речевые технологии (в частности, автоматическое распознавание речи, ASR – automatic speech recognition)

3. Лингвистическое обеспечение информационного поиска

4. Автоматическое извлечение данных (Data Mining)

5. Автоматическое реферирование текстов

6. Создание электронных лексикографических ресурсов (словарей, онтологий)

7. Корпусная лингвистика (создание и использование электронных корпусов текстов)

8. Разработка вопросно-ответных систем

Часть данных направлений, а также разработка систем автоматического анализа на разных языковых уровнях: морфологических анализаторов (парсеров), систем автоматического синтаксического анализа и т.п. часто выделяют в отдельную область - автоматическая обработка естественного языка (Natural Language Processing, NLP — общее направление искусственного интеллекта и компьютерной лингвистики.)

43. Классификация лингвистических моделей.

Тут наверное информация и на 42 билет потянет, может не совсем полный ответ, но куски есть

1. по охвату структуры языка:
* общие (глобальные) стремятся охватить весь язык: (vocabulary, grammar)
* частные: фонетическая модель русского языка, модель системы гласных

Частная модель обычно входит в набор частных моделей, описывающий определенный уровень языка:
• фонологический уровень
• морфологический уровень
• синтаксический
• лексико-семантический
2. по типологическому статусу:
* универсальные стремятся охватить все языки мира:
* специфические характерны для определенного языка или группы языков: мягкость - твердость согласных рус. языка (не действует в англ., франц.)
3. по гносеологическому статусу:
* модели языка
* модели лингвистических знаний (различные линг.школы)
* модели деятельности лингвиста
4. по конечной цели исследования
* теоретические
* описательные
* прикладные

5. по используемым методам
* математические модели
* психологические модели
* социологические модели

6. по функциональному статусу
* абстрактно обобщающие модели
* действующие

7. по используемым материальным средствам
* графические
* символьные
* компьютерные


8. В зависимости от предмета моделирования и того, какая сторона речевой деятельности является предметом моделирования, модели речевой деятельности делятся на модели анализа, модели синтеза, порождающие и исследовательские.

• Моделью анализа называется конечное число правил, способных проанализировать бесконечное число предложений данного языка. Синтаксические аналитические модели получают на «входе» текст, а на «выходе» выдают для каждого предложения запись его синтаксической структуры. Семантические аналитические модели получают на «входе» тот же материал, а на «выходе» выдают смысловую запись (изображение смысла) каждого предложения на специальном семантическом языке.

• Моделью синтеза называется конечное число правил, способных построить бесконечно большое число правильных предложений. Синтаксические синтетические модели используют в качестве исходной информации запись синтаксической структуры предложений, а на выходе выдают правильные предложения данного языка. Семантические синтетические модели получают на входе смысловую запись некоторого предложения на специальном семантическом языке и выдают на выходе множество предложений естественного языка, синонимичных данному предложению.

• Помимо моделей анализа и синтеза, существуют еще так называемые порождающие модели, в некотором смысле промежуточные между моделями анализа и синтеза. Порождающей моделью называется устройство, содержащее алфавит символов и конечное число правил образования (и преобразования) выражений из элементов этого алфавита, способное построить бесконечное множество правильных предложений данного языка и приписать каждому из них некоторую структурную», характеристику.

• Исследовательские модели можно подразделить на три класса в зависимости от того, какая информация используется в них в качестве исходной. В моделях первого класса в качестве исходной информации используется только текст, и все сведения о системе, т.е. языке, порождающем этот текст, извлекаются исключительно из текстовых данных. Это классические дешифровочные модели. В моделях второго класса считается заданным не только текст, но и множество правильных фраз данного языка. Практически это значит, что при разработке модели лингвист прибегает к помощи информанта, который по поводу каждой предъявляемой ему фразы должен говорить, правильна она или нет. Информантом может быть и сам лингвист, если он в совершенстве владеет изучаемым языком. Наконец, в моделях третьего класса считаются заданными не только текст и множество правильных фраз, но и множество семантических инвариантов. Практически это значит, что информант должен определять не только правильность каждой предъявляемой ему фразы, но и о любых двух фразах говорить, значат ли они одно и то же или нет. Модели этого класса близки традиционным описаниям. Их смысл сводится к тому, чтобы исследовать какое-либо лингвистическое явление на базе текстов, в результате получается, например, словарь или какая-либо грамматика или ее правила, или же результатом будет описание какого-либо лингвистического явления. Например, в переводе - описание какой-либо трансформации на базе трансформационной модели перевода. Исследовательские модели сейчас активно разрабатываются в корпусной лингвистике, когда исследуется какое-либо множество текстов и, например, строится модель словарной статьи для включения ее в словарь.

 

 

Признаки   Тип модели Что известно лингвисту ВХОД - Характер исходной информации ВЫХОД-Характер конечной информации Цель
Исследовательские Текст (и множество правильных фраз) Текст Грамматика и/или словарь Смоделировать деятельность лингвиста
Аналитические Грамматика и словарь Текст Изображение структуры текста Смоделировать понимание текста
Синтетические Грамматика и словарь Изображение структуры текста Текст Смоделировать производство -генерацию текста
Порождающие Грамматика и словарь Алфавит символов и правила образования и преобразования фраз Множество правильных фраз и изображение их структуры Смоделировать умение отличать правильное от неправильного в языке

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.