Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Корпусна лінгвістика. Об’єкт, предмет, завдання й методи корпусної лінгвістики. Корпуси текстів та їх типи.






Корпусна лінгвістика - дисципліна в межах комп’ютерної лінгвістики, предметом дослідження якої є розроблення поняттєвого та процедурного апарату для формування корпусів текстів та їх аналізу. Обєкт – проблемна область – область реалізації мовної системи; предмет – корпус даних – вибірка із проблемної області.

Корпус текстів - це різновид корпусів даних, од. яких є тексти або його фрагменти. Головним поняттям корпусної лінгвістики є корпус мовленнєвої реалізації мови, що кваліфікується як сформована за певними вимогами вибірка мовленнєвого матеріалу, який може використовуватися для опису й дослідження мови як системи. Базовий, вихідний масив текстів разом із програмним забезпеченням формує динамічний корпус текстів. Складниками корпусу є одиниця зберігання, або базова одиниця, яка може відповідати слову, сполуці, синтагмі, висловленню, фрагменту тексту й цілому тексту залежно від мети створення корпусу.

Типи корпусів:

1) дослідницькі – вивчення аспектів функціонування мовної системи;

2) ілюстративні – підтвердження отриманих результатів;

3) статичні – корпуси письменників

Корпуси можуть охоплювати всі мовні стилі й жанри або бути обмеженими певною дискурсивною сферою чи жанром (наприклад, Боннський корпус газетних текстів, німецький корпус текстів публічної політики за період з 1989-1990 p. p. «Wendekorpus»; російський корпус текстів словника Ф. Достоєвського тощо).

Браунівський Перший відомий корпус –американського варіанту англ. Мови (1962 – 63) – В. Френсіс – 1 млн слововживань, 500 текстів, 15 жанрів.
Лондонсько-Лундський корпус граматична система англ. Мови у мовленні дорослого (1960 – Р. Квірк) – 1 млн слово вжив, 100 текстів письм та 100 текстів усного мовлення. На основі цього корпусу 1985 видано повну граматику англ. мови.
Корпус базової німецької (1961, Стенфорд) – 401 інтервю, 80 год – записи з 36 міст Німеччини. Мають драматургічний запис (репліки респондентів як персонажів п’єси) та партитурний (як партитура, де замість інструментів виступають учасники комунікації).
Корпус терапевтичного дискурсу У Німеччині є мультимедійні корпуси –(університет Ульма) – 8, 2 млн слововживань з відеозаписами.

На підставі обробки комп'ютерного корпусу текстів здійснюється корпусний аналіз - один з об'єктивних методів мовного аналізу, спрямований на вивчення певних закономірностей й особливостей мови та мовлення. Застосовується в лінгвістичній семантиці з метою встановлення спектра контекстуальних значень й особливостей уживання лексем. Найбільш істотними недоліками цього методу є спрощення обробки мовного матеріалу й експланаторна негнучкість.

Вимоги до корпусів текстів: репрезентативність; повнота; економічність; структуралізація матеріалу; комп’ютерна підтримка.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.