Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Студент: ____, Группа: _18__






Лабораторная работа 1.

Определение количественных показателей текста. Простой поиск

Студент: ________________________, Группа: _18__

1) Прочитайте материал «Предварительные замечания» практикума (Чухарев 2009, с. 2). Определите статистические показатели текста смешанного языкового типа (источник: https://rvb.ru/ soft/catalogue/c01.html) по параметрам, представленным в таблице после текста.

Проекты Cí bola/Oleada реализуют обширные компьютерные системы лингвистического анализа текстов, представленных в Unicode. Компоненты системы включают средства работы с мультиязыковыми текстами (MUTT), построения конкорданса (XConcord) для текстов на более чем 16 языках, статистического анализа, автоматического перевода, различные словари и тезаурусы. Некоторые версии этих компонентов доступны для бесплатной загрузки после процедуры формальной регистрации. Все компоненты реализованы в среде X11 Window System для SunOs и Solaris.
Параметр Значение
  Слов 63
  Символов (без пробелов) 471
  Символов (с пробелами) 534
  Средняя длина слов 7, 5

2) Какому языку соответствует средняя длина слов текста смешанного типа, приведенного в задании 1? Для выполнения задания вычислите среднюю длину слов русского языка из приведенного текста и среднюю длину слов в латинской графике.

Параметр Значение
Средняя длина слов русского языка  
Средняя длина слов в латинской графике  
Вывод Средняя длина слов текста соответствует

3. Дополните таблицу встречаемости букв в распространенных европейских языках [Всеволодова 2007: 64], добавив в нее данные по русскому языку. Используйте для этого любой текст на русском языке объемом не менее 100 символов (без пробелов). Используйте функцию «найти» для каждой буквы русского алфавита. Количество употреблений этой буквы (например, 5) поделите на количество символов текста (без пробелов) и умножьте на 100. Внесите в таблицу данные о буквах русского алфавита, обладающие самой большой встречаемостью, согласно вашим расчетам.

 

 

Таблица встречаемости букв в распространенных европейских языках
Английский Немецкий Итальянский Французский Испанский Русский
Буква Встречаемость
Е 12, 86 Е 17, 76 Е 19, 18 Е 14, 15 I 12, 04    
Т 9, 72 S 8, 23 N 10, 20 А 12, 90 Е 11, 63    
А 7, 96 А 7, 68 I 8, 21 О 8, 84 А 11, 12    
  7, 77 N 7, 61 S 7, 07 S 7, 64 О 8, 92    
N 7, 51 Т 7, 30 R 7, 01 I 7, 01 N 7, 68    
R 7, 03 I 7, 23 Т 5, 68 R 6, 95 Т 7, 07    

 

4. Создайте диагностический словарь для определения языка на материале текстов на двух разных языках (на ваш выбор). Для этого заполните следующую таблицу, указав в заголовках столбцов названия сравниваемых языков. При возникновении вопросов можно обратиться к работе [Беляева 2007: 43].

Критерий Язык 1: Язык 2:
Типичные артикли    
Указательные местоимения    
Местоимения 3-го лица    
Отдельные формы вспомогательных глаголов    
Основные предлоги и союзы    
Другие частотные слова    

 

5. Прочитайте материал «Простой поиск» (Чухарев 2009, стр. 2-3) и выполните задачи 1–5 (стр. 4, текст: Great Expectations (dickens.doc)). Внесите ответы в таблицу. Для выполнения задания уточните понятие терминов «слово» и «словоформа» (Зубов, Зубова, 2004: 33).

Задача Ответ
1. Встречается ли в тексте слово enormous? Если да, то в каких контекстах оно употребляется?  
2. Встречается ли в тексте словоформа risk?  
3. Сколько всего раз встречается в тексте слово beautiful?  
4. В какой орфографии (британской или американской) представлен текст Great Expectations в файле? Ответ: Проверочное слово:

 

6. Сохраните данный файл с ответами под названием Л1_Номер группы_Ваша фамилия, например, Л1_10_Иванов и отправьте на проверку преподавателю.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.