Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Форматы полнотекстовых документов. Модель документа






Понятие модель документа охватывает аспекты создания, преобразования, хранения, поиска, передачи и отображения до­кументов. Принято рассматривать структуру документа в двух аспектах: логическом (содержание) и физическом (макет).

Логическая структура определяет составные компоненты и их соотношения в понятиях, отвечающих взгляду на документы как смысловые структуры. Например, к основным смысловым компонентам относятся: авторские данные (имя автора, место работы), аннотация, оглавление, главы, разделы, параграфы, рисунки, сноски. На рис. 2.5 приведен пример документа «По­яснительная записка к дипломному проекту (работе)». Здесь выделены такие базовые понятия структуры документа, как обязательность/необязательность элемента, уникальность или повторяемость, вхождение нижестоя­щих элементов в вышестоящие по принципу И (оба типа данных должны или могут входить в элемент) либо ИЛИ (толь­ко какой-либо один из типов данных может или должен вхо­дить в элемент).

Макетная структура содержит описание документа в терми­нах физических единиц — страниц, полос, колонок, колонтиту­лов, рамок для рисунков, шрифтов, стилей и пр.

Подходы к моделированию документов опираются на два стандарта — ISO 8613 (ODA — Office Document Architecture — архитектура управленческой документации и ISO 8879 (SCM – Standard Generalized Markup Language — стандартный обобщенный язык разметки).

Документ в ODA представлен в виде профиля и собствен­но документа, организованных в форме древовидной структу­ры. Профиль содержит информацию о документе в целом и его прохождении; формальные признаки — дата составления, вид, регистрационный номер и т. д.

Собственно документ содержит текст и сведения о его струк­туре и стиле, а именно:

• структуру документа — заглавие, параграфы, оглавление и т. п. (логическая структура), а также абзацы, расположе­ние текста, шрифты (физическая структура);

• архитектуру содержания — набор графических элементов, выделение определенных слов, строк и т. п.;

• коммуникативный формат — способы кодирования объектов, признаков и содержания документов.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.