Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Классификация ИПС. Обзор поисковых систем общего назначения.






• По характеру предоставления логической организации хранимой информации разделяются на фактографические, документальные и геоинформационные.

Фактографические накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов. Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения, по какому - либо факту, событию. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области.

В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции - дата изготовления, исполнитель, тематика. Некоторые виды документальных информационных систем обеспечивают установление логической взаимосвязи вводимых документов - соподчиненность по смысловому содержанию.

В геоинформационных данные организованы в виде отдельных информационных объектов привязанных к общей электронной топографической основе. Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент.

Другим критерием классификации поисковых систем являются функции или решаемые задачи.

Справочные являются наиболее распространенным типом функций информационных систем, и заключается в предоставлении абонентам системы возможностей получения установочных данных на определённые классы объектов.

Поисковые являются наиболее распространённым классом информационных систем. В общем, виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно - логического описания предметной области.

Расчетные заключается в обработке информации, находящейся в системе, по определённым расчётным алгоритмам для различных целей.

 

15. Модели информационного поиска. Теоретико-множественные. +

16. Модели информационного поиска. Вероятностные. +

17. Модели информационного поиска. Алгебраические. =

• Классические модели информационного поиска рассматривают документ как множество составляющих этот документ слов, которые принято называть термами. Терм – просто слово, семантика которого помогает описать основное содержание документа.

 

Формально модель состоит из четырех составляющих

 

D – множество используемых типов представлений документов
Q – множество используемых типов представления поисковых запросов – описаний поисковых потребностей пользователя
F – общий каркас, в рамках которого моделируется описание документов и запросов, а также взаимодействие между ними.
R(q, di) – функция ранжирования, которая паре документ/запрос сопоставляет некоторое вещественное число.

 

Классические модели делят на три класса.

 

· Теоретико Множественная Модель – использует в качестве каркаса теорию множеств. Пример – булева модель документа как множества содержащихся в нем термов.

 

· Вероятностная Модель? – использует в качестве каркаса теорию веросятностей, в качестве оценки релевантности берется вероятность того, что данный документ будет признан пользователем отвечающим его информационной потребности

 

· Алгебраическая Модель? – документ описывается в виде векторов в многомерном пространстве, каркасом являются алгебраические методы.

 

В силу своей простоты популярные теоретико-множественные модели. Вероятностная модель, несмотря на наиболее естественный способ формально описать проблему поиска – не пользуется популярностью. Наибольшей популярностью у исследователей пользуются алгебраические модели, поскольку их практическая эффективность обычно оказывается выше. В последнее время часто используются гибридные модели поиска, которые обладают свойствами моделей разных классов.

 

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.