Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Информационно-поисковый язык системы






Индекс - это только часть поискового аппарата, скрытая от пользователя. Второй частью этого аппарата является информационно-поисковый язык (ИПЯ), позволяющий сформулировать запрос к системе в простой и наглядной форме. Уже давно осталась позади романтика создания ИПЯ, как естественного языка, - именно этот подход использовался в системе Wais на первых стадиях ее реализации. Если даже пользователю предлагается вводить запросы на естественном языке, то это еще не значит, что система будет осуществлять семантический разбор запроса пользователя. Проза жизни заключается в том, что обычно фраза разбивается на слова, из которых удаляются запрещенные и общие слова, иногда производится нормализация лексики, а затем все слова связываются либо логическим AND, либо OR. Таким образом, запрос типа:

> Software that is used on Unix Platform будет преобразован в:

> Unix AND Platform AND Software

что будет означать примерно следующее: " Найди все документы, в которых слова Unix, Platform и Software встречаются одновременно". Возможны и варианты. Так, в большинстве систем фраза " Unix Platform" будет опознана как ключевая фраза и не будет разделяться на отдельные слова. Другой подход заключается в вычислении степени близости между запросом и документом. Именно этот подход используется в Lycos. В этом случае в соответствии с векторной моделью представления документов и запросов вычисляется их мера близости. Сегодня известно около дюжины различных мер близости. Наиболее часто применяется косинус угла между поисковым образом документа и запросом пользователя. Обычно эти проценты соответствия документа запросу и выдаются в качестве справочной информации при списке найденных документов.

Наиболее развитым языком запросов из современных ИПС Internet обладает Alta Vista. Кроме обычного набора AND, OR, NOT эта система позволяет использовать еще и NEAR, позволяющий организовать контекстный поиск. Все документ в системе разбиты на поля, поэтому в запросе можно указать, в какой части документа пользователь надеется увидеть ключевое слово: ссылка, заглавие, аннотация и т.п. Можно также задавать поле ранжирования выдачи и критерий близости документов запросу.

Теория информационного поиска начиналась с исследования особенностей документальных информационно-поисковыхсистем (ИПС). Под информационным поиском в таких системах понимается некоторая последовательность операций, выполняемых с целью отыскания документов (статей, научно-технических отчетов, описаний к авторским свидетельствам и патентам, книг и т.д.), содержащих определенную информацию (с последующей выдачей самих документов или их копий), или с целью выдачи фактических данных, представляющих собой ответы на заданные вопросы.

 

Массив элементов информации, в котором производится информационный поиск, называется поисковым массивом. Существующие виды информационного обслуживания представлены втаблице:

 

 


 

Признак классификации Вид обслуживания
По источнику инициативы · принудительное; · по запросам потребителей
По типам документов · обслуживание опубликованными документами и/или их копиями; · обслуживание копиями неопубликованных документов (отчетов по НИР, диссертаций, переводов и т. п.)
По направленности или адресности · информационные издания (много адресов); · избирательное распределение информации (один адрес)
По периодичности или срочности · текущее оповещение; · ретроспективный поиск
По способу доведения документов до потребителя · непосредственная передача документов или их копий потребителям; · двухступенчатое обслуживание (вначале информационное издание, а затем – копии заинтересовавших потребителя документов

 


 

Заключение

Рассмотренные мною поисковые машины далеки от совершенства. Считается, что идеальная поисковая машина должна отвечать следующим требованиям:

a.. быстрый поиск в базе данных и быстрое реагирование.

b.. надёжность и точность результатов поиска.

c.. простота в использовании

d.. чётко организованный и обновляемый индекс.

Масштабы информационных ресурсов и их количество постоянно расширяется. Становится ясно, что база данных не является совершенной. Интеллектуальные агенты - новое направление лежащее в основе нового поколения поисковых машин, которые могут фильтровать информацию и получать более точный результат. Internet продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ, следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые.


Список используемой литературы

1. Ашманов, И. С. Продвижение сайта в поисковых системах / И. С. Ашманов. - М.: «Вильямс», 2007. - 304 с.

2. Байков, В. Д. Интернет. Поиск информации. Продвижение сайтов / В. Д. Байков. - СПб.: БХВ- Петербург, 2000. - 288 с.

3. Ландэ, Д. В. Поиск знаний в Internet / Д. В. Ландэ. - М.: «Диалектика», 2005. - 272 с.

4. Чурсин, Н. А. Популярная информатика / Н. А. Чурсин.- М.: «Вильямс», 2007.- 300 с.

5. Схемы и рисунки ИПС [Электронный ресурс]. - Режим доступа: https://ssofta.narod.ru/bd/ets2.htm

6. Структура и классификация автоматизированных информационных систем Режим доступа: https://do.rksi.ru/library/courses/opais/tema1_3.dbk

7. Схемы и рисунки ИПС [Электронный ресурс]. - Режим доступа: https://ssofta.narod.ru/bd/ets2.htm

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.