Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Поисковые системы






 

К глобальным поисковым системам относят информационные системы, позволяющие осуществлять поиск в Web-пространстве, объединенным протоколом http.

В число хорошо зарекомендовавших себя и наиболее известных поисковых систем входят Alta Vista (http//www.aitavista.digital.com), HotBot (https://www.hot-bot.com), Ultra InfoSeek (https://ultra.infoseek.com), OpenText (https://www.opentext.com), WebCrawler (http: / / www.webcrawler.com), Lycos (https://www.Lycos.com), Excite (https://library.ucr.edu), Magellan (http//: www.meknley.com), MetaCrawler (https://www.metacrawler.com) и др.

Болee молодые поисковые системы «Новый русский поиск» (https://www.open web.ru/koi8/cgi-bin), «Паук» (https://spider.raser.ru), значительно превосходят предшествующие как в сфере увеличения глубины и широты поиска, так и в области предоставления пользователям большего комфорта. Технологические усовершенствования зримо проявляются в увеличении числа булевых операторов (or/или, and/и, not/не и др.), позволяющих более точно формулировать запрос скорости поиска, росте количества обследуемых документов и степени глубины этого обследования.

Расширение пользовательских возможностей воплощается в создании простых и удобных интерфейсов максимально облегчающих составление запроса освобождающих пользователей от овладения специальными знаниями, типа булевой логики. Все больше и больше систем обретают полиязычность, т.е. способность обрабатывать ресурсы на самых различных языках включая русский, хотя проблема кириллицы в целом в Интернет все еще не решена.

Основное преимущество поисковых систем глобального масштаба — их оперативность. Пользователем задается ключевое слово — поисковый механизм выдает результаты поиска и точные адреса тex документов, в которых это ключевое слово встречается. Однако, обладая очень широкими возможностями, поисковые системы не всегда являются лаконичными.

Выделенные два типа поисковых систем разнятся в первую очередь с точки зрения технологии поиска: работающие с индексами (ссылками) и работающие с каталогами (классификаторами). В первом случае, системы получают информацию от каждого сервера, индексируют ее, а всю найденную информацию добавляют в свои базы данных (AltaVista, InfoSeek и др.). В другом случае, системы отыскивают сервера с высоким трафиком, добавляют их в свои базы и классифицирую их по степени убывания спрашиваемости (excite, WebCrawier и др.). Кроме того, есть и такие системы, в которых главным действующим лицом является человек — эксперт, организующий поисковые образы и категории, устанавливающий перекрестные ссылки и пополняющий базы данных (Yahoo!, Point и др.).

Остановимся на характеристике наиболее популярных глобальных поисковых систем:

AltaVista (https://www.altavista.com) — чрезвычайно быстрая поисковая система компании DEC (Digital Equipment Corporation), одна и самых больших баз данных для поиска в Сети, содержащая информацию о более 150 млн. страниц WWW и 14 тысяч групп новостей электронных конференции. Она позволяет осуществлять поиск, в том числе и по ключевым словам на русском языке, ранжирует найденные страницы по степени соответствия запросу. Ключевые слова запроса в ответе выделяет жирным шрифтом, но система не производит сортировку полученных адресов. Система позволяет сохранить результаты поиска в виде закладок. AltaVsta – одна из немногих систем, которая продолжает полнотекстовую обработку всей сети Интернет.

В системе используется довольно сложный механизм составления запроса, включающий комбинации отдельных слов, словосочетаний и знаков пунктуации (кавычек, точек с запятой, двоеточия, скобок), математических знаков (плюса и минуса) или привычных булевых операторов AND, OR, NOT и NEAR.

Поиск данных по типу библиотеки «публичные библиотеки в России» предполагает усложненный вариант запроса [публичн* near биолиот* and Росси*]. Пользователям так же предоставляется возможность ограничивать запрос по дате создания или последнего обновления документа. Поисковая система рассматривает заглавные буквы как отдельные буквенные символы вне их связи с прописными буквами. Когда слово найдено на WWW странице или в статье новостей его написание сохраняется в системном списке слов.

Лучше в запросе всегда писать прописными буквами. Заглавные буквы задают поиск слов именно в таком написании. Запрос может быть представлен и в виде словосочетания - President of Russia (словосочетание из 3 слов); при этом система безразлична к пробелам и знакам пунктуации (если только они не разделяют отдельные слова).

Следующей авторитетной поисковой системой является HotBot (https://www.hotbot.com) — индексирует около 110 млн. докумен­тов в Web, а также Usenet News. Углубленный поиск (Expert Search) в HotBot дает широ­кие возможности для детализации запроса. Это достигается за счет использования многоступенчатого меню предлагающего различные варианты составления поискового предпи­сания. Можно осуществить поиск по сочетанию в документе нескольких различных тер­минов, поиск по отдельной фразе, поиск конкретного лица или электронного адреса. Дан­ная система имеет понятный и удобный интерфейс. Однако при обращении к такой поисковой системе более успешны результаты поиска информации о Западной Европе и США. Поисковая система HоtBot менее восприимчива к китайскому и русскому языкам.

Одним из лидеров поисковых систем стала норвежская система (NothernLight.com) FastSеarсh, охватывающая более 200 млн. адресов.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.