Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Поиск информации в Интернет






С интенсивным ростом количества информации в Интернет появилась и проблема поиска нужной страницы или сайта среди всего этого многообразия.

Существуют три основных способа поиска информации в Интернет:

1. Указание адреса страницы – это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

2. Передвижение по гиперссылкам – с его помощью можно искать документы, близкие по смыслу текущему документу. Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной Web-страницы к другой, но если учесть, что в мире созданы многие миллионы Web -страниц, то найти на них нужную информацию таким способом непросто.

3. Обращение к поисковой системе (поисковому серверу).

Для поиска информации используются специальные поисковые сервера, которые содержат более или менее полную, постоянно обновляемую информацию о том, что появляется на Web – страницах. Поисковые системы могут использовать различные механизмы поиска, хранения и предоставления пользователю информации. Общим для всех поисковых систем является то, что к моменту запроса пользователя, вся информация о документах в компактном виде хранится в базе данных поискового сервера.

Имеющиеся поисковые системы можно условно разделить на 3 группы:

1. Справочники Интернет.

2. Специализированные поисковые системы.

3. Поисковые системы общего назначения (индексные).

Справочники.

СправочникиИнтернет – это каталоги, предоставляющие информацию о сайтах, разбитую по категориям. По каждому сайту, кроме его названия, имеется описание, представленное владельцем сайта и проверенное редакторами каталога. Каталоги обычно предоставляют подробную информацию о ресурсе, но эта информация быстро устаревает.

Построены поисковые каталоги по иерархическому принципу, т.е. каждый шаг поиска – это выбор подраздела с более конкретной тематикой искомой информации. Избранные ресурсы Web расположены по алфавиту и разбиты на основные разделы, такие как Искусство, Наука, Образование, Бизнес, Экономика, Управление и др. В каждом разделе есть подзаголовки, содержащие страницы со списками гиперссылок.

Предметные каталоги классифицируют только небольшой процент от общего количества документов, доступных в Интернет.

Специализированные поисковые системы.

Рассчитаны на поиск WEB-сайтов по определенной тематике. Например: есть англоязычные и русскоязычные поисковые машины, отыскивающие хакерские программы, информацию по компьютерным вирусам. Есть поисковые машины, посвященные научным проблемам, есть литературные поисковые машины, называемые Electronic Library. Существуют региональные поисковые машины. Например: 123India — поисковая машина для отыскания информации по всей Индии; European Directory — машина для поиска информации по всей Европе и т.д.

Поисковые системы общего назначения (индексные)

Осуществляют поиск по ключевым словам.

Основу или принцип поисковых систем составляют специальные программы – роботы (типа «паук»), которые периодически просматривают WEB-серверы, читают и индексируют все встречающиеся документы. При этом они выделяют ключевые слова, относящиеся к данному документу, и запоминают их вместе с URL – адресом этого документа в базе данных.

Поисковые системы, в силу своей большой емкости предлагают более широкие возможности для построения запроса, чем каталоги. Обращаясь к поисковой системе, можно ввести одно или несколько ключевых слов, которые помогли бы отыскать нужный документ. Поисковая система постарается найти документы, наиболее отвечающие запросу. Например: надо найти информацию об истории развития программирования. Если в строке поиска будет указано ключевое слово Программирование, то будут найдены все документы, содержащие это слово. Большая часть документов может окажется не нужной. Такая же ситуация произойдет если в строке поиска будет написана вся фраза «история развития программирования». Т.е.поисковик выдаст документы, в которых содержатся указанные слова, но никакого отношения не имеющие к программированию (например, документы содержащие слово «история»). Для того чтобы конкретизировать поиск используют значки логической связи, показывающие, что ключевые слова должны присутствовать одновременно.

& — значок “and” — логическое «и»

“l” — означает “or” — логическое «или»

“! ” — означает “not” — логическое «не»

Чтобы получить материал на заданную тему надо сделать такую запись:

История& развития& программирования.

Тем самым поиск сужается и будет получено намного меньше документов, но более нужных.

Если надо просмотреть банк данных по какой-либо программе, то, написав в строке поиска просто банк данных, получите все документы, содержащие слово банк, но в финансовом смысле. Для уточнения запроса должна быть такая запись: Банк! бизнес, то есть, банк не имеющий отношения к бизнесу.

Выдача результатов поиска сопровождается статистическими данными, т.е. в скольких документах данное слово упоминается. Это число может измеряться тысячами или десятками тысяч. Каждый документ имеет числовой рейтинг, который показывает, насколько полно отвечает заданный документ условиям поиска. Список, представленных по запросу документов, всегда начинается с документа, имеющего самый большой рейтинг.

Каждый найденный документ имеет краткую аннотацию содержания и его адрес в Интернет.

Некоторые поисковые системы способны искать однокоренные слова и разные формы одного слова. Список возможностей и синтаксис запроса меняется от системы к системе. При необходимости можно воспользоваться справкой или помощью (help).

Чем отличается WEB – каталог от поискового WEB – сервера?

В каталоге содержится организованный по категориям список WEB – страниц: пользователь выбирает тему, затем подтему и т.д., до тех пор, пока не найдётся нужный документ. Поисковый сервер использует программу поиска в базе данных WEB – страниц по ключевым словам.

Хорошей стратегией поиска считается использование, как предметных каталогов, так и поисковых машин. Для обращения к большинству поисковых служб WEB, включая предметные каталоги и машины поиска, можно просто кликнуть на кнопку Поиск на панели инструментов WEB – броузера. На экране появится список каталогов и поисковых серверов.


Некоторые предметные каталоги Интернет.

Yahoo. Предметный каталог Yahoo создан двумя аспирантами Стэндфорского университета (США), которые сделали свой предметный каталог основой частной компании. Это лучшее место для начала поиска информации в Интернет. Чтобы попасть в этот каталог надо сразу ввести его URL – адрес https://www/yahoo.com. На экране появится страница Yahoo. Список состоит из основной классификации предметов, за которыми в каждой категории следуют заголовки II уровня. Yahooпредлагает огромное количество гиперссылок. Поиск можно осуществлять двумя способами:

1 ) поиск по ключевым словам, которые вводятся в текстовое окно поиска. Это простой поиск. При введении ключевых слов можно использовать логические операторы OR или AND.

2) перемещение по предметному каталогу, по гиперссылкам, выбрав одну из тем. Некоторые гиперссылки имеют рядом картинку с изображением солнцезащитных очков. Так помечены лучшие гиперссылки.

Панель инструментов Yahoo имеет такие опции:

  • What’s New (что нового на страницах Yahoo) – выводит на экран ссылки, добавленные в самое последнее время.
  • Check E-mail – дает возможность бесплатно воспользоваться электронной почтой Yahoo.
  • Personalize - кнопка регистрации, а также новости агентства Рейтер.
  • Help –справочная информация

Yahoo построен по принципу справочника, разбивка на разделы проведена с учетом американской специфики и поэтому для русскоязычного поиска не слишком удобна.

The Virtual Library. Виртуальная библиотека – один из первых каталогов и до сих самый полезный и полный. Появился в CERNe (Европейский Совет по Ядерным Исследованиям), расположенном в Женеве (Швейцария). В настоящее время поддерживается штаб-квартирой организации в Кембридже. Virtual Library – это распределенный предметный каталог. Это означает, что ответственность за поддержку страниц распределена среди отдельных лиц, каждое из которых является экспертом в определенной области.

Magellan это еще один большой предметный каталог. Интересен тем, что в этом каталоге сайты, безопасные для детей, отмечены зеленым цветом.

Ау! https://www.au.ru Это каталог русскоязычных ресурсов Интернет.

List-Ru https://www.list.ru Это тоже довольно большой каталог русскоязычных ресурсов Интернет.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.