Основы технологии WWW.

⇐ ПредыдущаяСтр 60 из 61Следующая ⇒

12.6.1.Архитектура распределенной Web-системы.

Фундаментом Web-систем являются четыре компоненты: [39] ⁾

§ Язык гипертекстовой разметки документов HTML (HyperText Markup Language);

§ Универсальный указатель ресурса URL (Uniform Resource Locator);

§ Протокол доставки гипертекстовых сообщений HTTP (HyperText Transfer Protocol);

§ Универсальный интерфейс шлюзов CGI (Common Gaterway Interface) доступа к источникам данных (информационным файлам — текстовым, графическим, аудио, видео; базам данных; информационным массивам разноформатных сообщений и сведений; прикладным программам), а также межсетевой программный интерфейс NPI (Network Programming Interface) доступа к ресурсам других сетевых узлов.

На рис.12.11 изображена архитектура распределенной Web-системы.

Здесь Web-навигатор реализует пользовательский интерфейс и обеспечивает доступ практически ко всем информационным ресурсам Internet. Фактически он выступает как интерпретатор языка HTML. Web-навигатор по результатам анализа HTML -сообщения, а также по командам Web-сервера, запускает дополнительные внешние (по отношению к клиенту) программы для работы с документами и форматами, отличными от HTML.

Рис.12.11.Архитектура распределенной Web-системы.

Вторая часть Web-системы реализуется на удаленном серверном узле и она включает в себя Web-сервер, который и производит обработку клиентских запросов от Web-навигаторов. Будучи запущенным, Web-сервер контролирует логический порт номер 80 (по умолчанию), и полагает, что любые сообщения, присланные на этот порт, предназначены для Web-сервера. При получении запроса Web-сервер устанавливает двухстороннюю связь с абонентом с помощью протоколов стека TCP/IP [40] ⁾ и обменивается информацией на прикладном уровне по протоколу HTTP. Web-сервер взаимодействует с базами данных HTML -документов и HTML -форм с метками, определяющими форматирование HTML -текста и его внешний вид в окне Web-навигатора клиента, а также с URL-ссылками на любые объекты (графические и иные файлы), внедряемые в HTML -документы, и мобильные компоненты управления ними.

Примечание.

Стек коммуникационных протоколов TCP/IP (Tansfer Control Protocol/ Internet Protocol) является набором протоколов, обеспечивающих управление физической средой, каналами связи, сетевыми компонентами, транспортными службами и прикладными средствами для реализации процедур обмена данными между абонентами сети, то есть межу клиентом и сервером.

Web-навигатор при загрузке HTML -документов доставляет на абонентскую станцию на основании URL-ссылок также все файлы, объекты и программы оперативного управления HTML -формами. Последние интерпретируются Web-навигатором клиента при загрузке и просмотре соответствующих HTML -документов. Для доступа к информации, которая не может обрабатываться Web-сервером непосредственно, используется система программных шлюзов CGI или NPI. Шлюз, получив запрос от Web-сервера, обрабатывает его сам или выступает в качестве посредника.

12.6.2.Средства поиска информации в WWW.

Основные протоколы, используемые в Internet, не обеспечены достаточными встроенными функциями поиска. Протокол HTTP хорош лишь в отношении навигации, как средство доставки и просмотра Web-страниц. Протокол FTP более примитивен, чем HTTP, и также не имеет встроенных средств поиска.

По этим причинам для реализации функций пользовательских запросов по нахождению информации в сети Internet используются специальные WWW-поисковые системы. Каждая такая система имеет только свой собственный, ограниченный ее ресурсами, массив доступных для поиска документов, как правило, представленных в HTML -формате, и имеет индекс, несущий служебную информацию о содержимом проиндексированных документов из этого массива. Пользователь при посещении Web-страницы поисковой системы заполняет запросную форму, детализирующую информацию, которую он разыскивает. Здесь используются ключевые слова, даты и другие критерии поиска. Эти критерии должны соответствовать критериям, используемым поисковыми агентами при индексации информации, которую они нашли в Web-узлах Internet. Поисковая система отыскивает в своей базе данных предмет запроса и выводит ссылки на соответствующие ему электронные документы. В этих ссылках содержатся первые несколькими предложений, содержащимися в найденных документах, или заголовки этих документов вместе с адресными ссылками на их местоположение в сети.

В зависимости от автоматизации способа накопления сведений в базе данных об информационных ресурсах глобальной сети, а также ее структуры различают следующие типы поисковых систем: [41] ⁾

§ Системы, основанные на построении каталогов, которые обеспечивают поиск путем навигации по тематическим каталогам и по ключевым словам;

§ Индексные поисковые системы, реализующие поиск только по ключе-вым словам.

§ Комбинированные информационно-поисковые системы.

Общей особенностью перечисленных систем является используемый способ сканирования файлов, хранящихся в узлах Internet с целью определения их содержимого. Эта процедура в Internet выполняется автоматически. Основная задача сканирования файлов — формирование их описаний, которое заменяет этот файл в поисковых системах.

Определение. Описание файла, хранящегося на каком-либо узле Internet, содержащее определенный список терминов, адекватно отражающий содержание файла, называется поисковым образом файла.

Определение. Векторной моделью поискового образа файла называется некоторый вектор размерности, равный числу характеризирующих содержание файла терминов, которыми можно воспользоваться при поиске.

Примечание.

Как правило, терминам векторной модели поискового образа присваиваются определенные весовые коэффициенты, отражающие степень соответствия данного термина документу.

Для сканирования файлов в Internet и формирования их поисковых образов используются специальные сканирующие программы, работающие в автоматическом режиме. Эти специальные программы извлекают гипертекстовые ссылки из Web-страниц, располагаемых на узлах Internet, и автоматически индексируют информацию, которую они находят для построения специализированной базы данных поисковой системы. Каждый поисковый механизм имеет собственный набор правил, определяющих, каким образом следует собирать документы.

⇐ Предыдущая 52 53 54 55 56 57 58 596061 Следующая ⇒

© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.