Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб. работа №4 Работа с поисковыми системами.doc
Скачиваний:
1
Добавлен:
08.05.2019
Размер:
1.18 Mб
Скачать

Лабораторная работа №4

Работа с поисковыми системами

Цель: Получить практические навыки работы с поисковыми системами

Теоретическая часть

Общее представление о поисковых службах

Поиск информации – основная цель пользователя в WWW.

Для того, чтобы понять, что скрывается за теми действиями, которые Вы выполняете, следует более формально рассмотреть процесс поиска. Итак:

  1. У Вас появляется необходимость найти сведения по какому-либо вопросу. На языке теории информационного поиска это называется информационной потребностью.

  2. Для того, чтобы «объяснить» поисковой службе, что Вам необходимо найти, следует сформулировать свою информационную потребность. Этот процесс, как правило, сводится к выявлению набора понятий и терминов, характеризующих информационную потребность. Такие понятия и термины получили название ключевые слова, а выделенное множество ключевых слов именуется запросом.

  3. На следующем этапе Вы через интерфейс информационно-поисковой системы вводите запрос. Система выбирает необходимые документы, соответствующие Вашему запросу, и формирует результат.

  4. Список документов, отобранных поисковой системой, называются выдачей или откликом. Выданные документы по содержанию делятся на две группы: соответствующие (релевантные) и несоответствующие информационной потребности (информационный шум).

Информационно-поисковые системы на пространстве www

Информационно-поисковые системы в Интернет на пространстве WWW бывают различных типов.

Первым классификационным признаком поисковых служб является способ организации пополнения базы данных о документах сети. Поэтому признаку системы делятся на каталоги и поисковые машины.

Под каталогом принято понимать информационно-поисковую систему, предназначенную для поиска и просмотра информации содержащейся в иерархически упорядоченной базе данных по Интернет-ресурсам. В основе каталога лежит база данных (рубрикатор) документов, информация в которую заносится человеком. Под поисковой машиной мы будем понимать информационно-поисковую систему, предназначенную для поиска и просмотра информации содержащейся в индексированной базе данных. В отличие от каталогов, поисковые машины исследуют Сеть с целью пополнения своих баз данных документов. В настоящее время наметилась тенденция к созданию так называемых гибридных поисковых систем, которые сочетают в себе функции как каталога, так и поисковой машины.

Второй способ классификации поисковых служб – классификация по глубине охвата ресурса. По данному признаку системы делятся на глобальные и локальные. Глобальные каталоги и поисковые машины действуют на всем пространстве WWW. Это означает, что все документы WWW потенциально могут попасть в базу данных такой информационно-поисковой системы. В качестве примеров глобальных каталогов можно привести Yahoo <яхо> (www.yahoo.com), а в качестве примеров поисковых машин – Altavista <альтависта> (www.altavista.com). К сожалению, русскоязычных глобальных поисковых систем нет.

В локальных информационно-поисковых системах поисковое пространство является частью пространства WWW и, следовательно, не все документы этого ресурса могут попасть в базу данных таких систем. Примером локальных каталогов служат российские каталоги «Русский медицинский сервер» (dir.rusmedserv.com), Каталог сайтов «Referal.ru» (referal.ru), Инернет-справочник свободного Рунета «Freedom.ru» (www.freeedom.ru). В качестве локальных поисковых машин, действующих на пространстве РУНет, следует назвать Арогt (www.aport.ru), Rambler (www.rambler.ru) и Яndeх (www.yandex.ru). Очевидно, что сужение информационно-поискового пространства снижает результаты поиска.

Кроме того, некоторые сайты Интернет располагают собственными механизмами поиска (в пределах данного сайта). На сайте БелГУ имеется ссылка «поиск» по разным подразделениям университета.

Особенности каталогов

Основной характеристикой каталогов является объем базы данных, т.е. количество представленных документов. По сравнению с поисковыми машинами скорость увеличения баз данных каталогов достаточно мала, поскольку их пополнение происходит вручную. Однако это может рассматриваться и как преимущество поисковых систем данного типа, поскольку ручной отбор позволяет повысить точность поиска.

В качестве второй характеристики следует выделить количество категорий или рубрик в каталоге. Естественно, чем выше это значение, тем большей точностью характеризуются результаты поиска.

Принципы работы с каталогами достаточно просты. Как правило, главная страница сайта каталога содержит в себе список категорий, или рубрик, каждая из которых представлена гиперссылкой. По такой гиперссылке пользователь может перейти на страницу, содержащую список подрубрик или документов, соответствующих этой рубрике. В качестве примера на рисунке 1 представлена главная страница каталога Referal.Ru (http://referal.ru)

Рис.1 Главная страница каталога Referal.Ru