Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ч4_Инф_техн_в_управлении_Internet.doc
Скачиваний:
9
Добавлен:
30.11.2018
Размер:
271.36 Кб
Скачать

Поисковые системы

Назначение поисковых систем: обеспечить автоматическое (программное) нахождение в сети Internet необходимой пользователю информации на основе поискового образа, составленного пользователем.

Если человек знает, ЧТО ему нужно, ему незачем ЭТО искать.

Искать человек может только ТО, что он НЕ ЗНАЕТ, но представляет, как ЭТО описать.

Ключевое слово - слово, которое, по мнению пользователя, должно обязательно присутствовать во фрагментах текста, представляющих интересующую пользователя информацию.

Ключевое слово – это обычное слово. Оно может присутствовать во множестве фрагментов текста, нужных и не нужных пользователю. Чтобы сократить количество фрагментов текста, которые ему выдаст в качестве ответа поисковая система, человек должен описать нужную ему информацию некоторым множеством ключевых слов.

Поисковый образ – последовательность составленных по определенным правилам ключевых слов, наиболее точно, по мнению пользователя, описывающих искомую информацию.

Поисковый образ размещается в запросе, который пользователь направляет поисковой системе.

С помощью поисковых систем всегда легче найти что-то конкретное, и труднее - что-то общее и неопределенное.

Варианты технологии функционирования поисковых систем

  1. анализ ИР сети Internet ПОСЛЕ приема запроса от пользователя;

  2. анализ ИР сети Internet ДО приема запроса от пользователя.

Все поисковые системы применяют технологию работы, когда анализ ИР сети Internet проводится ДО получения запроса пользователя.

Состав поисковой системы

  1. поисковый робот (Crawler, Spider и пр.);

  2. база индексов документов (база данных);

  3. поисковая машина;

  4. модуль выдачи результатов.

Схема работы поискового робота

Поисковый робот круглосуточно просматривает содержимое Web - страниц, выбирает по определенным алгоритмам значимые слова и запоминает в базе индексов эти слова и адреса документов, в которых эти слова обнаружены. Если для какого-то слова робот нашел ссылку на другой документ на этой же Web – странице или на другой, он самостоятельно направляется по указанным ссылкам, находит новые документы и также их просматривает.

Значимые (существенные) слова – множество слов, которые, по мнению разработчика робота, наиболее точно отображают смысл обрабатываемой информации.

Индексация документа: запоминание значимых слов документа и их характеристик в базе индексов.

База индексов: множество гигантских индексных файлов поисковой системы, хранящих информацию о том, какое значимое слово, сколько раз, в каком документе (на какой Web – странице) употребляется.

Поисковая машина при ответе на запрос пользователя обращается к своей базе индексов, но не к информационным ресурсам Internet.

Каждая поисковая система использует свои методы индексации. Различные поисковые системы имеют разные объемы базы индексов.

Схема работы поисковой машины

Важный для пользователя фактор успешного поиска

Релевантность - соответствие выданного пользователю фрагмента текста (документа), который нашла в базе индексов поисковая машина, тому поисковому образу, который сформировал и направил поисковой машине в виде запроса пользователь.

Правила присвоения найденным документам значений релевантности являются know how разработчика поисковой системы.