Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка 2003год по МИР_часть2 .doc
Скачиваний:
4
Добавлен:
21.04.2019
Размер:
499.71 Кб
Скачать

Поисковые машины, серверы и системы

Поисковые машины предназначены для сбора данных, которые затем передаются поисковым системам. Такие машины работают в автоматическом режиме, т. е. специализированное программное обеспечение осуществляет путешествие по ресурсам сети и заносит собранные данные в базу. Иногда, это роботизированная поисковая система, черпающая адреса своего маршрута поиска из данных, внесённых пользователем при регистрациях сайтов. Но чаще это самостоятельно работающие машины, не имеющие постоянного сетевого адреса.

Сбор информации о содержимом сайтов или отдельных страниц имеет название индексация. Её суть состоит в том, что при попадании на страницу с данными, специальная программа анализирует её содержание, заголовки, мета тэги, подписи к изображениям и др. и заносит в свою базу информацию о тематике и предмете статьи.

Это осуществляется специальными программами, которые называются spiders (пауки), crawlers (ползуны, пресмыкающиеся), robots (роботы), walkers (пешеходы) и т. п. Для того чтобы обойти всю сеть, мощному роботу нужно от нескольких дней до нескольких недель. При этом составляется весьма свежий и довольно подробный индекс – опись содержимого доступных ресурсов. При каждом новом цикле индекс обновляется, и старые недействительные адреса удаляются.

Поисковые системы служат непосредственно для поиска ссылок на интересующие пользователя источники сети. Они бывают двух типов: роботизированные (Search Engines) и каталоги (Directories). Пользователю же предоставляется возможность поиска без предварительных знаний об особенностях функционирования таких систем.

Несмотря на это, методология эффективного поиска существует. Её секрет заключается в правильном запросе, который пользователь отправляет поисковой системе. Если Вас интересует хорошо разработанная и часто востребуемая тема - популярный материал (например, адреса провайдеров Internet или публикации научных документов) - то можно воспользоваться каталогом, расположенным на первой странице каждой поисковой системы. Метод работы - обычный: двигаясь от общего к частному, Вы достигаете списка нужных Вам сайтов.

Для более специального поиска (например, информации о нанотехнологии или о редких породах кошек), как правило, необходимо использовать ключевые слова: все развитые поисковые системы предлагают мощные инструменты поиска по ключевым словам. Диалог простого поиска у большинства машин весьма схож: вводится ключевое слово - и получаете результат в виде сгенерированной страницы отчёта о результатах поиска. Два или более слов соберут все документы, в которых встречаются эти слова - все вместе или по одному. Если Вас интересует только словосочетание - возьмите его в кавычки. Знак “плюс” перед словом означает, что оно должно обязательно присутствовать в результатах поиска, знак “минус” - что его не должно быть.

Сложный поиск позволяет получить значительно более точный результат. При сложном поиске используются стандартные булевы команды or, and, not, реже near, close, before. Интерфейсы сложного поиска у разных поисковых систем существенно отличаются; для наиболее эффективного использования рекомендуем внимательно почитать раздел Advanced Search Help той поисковой системы, которой Вы пользуетесь.

Мета поиск (использование одного Web-узла для обращения к нескольким поисковым машинам одновременно) — этот сервис встречается реже, но даёт возможность производить более обширный поиск в более сжатые сроки.

Таблица 1