Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2 Лекция Поиск информации в Интернете.docx
Скачиваний:
126
Добавлен:
31.03.2015
Размер:
1.15 Mб
Скачать

Поисковые машины (поисковые серверы, поисковые роботы)

По области действия поисковые машины можно разделить на глобальные, которые осуществляют поиск на многих языках без учёта имени домена, илокальные, которые осуществляют поиск в пределах определённого домена, например, национального, на определенном языке.

Поисковые системы состоят из следующих основных частей:

  1. Робот(Robot, или Spider). Это программа, которая посещает Web-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Spider автоматически возвращается через определенные периоды времени и индексирует страницу снова.

  2. Индексы.Все, что находит и считывает Spider, попадает в индексы поисковой системы. Индексы системы представляют собой гигантское вместилище информации, где хранится преобразованная особым образом текстовая составляющая всех посещенных и проиндексированных Spider страниц.

  3. Поисковая программа.В соответствии с запросом пользователя эта программа перебирает индексы поисковой системы в поисках информации, интересующей пользователя, и выдает ему найденные документы в порядке убывания релевантности.

К основным параметрам, характеризующим достоинства поисковых машин, относятся:

  • объем индексных файлов или широта охвата материала (число проиндексированных серверов и отдельных документов) – до 3 с лишним миллиардов документов;

  • степень оперативности обновления базы данных за счет включения сведений о новых материалах и удаления устаревших – от двух недель до полутора месяцев;

  • возможности для составления запроса – предопределяет долю релевантных документов в перечне полученных документов;

  • интеллектуальность системы ранжирования результатов поиска - перечень факторов, принимаемых во внимание при определении места документа в перечне ссылок необычайно широк: от местоположения слова на странице до рейтинга (авторитета) страниц, имеющих ссылки на найденный документ;

  • наличие дополнительных сервисных функций, облегчающих работу пользователя - возможность перевода текста документа на иностранный язык, способность выделять все документы с определенного сайта, сужение критериев в ходе поиска, нахождение документов "по образцу" и т.д.

Достоинство автоматизированного поиска состоит в том, что он обеспечивает просмотр очень больших объемов информации.

Адреса наиболее популярных поисковых машин:

Зарубежные поисковые машины:

http://www.google.com/

http://www.altavista.com/

Система открыта в декабре 1995 года.

http://www.excite.com/

Система открыта в конце 1995 года

http://www.hotbot.com/

Система запущена в мае 1996 года.

www.lycos.com

Система запущена примерно в мае 1994 года.

Российские поисковые машины:

http://www.yandex.ru/(или http://www.ya.ru/) Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года.

http://www.rambler.ru/ Rambler создан в 1996 году.

http://www.aport.ru/ действует в Интернете с 1996 года.

Метапоисковые системы

Метапоисковые системы сами ничего не ищут, но обращаются за помощью сразу к нескольким поисковым машинам, а затем суммируют результаты. Каждая из метапоисковых систем имеет свой язык запросов. Сформулированный на этом языке запрос она переводит на язык запросов каждой используемой машины поиска.

Адреса метапоисковых систем:

MetaCrawler-http://www.metacrawler.com/ Search.com–http://www.search.com/

Mammahttp://www.mamma.com

MetaBot - http://www.metabot.ru - российская метапоисковая система

Наряду с метапоисковыми системами в настоящее время большое развитие получило «парное взаимодействие» между поисковыми машинами. Такие популярные русскоязычные поисковые машины как Апорт, Яндекс и Рамблер могут взаимодействовать друг с другом, с АльтаВиста и даже с некоторыми каталогами.

Постепенно поисковые серверы превращаются в многофункциональные порталы, в которых поисковый сервис остается главной приманкой для пользователей, но далеко не единственной и даже не основной из предоставляемых услуг. Помимо поиска информации, такие серверы обычно предоставляют пользователям бесплатную электронную почту, возможность бесплатно размещать собственные страницы, сведения о погоде, текущих новостях, биржевые котировки, карты местности и т.д.