- •Поиск информации в Internet
- •Основные понятия
- •Ипс для всемирной паутины (www)
- •Поисковые каталоги
- •Поисковые машины (поисковые серверы, поисковые роботы)
- •Метапоисковые системы
- •Поиск информации на ftp-серверах Категории программного обеспечения, различающиеся условиями его законного использования и распространения
- •Файловые поисковые системы
Поисковые машины (поисковые серверы, поисковые роботы)
По области действия поисковые машины можно разделить на глобальные, которые осуществляют поиск на многих языках без учёта имени домена, илокальные, которые осуществляют поиск в пределах определённого домена, например, национального, на определенном языке.
Поисковые системы состоят из следующих основных частей:
Робот(Robot, или Spider). Это программа, которая посещает Web-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Spider автоматически возвращается через определенные периоды времени и индексирует страницу снова.
Индексы.Все, что находит и считывает Spider, попадает в индексы поисковой системы. Индексы системы представляют собой гигантское вместилище информации, где хранится преобразованная особым образом текстовая составляющая всех посещенных и проиндексированных Spider страниц.
Поисковая программа.В соответствии с запросом пользователя эта программа перебирает индексы поисковой системы в поисках информации, интересующей пользователя, и выдает ему найденные документы в порядке убывания релевантности.
К основным параметрам, характеризующим достоинства поисковых машин, относятся:
объем индексных файлов или широта охвата материала (число проиндексированных серверов и отдельных документов) – до 3 с лишним миллиардов документов;
степень оперативности обновления базы данных за счет включения сведений о новых материалах и удаления устаревших – от двух недель до полутора месяцев;
возможности для составления запроса – предопределяет долю релевантных документов в перечне полученных документов;
интеллектуальность системы ранжирования результатов поиска - перечень факторов, принимаемых во внимание при определении места документа в перечне ссылок необычайно широк: от местоположения слова на странице до рейтинга (авторитета) страниц, имеющих ссылки на найденный документ;
наличие дополнительных сервисных функций, облегчающих работу пользователя - возможность перевода текста документа на иностранный язык, способность выделять все документы с определенного сайта, сужение критериев в ходе поиска, нахождение документов "по образцу" и т.д.
Достоинство автоматизированного поиска состоит в том, что он обеспечивает просмотр очень больших объемов информации.
Адреса наиболее популярных поисковых машин:
Зарубежные поисковые машины:
http://www.google.com/
http://www.altavista.com/
Система открыта в декабре 1995 года.
http://www.excite.com/
Система открыта в конце 1995 года
http://www.hotbot.com/
Система запущена в мае 1996 года.
www.lycos.com
Система запущена примерно в мае 1994 года.
Российские поисковые машины:
http://www.yandex.ru/(или http://www.ya.ru/) Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года.
http://www.rambler.ru/ Rambler создан в 1996 году.
http://www.aport.ru/ действует в Интернете с 1996 года.
Метапоисковые системы
Метапоисковые системы сами ничего не ищут, но обращаются за помощью сразу к нескольким поисковым машинам, а затем суммируют результаты. Каждая из метапоисковых систем имеет свой язык запросов. Сформулированный на этом языке запрос она переводит на язык запросов каждой используемой машины поиска.
Адреса метапоисковых систем:
MetaCrawler-http://www.metacrawler.com/ Search.com–http://www.search.com/
Mamma – http://www.mamma.com
MetaBot - http://www.metabot.ru - российская метапоисковая система
Наряду с метапоисковыми системами в настоящее время большое развитие получило «парное взаимодействие» между поисковыми машинами. Такие популярные русскоязычные поисковые машины как Апорт, Яндекс и Рамблер могут взаимодействовать друг с другом, с АльтаВиста и даже с некоторыми каталогами.
Постепенно поисковые серверы превращаются в многофункциональные порталы, в которых поисковый сервис остается главной приманкой для пользователей, но далеко не единственной и даже не основной из предоставляемых услуг. Помимо поиска информации, такие серверы обычно предоставляют пользователям бесплатную электронную почту, возможность бесплатно размещать собственные страницы, сведения о погоде, текущих новостях, биржевые котировки, карты местности и т.д.