- •Поиск информации в Internet
- •Основные понятия
- •Ипс для всемирной паутины (www)
- •Поисковые каталоги
- •Поисковые машины (поисковые серверы, поисковые роботы)
- •Метапоисковые системы
- •Поиск информации на ftp-серверах Категории программного обеспечения, различающиеся условиями его законного использования и распространения
- •Файловые поисковые системы
Поиск информации в Internet
Для автоматизации поиска информации в Интернет разработаны информационно-поисковые системы.
ИПС (информационно-поисковая система) - это система, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе) на основе информационно-поискового языка и соответствующих правил поиска.
Главной задачей любой ИПС является поиск информации, соответствующей информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу. Поэтому вводится качественная характеристика процедуры поиска - релевантность.
Основные понятия
Информационная потребность – необходимость найти сведения по какому-либо запросу.
Ключевые слова – набор понятий и терминов, характеризующих информационную потребность, и определение отношений между ними.
Информационно-поисковое пространство – поисковая система на множестве документов.
Выдача (отклик) – список документов, отобранных информационно-поисковой системой.
Релевантность – соответствие результатов поиска информационному запросу.
Информационный шум – несоответствующий информационной потребности отклик.
Ипс для всемирной паутины (www)
По способу организации поиска и предоставляемым возможностям все средства поиска подразделяются на поисковые каталоги,поисковые машиныиметапоисковыесистемы.
Поисковые каталоги
Каталоги в WWWаналогичны систематизированным библиотечным каталогам. Поиск по каталогам состоит в последовательном движении по иерархическому списку ссылок, называемых рубриками или категориями.
На первой странице каталога содержатся ссылки на крупные темы, например, Культура и искусство,Обществои политика,Бизнеси др.
Щелчок на соответствующей категории открывает страницу, содержащую ссылки, детализирующие выбранную тему (рубрики). Двигаясь вниз по детализирующим категориям, можно найти страницы с нужной информацией.
Некоторые каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины.
Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с гипертекстовой ссылкой на первоисточник.
Все каталоги создаются и поддерживаются в актуальном состоянии специалистами, аналогично тому, как библиографы составляют и поддерживают библиотечные каталоги.
Модератор
Сотрудник фирмы, отвечающий за содержимое каталога (его отдельного раздела, подраздела и т.д.), за его достоверность, надёжность и актуальность. Модератора иногда называют гидом поисковой машины (системы).
Благодаря этому содержание страниц, включенных в каталог, наиболее адекватно соответствует рубрике, к которой они отнесены, а поиск по каталогам дает более релевантные результаты, чем поиск по поисковым системам.
Каталоги могут быть глобальные, национальные, общие и специализированные (отраслевые, тематические и т.д.).
Основными параметрами, характеризующими достоинства каталогов, являются:
объем - определяет степень надежности или «информационной прочности». От этого зависит уровень доверия, который пользователи питают к конкретному каталогу.
оперативность отражения новых или изменившихся ресурсов - насколькооперативнопоявляются ссылки на новые сайты, и исправляются или удаляются ссылки на устаревшие ресурсы. В некоторых системах существует специальный механизм, периодически проверяющийдоступностьсайта и исключающий его из перечня при долгом «отсутствии» в Сети;
логичность и последовательность иерархической схемы классификации - определяет степень простоты, с которой пользователи могут находить требуемые сведения;
перекрестность структуры - позволяет выявлять информацию, используя разные подходы (например, территориальный или отраслевой). В этом случае схема классификации должна автоматически выводить пользователя на искомый объект, какой бы путь поиска не был выбран.
Основная проблема поисковых каталогов– низкий коэффициент охватаWeb-ресурсов.
Адреса популярных каталогов:
Российские каталоги:
Улитка
Russiaofthenet(www.ru) – один из старейших каталогов, основан в 1995 году.
Зарубежные каталоги:
http://www.yahoo.com/
Система запущена в начале 1994 года. Yahoo! является одним из самых первых, надежных и авторитетных каталогов. У каталога два основных достоинства: - внушительный объем (на сегодня отражено порядка 2 миллионов сайтов в более чем 25 тысячах категорий) и научность и логичность используемой схемы классификации. У yahoo имеется поисковый каталог для детей и поисковик на русском языке.
http://www.dmoz.org - каталог начал предоставлять свои услуги в июне 1998 года. Имеет базу данных с более 2 млн. проиндексированных сайтов, 28.000 редакторов и 304.000 категорий. Разработчики хотели создать каталог больше и лучше, чем Yahoo.