Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2 Лекция Поиск информации в Интернете.docx
Скачиваний:
126
Добавлен:
31.03.2015
Размер:
1.15 Mб
Скачать

Поиск информации в Internet

Для автоматизации поиска информации в Интернет разработаны информационно-поисковые системы.

ИПС (информационно-поисковая система) - это система, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе) на основе информационно-поискового языка и соответствующих правил поиска.

Главной задачей любой ИПС является поиск информации, соответствующей информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу. Поэтому вводится качественная характеристика процедуры поиска - релевантность.

Основные понятия

Информационная потребность – необходимость найти сведения по какому-либо запросу.

Ключевые слова – набор понятий и терминов, характеризующих информационную потребность, и определение отношений между ними.

Информационно-поисковое пространство – поисковая система на множестве документов.

Выдача (отклик) – список документов, отобранных информационно-поисковой системой.

Релевантность – соответствие результатов поиска информационному запросу.

Информационный шум – несоответствующий информационной потребности отклик.

Ипс для всемирной паутины (www)

По способу организации поиска и предоставляемым возможностям все средства поиска подразделяются на поисковые каталоги,поисковые машиныиметапоисковыесистемы.

Поисковые каталоги

Каталоги в WWWаналогичны систематизированным библиотечным каталогам. Поиск по каталогам состоит в последовательном движении по иерархическому списку ссылок, называемых рубриками или категориями.

На первой странице каталога содержатся ссылки на крупные темы, например, Культура и искусство,Обществои политика,Бизнеси др.

Щелчок на соответствующей категории открывает страницу, содержащую ссылки, детализирующие выбранную тему (рубрики). Двигаясь вниз по детализирующим категориям, можно найти страницы с нужной информацией.

Некоторые каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины.

Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с гипертекстовой ссылкой на первоисточник.

Все каталоги создаются и поддерживаются в актуальном состоянии специалистами, аналогично тому, как библиографы составляют и поддерживают библиотечные каталоги.

Модератор

Сотрудник фирмы, отвечающий за содержимое каталога (его отдельного раздела, подраздела и т.д.), за его достоверность, надёжность и актуальность. Модератора иногда называют гидом поисковой машины (системы).

Благодаря этому содержание страниц, включенных в каталог, наиболее адекватно соответствует рубрике, к которой они отнесены, а поиск по каталогам дает более релевантные результаты, чем поиск по поисковым системам.

Каталоги могут быть глобальные, национальные, общие и специализированные (отраслевые, тематические и т.д.).

Основными параметрами, характеризующими достоинства каталогов, являются:

  • объем - определяет степень надежности или «информационной прочности». От этого зависит уровень доверия, который пользователи питают к конкретному каталогу.

  • оперативность отражения новых или изменившихся ресурсов - насколькооперативнопоявляются ссылки на новые сайты, и исправляются или удаляются ссылки на устаревшие ресурсы. В некоторых системах существует специальный механизм, периодически проверяющийдоступностьсайта и исключающий его из перечня при долгом «отсутствии» в Сети;

  • логичность и последовательность иерархической схемы классификации - определяет степень простоты, с которой пользователи могут находить требуемые сведения;

  • перекрестность структуры - позволяет выявлять информацию, используя разные подходы (например, территориальный или отраслевой). В этом случае схема классификации должна автоматически выводить пользователя на искомый объект, какой бы путь поиска не был выбран.

Основная проблема поисковых каталогов– низкий коэффициент охватаWeb-ресурсов.

Адреса популярных каталогов:

Российские каталоги:

Улитка

Russiaofthenet(www.ru) – один из старейших каталогов, основан в 1995 году.

Зарубежные каталоги:

http://www.yahoo.com/

Система запущена в начале 1994 года. Yahoo! является одним из самых первых, надежных и авторитетных каталогов. У каталога два основных достоинства: - внушительный объем (на сегодня отражено порядка 2 миллионов сайтов в более чем 25 тысячах категорий) и научность и логичность используемой схемы классификации. У yahoo имеется поисковый каталог для детей и поисковик на русском языке.

http://www.dmoz.org - каталог начал предоставлять свои услуги в июне 1998 года. Имеет базу данных с более 2 млн. проиндексированных сайтов, 28.000 редакторов и 304.000 категорий. Разработчики хотели создать каталог больше и лучше, чем Yahoo.