Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лаба 1 Технология поиска информатики

.doc
Скачиваний:
29
Добавлен:
15.06.2014
Размер:
393.73 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ

Белорусский государственный университет

информатики и радиоэлектроники

Факультет информационных технологий и управления

Кафедра ИТАС

ОТЧЁТ

по лабораторной работе №1

Технология поиска информатики ”

Выполнил:

студент гр.420601

Пузанов А.А.

Проверил:

Стригалёв Л.С.

Минск 2006г.

1. Цель работы

Практическое освоение технологии эффективного поиска информации.

2Краткая характеристика использованных операторов и конструкций языка запросов.

Поиск по индексу заключается в том, что пользователь формирует запрос и передает его поисковой машине. В случае когда у пользователя имеется несколько ключевых слов, весьма полезно использование булевых операторов.

Наиболее часто используемые булевы операторы:

  • AND — все термины, соединенные AND, должны присутствовать в предлагаемом документе. Некоторые поисковые системы используют значок «+» вместо AND;

  • OR — как минимум одно из ключевых слов, соединенных OR, должно присутствовать в искомом документе;

  • NOT — ключевое слово (слова), следующее за NOT, не должно появляться в искомом документе. Некоторые поисковые системы используют значок «-» вместо NOT;

  • FOLLOWED BY — одно из ключевых слов должно следовать непосредственно за другим;

  • NEAR — одно из слов должно отстоять на определенное количество слов от другого;

  • кавычки — слова внутри кавычек являются фразой, которая должна быть найдена в пределах документа или файла.

Текст, в пределах которого проверяется логическая комбинация, называется единицей поиска. Это может быть предложение, абзац или весь документ. В разных поисковых системах могут использоваться различные единицы поиска. Например, вы можете искать документы, в которых два слова — «электрический» и «счетчик» — находятся одновременно в пределах предложения или в пределах всего документа. Соответственно поиск в пределах предложения возможен для тех систем, которые имеют в индексе подробный адрес.

Примечание. Если сложный запрос включает несколько операторов, то он будет выполнен согласно традиционным приоритетам этих операторов. Изменить порядок выполнения можно посредством использования скобок.

После того как пользователь передал запрос поисковой системе, она обрабатывает синтаксис запроса и сравнивает ключевые слова со словами в индексе. После этого составляется список сайтов, отвечающих запросу, они ранжируются по релевантности и формируется результат поиска, который и выдается пользователю.

Существует огромное количество поисковых систем. Наиболее популярная западная поисковая система — Google (http://www.google.com/). В частности, всемирно популярный каталог Yahoo! в качестве поисковой системы использует именно Google. В Рунете самыми популярными поисковыми системами являются Яндекс (http://www.yandex.ru/) и Рамблер (http://www.rambler.ru/).

3. Описание результатов поиска документов по вариантам поискового запроса.

Используем поисковые системы Google и Yandex.

Первоначальный запрос: «цифровые фотоаппараты Samsung».

Google нашел 2310000 ссылок,а Яндекс –345382.

Используем язык запросов–««цифровые фотоаппараты Samsung»».

Количество ссылок сократилось в 150 раз.

Результат запроса можно улучшить не только использованием конструкций языка запросов, он и уточнением условия запроса.

  1. Анализ полученных результатов.

  1. Использование языка запроса позволяет сделать запрос более точным.

  2. Поиск должен осуществляться более, чем по одному слову. Сократить объем ссылок можно, определив несколько ключевых слов.

  3. Надо избегать написания ключевого слова с прописной буквы. В ряде поисковых систем заглавные буквы позволяют искать имена собственные.

  4. поиск в найденных документах улучшает результаты поиска (возможность искать документы, удовлетворяющие новому запросу, среди документов, полученных в результате предыдущего запроса).

Выводы

  1. знание языка запросов конкретной поисковой машины и правильное его применение позволяет сделать поиск быстрым и эффективным. Это позволяет сэкономить время, а,следовательно, и деньги.

  2. если по теме мало документов, то надо пользоваться метапоисковыми системами.