- •1.Данные, информация, документы
- •1.1.Данные
- •1.2.Информация и документы
- •1.3.Информационные продукты и услуги
- •3.2.Информационные технологии
- •3.3.Тенденции развития информационных технологий
- •4.Компьютерные сети
- •4.1.Основные понятия
- •4.2.Глобальные сети
- •5.Понятие об Интернет
- •5.1.История создания Интернет
- •5.2.Основные организационные структуры Интернет
- •6.2.Адреса сетевого уровня
- •6.3.Адреса прикладного уровня служб www и ftp
- •6.4.Адрес электронной почты
- •6.5.Адрес группы новостей
- •7.Работа в Интернет
- •7.1.Работа с www
- •7.1.2.Способы открытия html документов
- •7.1.3.Сохранение документа
- •7.1.4.Учет url. Сохранение внешних ссылок
- •7.1.5.Обеспечение эффективности работы с Web сайтом
- •7.2.Работа с электронной почтой
- •7.2.1.Этапы работы с электронной почтой
- •7.2.2.Хранение сообщений
- •7.2.3.Учетные записи
- •7.2.4.Получение сообщений
- •7.2.5.Адресная книга
- •7.2.6.Создание сообщения.
- •7.3. Работа с телеконференциями
- •8.Основные ресурсы Интеренет
- •8.1.Классификация ресурсов
- •9.2.Основные принципы построения ипс
- •10.Представление информации в ипс
- •10.1.Индексирование документов
- •10.2.Векторная модель текста
- •10.3.Индексирование документов в Интернет
- •10.4.Хранение индексированных документов
- •11.Модели поиска информации
- •11.1.Булева модель поиска
- •11.2.Функции подобия "документ-запрос"
- •12.Классификация документов
- •12.1.Понятие классификации
- •12.2.Основные свойства классификации
- •12.3.Формирование рубрик
- •13.Современные информационно-поисковые системы
- •13.1.Словарные информационно-поисковые системы
- •13.2.Классификационные информационно-поисковые системы
- •13.3.Метапоисковые системы
- •13.4.Информационно-поисковые системы Internet
- •14.Средства разработки информационных ресурсов в Интернет
- •14.1.Язык разметки html
- •14.2.Сценарии
- •14.3.Среда программирования.
- •Иерархическая структура документов.
- •15.Правовое регулирование применения информационных и коммуникационных технологий
11.1.Булева модель поиска
Наиболее распространенной моделью поиска является булева модель, позволяющая составлять логические выражения из набора терминов. Найденные документы определяются в результате описанных запросом логических операций над множеством поисковых образов документов. Пользователь получает только те документы, чьи наборы терминов точно совпадают с соответствующими комбинациями терминов запроса.
Поисковые образы запросов связывают термины с помощью булевых операторов ("И" – "AND", "ИЛИ" – "OR", "И НЕ" – "AND NOT"). Эти операции производятся над множествами документов, содержащих тот или иной термин, определенный запросом.
Несколько типичных булевых стратегий поиска изображено на рис. Рис. 4.
Формулировка запроса |
Операции с множествами документов |
Результат поиска |
Термин |
|
|
Термины |
|
|
Термины |
|
|
Термины |
|
|
Термины |
|
|
Рис. 4. Поиск с использованием булевых операторов
Здесь – термины, из которых состоят запросы, а – множества документов, содержащих эти термины (например, множество содержит термин и т. д.).
Информационно-поисковые системы, работающие с такой моделью поиска, обладают рядом недостатков.
Обычные булевы запросы затрудняют варьирование глубины поиска с целью выдачи большего или меньшего количества документов в зависимости от требований пользователя. Для получения желаемого уровня эффективности необходимо найти правильную формулировку запроса: не слишком широкую и не слишком узкую. Оператор AND может привести к резкому сокращению числа документов, которые выдаются на запрос. Оператор OR, напротив, может чрезмерно расширить запрос, и выделить нужную информацию из информационного шума будет трудно. Результат поиска также сильно зависит от того, насколько типичными для базы данных ключевых слов являются термины запроса. Поэтому для успешного применения булевой модели пользователю следует хорошо ориентироваться в лексике словаря и знать, как влияет на результат поиска добавление или исключение терминов из запроса.
При использовании булевой логики нельзя получить эффект от функций совпадения векторов, которые дают непрерывный спектр совпадений (полных, частичных или нулевых) между запросами поисковыми образами документов. Это обстоятельство приводит к жесткому требованию "все или ничего" на выходе.
Еще одним минусом является тот факт, что множество выданных документов не может быть представлено пользователю в ранжированном виде, например, в порядке уменьшения сходства между документом и запросом. Документ либо полностью соответствует запросу, либо не соответствует совсем.
Тем не менее, несмотря на описанные недостатки, булева модель поиска широко применяется в современных ИПС из-за своей простоты.