- •Информационные системы
- •ВВЕДЕНИЕ
- •1. Информация. Основные свойства и определения
- •1.1. Информация как основной предмет информатики
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.2.1. Информация
- •1.2.2. Данные
- •1.2.3. Знания
- •1.3. Свойства информации
- •1.3.1. Кумулятивность информации
- •1.3.2. Концентрация информации
- •1.3.3. Эмерджентность и неассоциативность информации
- •1.3.4. Стaрение информации
- •1.3.5. Межотраслевые свойства и рассеяние информации
- •1.4. Информационные единицы
- •Контрольные вопросы
- •2. Информационные системы и технологии обработки информации
- •2.1. Состав и структура информационной системы
- •2.1.1. Классификация информационных систем
- •2.1.2. Основные компоненты ИС
- •2.2. Информационные компоненты в системах управления
- •2.2.2. Информация в системах обработки и генерации знания
- •2.3. Информационные технологии
- •2.4. О реализации процесса поиска информации
- •Контрольные вопросы
- •3. Модели и структуры данных информационных систем
- •3.1. Семантика ИС, основанных на концепции баз данных
- •3.2. Идентификация и поиск информации
- •3.3. Представление предметной области и модели данных
- •3.4. Структура информации и структура данных
- •3.6.1. Преобразование представлений
- •Контрольные вопросы
- •4. Модели поиска и оценки эффективности
- •4.1. Оценка экономической и технической эффективности
- •4.1.1. Экономическая эффективность
- •4.1.2. Техническая эффективность
- •4.2. Математические модели оценки технической эффективности
- •4.3.2. Модель механизма поиска по совпадению терминов
- •4.3.3. Модель механизма поиска по логическому выражению
- •4.3.4.1. Модель механизма поиска документов-аналогов
- •4.3.4.2. Модель механизма эвристического поиска
- •4.5. Информационно-поисковый язык документальной ИПС
- •4.5.1. Предложение запроса
- •4.5.2. Условие поиска
- •4.5.3. Синтаксис и семантика использования дескрипторов
- •4.5.4. Использование ранее полученных результатов поиска
- •5. Лингвистическое обеспечение ИС
- •5.2. Состав и структура лингвистического обеспечения
- •Линейные
- •5.3. Классификации
- •5.3.1. Библиотечно-библиографические классификации
- •5.3.1.2. Алфавитно-предметные классификации
- •5.3.1.3. Фасетные классификации
- •5.3.2. Классификации изобретений
- •5.3.3. Отраслевые классификационные системы
- •5.4.1. Координатное индексирование
- •5.4.2. Семантическая сила дескрипторных ИПЯ
- •5.5.1. Линейные терминологические структуры
- •Рубрика
- •Слов
- •5.5.2. Иерархические терминологические структуры
- •6. Поисковые задачи и технологии информационного поиска
- •6.2. Поисковые задачи и виды информационного поиска
- •6.2.1. Типология поисковых задач
- •6.2.2. Типология информационных потребностей
- •7.3. Технология поиска и интерфейс АИПС
- •7.3.1. Творческий процесс и стереотипы мышления
- •7.3.2. Интерфейс пользователя
- •Таблица 7.1.
- •7.4.3. Типология и стереотипы поведения пользователей
- •7.5.1.1. Стратегия поиска и классификация АИПС
- •7.5.1.2. Методы поиска
- •7.5.3. Поисковые интерфейсы
- •7.5.3.1. Организация интерфейсных объектов
- •7.5.3.2. Роль системы в процессе взаимодействия
- •8. Интерфейсные средства информационного поиска
- •8.1.1. Формирование запроса «по образцу»
- •8.1.2. Конструктор запроса «по шагам»
- •8.1.3. Конструктор запроса «Логическое выражение»
- •8.1.4. Использование формулировок ранее сохраненных запросов
- •8.2.1. Поиск аналогов
- •8.2.2. Эвристический поиск
- •8.2.3. Поиск по обратной связи
- •8.3. Технологические объекты построения предложения запроса
- •8.3.1. Частотный словарь
- •8.3.2. Тематический рубрикатор
- •8.3.3. Тезаурус
- •8.3.4. Иерархический словник
- •Список сокращений
- •ЕЯ – естественный язык.
- •ИС – информационная система.
- •ТСС – тематико-статистический спектр множества документов.
- •Литература
- •Глоссарий
- •Приложения
стратегий, основанных на поиске по некоторым формальным признакам документов, «похожих» на уже найденные релевантные.
Использование механизма поиска документов-аналогов. При просмотре релевантных документов функция поиска документованалогов может вывести пользователя на новую лексику – показать множество терминов, которое можно использовать для поиска новых релевантных документов. Например, инициировав поиск аналогов для документа, представленного на рис. 4.6, найдем релевантные документы, которые не могли быть найдены при использовании вербальных стратегий, т.к. не содержат терминов исходного запроса. Тем самым, механизмы поиска «похожих» документов позволяют не только увеличить показатель полноты поиска, но и выводят пользователя на новый неиспользованный в запросах пласт лексики предметной области.
Рис.4.6. Поиск документов-аналогов
4.5. Информационно-поисковый язык документальной ИПС
Повышение эффективности поиска обычно связывают с совершенствованием поискового аппарата, основу которого составляет лингвистическое обеспечение, и, в частности, с ИПЯ, а также с созданием интерфейсных средств, обеспечивающих адекватность их использования в соответствии с характером объекта поиска и когнитивным состоянием потребителя.
121
Язык, как унифицированное средство выражения семантики сообщений и вопросов (контекста), является основным компонентом для понимания процесса поиска информации, поэтому перспективным представляется подход к информационному поиску, сконцентрированный и сосредоточенный на реальных пользователях с их реальными информационными потребностями и, как следствие, на индивидуализации представлений семантических объектов. Один из наиболее важных аспектов решения этих задач – построение языка как системы представления, позволяющей адекватно описывать и идентифицировать как потоки и массивы информации, так и отдельные документы или запросы.
Информационно-поисковый запрос с точки зрения документальной ИПС (на примере ИПС IRBIS32) представляет собой совокупность отдельных предложений запроса, в общем случае синтаксически и семантически не связанных между собой. Однако, само понятие «Запрос» предполагает объединенную общей тематикой последовательность поисковых действий, направленных на получение обобщенного результата, что позволяет разрешать ссылки на результаты отдельных предложений в рамках текущего запроса, объединять поисковые результаты, выделять общее множество релевантных документов и т.п.
4.5.1. Предложение запроса
Структурной единицей Запроса в рассматриваемом ИПЯ является
Предложение запроса.
Синтаксис Предложения запроса в нотациях Бэкуса-Наура следующий:
<Предложение запроса> ::= <Условие поиска> | <Предложение запроса><Логическая операция><Предложение
запроса>| (<Предложение запроса><Логическая операция><Предложение
запроса>)
<Логическая операция> ::= И | AND | ИЛИ | OR | , | НЕ | NOT | ^
Предложение запроса в общем случае состоит из произвольного числа Условий поиска, связанных логическими операциями И (AND, «пробел»), ИЛИ (OR, «,») и НЕ (NOT, «^»). Внутри предложения допускается использование скобок, задающих дополнительные приоритеты выполнения условий поиска.
Приведем описание основных логических операций, примеры их использования и графическую интерпретацию (результат операции – затемненная область):
32 Рассматриваемый ИПЯ является расширенной реализацией типового языка запросов, свойственного большинству современных документальных ИПС.
122