- •Информационные системы
- •ВВЕДЕНИЕ
- •1. Информация. Основные свойства и определения
- •1.1. Информация как основной предмет информатики
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.2.1. Информация
- •1.2.2. Данные
- •1.2.3. Знания
- •1.3. Свойства информации
- •1.3.1. Кумулятивность информации
- •1.3.2. Концентрация информации
- •1.3.3. Эмерджентность и неассоциативность информации
- •1.3.4. Стaрение информации
- •1.3.5. Межотраслевые свойства и рассеяние информации
- •1.4. Информационные единицы
- •Контрольные вопросы
- •2. Информационные системы и технологии обработки информации
- •2.1. Состав и структура информационной системы
- •2.1.1. Классификация информационных систем
- •2.1.2. Основные компоненты ИС
- •2.2. Информационные компоненты в системах управления
- •2.2.2. Информация в системах обработки и генерации знания
- •2.3. Информационные технологии
- •2.4. О реализации процесса поиска информации
- •Контрольные вопросы
- •3. Модели и структуры данных информационных систем
- •3.1. Семантика ИС, основанных на концепции баз данных
- •3.2. Идентификация и поиск информации
- •3.3. Представление предметной области и модели данных
- •3.4. Структура информации и структура данных
- •3.6.1. Преобразование представлений
- •Контрольные вопросы
- •4. Модели поиска и оценки эффективности
- •4.1. Оценка экономической и технической эффективности
- •4.1.1. Экономическая эффективность
- •4.1.2. Техническая эффективность
- •4.2. Математические модели оценки технической эффективности
- •4.3.2. Модель механизма поиска по совпадению терминов
- •4.3.3. Модель механизма поиска по логическому выражению
- •4.3.4.1. Модель механизма поиска документов-аналогов
- •4.3.4.2. Модель механизма эвристического поиска
- •4.5. Информационно-поисковый язык документальной ИПС
- •4.5.1. Предложение запроса
- •4.5.2. Условие поиска
- •4.5.3. Синтаксис и семантика использования дескрипторов
- •4.5.4. Использование ранее полученных результатов поиска
- •5. Лингвистическое обеспечение ИС
- •5.2. Состав и структура лингвистического обеспечения
- •Линейные
- •5.3. Классификации
- •5.3.1. Библиотечно-библиографические классификации
- •5.3.1.2. Алфавитно-предметные классификации
- •5.3.1.3. Фасетные классификации
- •5.3.2. Классификации изобретений
- •5.3.3. Отраслевые классификационные системы
- •5.4.1. Координатное индексирование
- •5.4.2. Семантическая сила дескрипторных ИПЯ
- •5.5.1. Линейные терминологические структуры
- •Рубрика
- •Слов
- •5.5.2. Иерархические терминологические структуры
- •6. Поисковые задачи и технологии информационного поиска
- •6.2. Поисковые задачи и виды информационного поиска
- •6.2.1. Типология поисковых задач
- •6.2.2. Типология информационных потребностей
- •7.3. Технология поиска и интерфейс АИПС
- •7.3.1. Творческий процесс и стереотипы мышления
- •7.3.2. Интерфейс пользователя
- •Таблица 7.1.
- •7.4.3. Типология и стереотипы поведения пользователей
- •7.5.1.1. Стратегия поиска и классификация АИПС
- •7.5.1.2. Методы поиска
- •7.5.3. Поисковые интерфейсы
- •7.5.3.1. Организация интерфейсных объектов
- •7.5.3.2. Роль системы в процессе взаимодействия
- •8. Интерфейсные средства информационного поиска
- •8.1.1. Формирование запроса «по образцу»
- •8.1.2. Конструктор запроса «по шагам»
- •8.1.3. Конструктор запроса «Логическое выражение»
- •8.1.4. Использование формулировок ранее сохраненных запросов
- •8.2.1. Поиск аналогов
- •8.2.2. Эвристический поиск
- •8.2.3. Поиск по обратной связи
- •8.3. Технологические объекты построения предложения запроса
- •8.3.1. Частотный словарь
- •8.3.2. Тематический рубрикатор
- •8.3.3. Тезаурус
- •8.3.4. Иерархический словник
- •Список сокращений
- •ЕЯ – естественный язык.
- •ИС – информационная система.
- •ТСС – тематико-статистический спектр множества документов.
- •Литература
- •Глоссарий
- •Приложения
8.2.3. Поиск по обратной связи
Поиск по обратной связи реализуется, например, через последовательность взаимосвязанных этапов:
-отбор и выделение множества релевантных документов;
-построение ранжированного словника релевантных документов
ипредоставление словника пользователю;
-выбор терминов словника для формирования информационного пространства;
-разбиение построенного информационного пространства на кластеры и предоставление пользователю возможности для просмотра документов каждого отдельного кластера.
Особенностью реализации является возможность использования результатов, полученных на каждом этапе, для дальнейшего изменения стратегии поиска (так, например, термины, отобранные при просмотре словника релевантных документов, могут быть просто использованы для расширения запроса и проведения поиска по логическому выражению).
Рассмотрим порядок выполнения этапов на следующем примере. Пусть исходное предложение запроса на поиск по логическому
выражению в БД «Информатика» было следующим:
KW : ‘Поисковые стратегии’
При просмотре текстов документов-результатов поиска все из них были отмечены пользователем как релевантные. Тогда будет построен и выведен пользователю в ранжированном представлении следующий словник (для ранжирования использован интегральный коэффициент62):
2 |
ВЕКТОРНЫЕ МОДЕЛИ |
1,037520473 |
5 |
ИНФОРМАЦИЯ О РАБОЧИХ МЕСТАХ |
0,626009986 |
5 |
ПРЕДСТАВЛЕНИЕ ДОКУМЕНТОВ |
0,602280990 |
7 |
РЕШЕНИЕ ПРОБЛЕМ |
0,492237706 |
8 |
АССОЦИАТИВНЫЙ ПОИСК |
0,454205158 |
23 |
РАЗРАБОТКА |
0,440147604 |
12 |
КЛАСТЕРИЗАЦИЯ |
0,329185167 |
15 |
ПОИСК ИНФОРМАЦИИ |
0,310164008 |
18 |
ЗАВИСИМОСТЬ |
0,256065252 |
24 |
ПОИСКОВЫЕ СРЕДСТВА |
0,232370300 |
23 |
ПРОИЗВОДИТЕЛЬНОСТЬ |
0,219695378 |
59 |
ОПРЕДЕЛЕНИЯ |
0,120537948 |
59 |
ЭКСПЛУАТАЦИЯ |
0,120537948 |
102 |
ОБЕСПЕЧЕНИЕ ДОСТУПА |
0,092969592 |
88 |
СРЕДСТВА |
0,092775247 |
90 |
ПОНЯТИЯ |
0,091405883 |
255 |
АИПС |
0,091326155 |
134 |
СВОДНЫЕ КАТАЛОГИ |
0,077708893 |
169 |
ТИПЫ |
0,059747985 |
241 |
ТЕНДЕНЦИИ РАЗВИТИЯ |
0,052260958 |
261 |
ИНТЕРАКТИВНЫЙ ДОСТУП |
0,049447866 |
231 |
РЕЗУЛЬТАТЫ |
0,048036882 |
62 Голицына О.Л. Моделирование и разработка средств и технологий поиска документальной информации - диссертация на соискание ученой степени кандидата технических наук. – М.: РГГУ, 2004
285 |
ИНФОРМАЦИОННЫЕ ЗАПРОСЫ |
0,046496765 |
282 |
АИС |
0,041655815 |
371 |
ИНТЕРАКТИВНЫЕ КАТАЛОГИ 0, |
038532128 |
1973 |
ИНФОРМАЦИОННЫЙ ПОИСК |
0,034875966 |
388 |
ИПС |
0,032947558 |
423 |
ЭКСПЕРИМЕНТЫ |
0,030870876 |
1309 |
ПОЛЬЗОВАТЕЛИ |
0,026564388 |
591 |
МОДЕЛИ |
0,023797976 |
805 |
ИНТЕРФЕЙСЫ |
0,018443519 |
960 |
АНАЛИЗ |
0,015820678 |
1252 |
ИНФОРМАЦИОННЫЕ СЕТИ |
0,014472937 |
1241 |
ИНФОРМАТИКА |
0,012474870 |
4886 |
ОБЗОРЫ |
0,006685146 |
4153 |
БАЗЫ ДАННЫХ |
0,002837892 |
В первой колонке словника – частота термина в БД, во второй колонке – сам термин, а в третьей колонке – значение весового коэффициента.
Далее пользователь отмечает некоторые термины словника (в списке они выделены курсивом) и либо добавляет их в исходный запрос самостоятельно, либо запускает процедуру построения информационного пространства и кластеризации. После этого пользователь получает доступ к просмотру через протокол ненулевых результатов следующих предложений запроса (идентифицируемых отдельными терминами или сочетаниями терминов, выделенных в словнике курсивом):
KW : (‘ВЕКТОРНЫЕ МОДЕЛИ’ and ‘КЛАСТЕРИЗАЦИЯ’) {1} KW : (‘АССОЦИАТИВНЫЙ ПОИСК’ and ‘ПОИСКОВЫЕ СРЕДСТВА’) {1}
KW : (‘ВЕКТОРНЫЕ МОДЕЛИ’) |
{2} |
KW : (‘АССОЦИАТИВНЫЙ ПОИСК’) |
{8} |
KW : (‘КЛАСТЕРИЗАЦИЯ’) |
{12} |
KW : (‘ПОИСК ИНФОРМАЦИИ’) |
{15} |
KW : (‘ПОИСКОВЫЕ СРЕДСТВА’) |
{24} |
После просмотра документов отдельных предложений запроса и выделения нового множества релевантных документов процедуры построения словника и кластеризации могут быть заново инициированы, и так до тех пор, пока полученный совокупный результат (а все полученные пользователем результаты хранятся системой и в любой момент могут быть объединены в общее множество) не удовлетворит пользователя.