Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Голицына Информационные системы 2004.pdf
Скачиваний:
323
Добавлен:
16.08.2013
Размер:
5.01 Mб
Скачать

8.2.3. Поиск по обратной связи

Поиск по обратной связи реализуется, например, через последовательность взаимосвязанных этапов:

-отбор и выделение множества релевантных документов;

-построение ранжированного словника релевантных документов

ипредоставление словника пользователю;

-выбор терминов словника для формирования информационного пространства;

-разбиение построенного информационного пространства на кластеры и предоставление пользователю возможности для просмотра документов каждого отдельного кластера.

Особенностью реализации является возможность использования результатов, полученных на каждом этапе, для дальнейшего изменения стратегии поиска (так, например, термины, отобранные при просмотре словника релевантных документов, могут быть просто использованы для расширения запроса и проведения поиска по логическому выражению).

Рассмотрим порядок выполнения этапов на следующем примере. Пусть исходное предложение запроса на поиск по логическому

выражению в БД «Информатика» было следующим:

KW : ‘Поисковые стратегии’

При просмотре текстов документов-результатов поиска все из них были отмечены пользователем как релевантные. Тогда будет построен и выведен пользователю в ранжированном представлении следующий словник (для ранжирования использован интегральный коэффициент62):

2

ВЕКТОРНЫЕ МОДЕЛИ

1,037520473

5

ИНФОРМАЦИЯ О РАБОЧИХ МЕСТАХ

0,626009986

5

ПРЕДСТАВЛЕНИЕ ДОКУМЕНТОВ

0,602280990

7

РЕШЕНИЕ ПРОБЛЕМ

0,492237706

8

АССОЦИАТИВНЫЙ ПОИСК

0,454205158

23

РАЗРАБОТКА

0,440147604

12

КЛАСТЕРИЗАЦИЯ

0,329185167

15

ПОИСК ИНФОРМАЦИИ

0,310164008

18

ЗАВИСИМОСТЬ

0,256065252

24

ПОИСКОВЫЕ СРЕДСТВА

0,232370300

23

ПРОИЗВОДИТЕЛЬНОСТЬ

0,219695378

59

ОПРЕДЕЛЕНИЯ

0,120537948

59

ЭКСПЛУАТАЦИЯ

0,120537948

102

ОБЕСПЕЧЕНИЕ ДОСТУПА

0,092969592

88

СРЕДСТВА

0,092775247

90

ПОНЯТИЯ

0,091405883

255

АИПС

0,091326155

134

СВОДНЫЕ КАТАЛОГИ

0,077708893

169

ТИПЫ

0,059747985

241

ТЕНДЕНЦИИ РАЗВИТИЯ

0,052260958

261

ИНТЕРАКТИВНЫЙ ДОСТУП

0,049447866

231

РЕЗУЛЬТАТЫ

0,048036882

62 Голицына О.Л. Моделирование и разработка средств и технологий поиска документальной информации - диссертация на соискание ученой степени кандидата технических наук. – М.: РГГУ, 2004

285

ИНФОРМАЦИОННЫЕ ЗАПРОСЫ

0,046496765

282

АИС

0,041655815

371

ИНТЕРАКТИВНЫЕ КАТАЛОГИ 0,

038532128

1973

ИНФОРМАЦИОННЫЙ ПОИСК

0,034875966

388

ИПС

0,032947558

423

ЭКСПЕРИМЕНТЫ

0,030870876

1309

ПОЛЬЗОВАТЕЛИ

0,026564388

591

МОДЕЛИ

0,023797976

805

ИНТЕРФЕЙСЫ

0,018443519

960

АНАЛИЗ

0,015820678

1252

ИНФОРМАЦИОННЫЕ СЕТИ

0,014472937

1241

ИНФОРМАТИКА

0,012474870

4886

ОБЗОРЫ

0,006685146

4153

БАЗЫ ДАННЫХ

0,002837892

В первой колонке словника – частота термина в БД, во второй колонке – сам термин, а в третьей колонке – значение весового коэффициента.

Далее пользователь отмечает некоторые термины словника (в списке они выделены курсивом) и либо добавляет их в исходный запрос самостоятельно, либо запускает процедуру построения информационного пространства и кластеризации. После этого пользователь получает доступ к просмотру через протокол ненулевых результатов следующих предложений запроса (идентифицируемых отдельными терминами или сочетаниями терминов, выделенных в словнике курсивом):

KW : (‘ВЕКТОРНЫЕ МОДЕЛИ’ and ‘КЛАСТЕРИЗАЦИЯ’) {1} KW : (‘АССОЦИАТИВНЫЙ ПОИСК’ and ‘ПОИСКОВЫЕ СРЕДСТВА’) {1}

KW : (‘ВЕКТОРНЫЕ МОДЕЛИ’)

{2}

KW : (‘АССОЦИАТИВНЫЙ ПОИСК’)

{8}

KW : (‘КЛАСТЕРИЗАЦИЯ’)

{12}

KW : (‘ПОИСК ИНФОРМАЦИИ’)

{15}

KW : (‘ПОИСКОВЫЕ СРЕДСТВА’)

{24}

После просмотра документов отдельных предложений запроса и выделения нового множества релевантных документов процедуры построения словника и кластеризации могут быть заново инициированы, и так до тех пор, пока полученный совокупный результат (а все полученные пользователем результаты хранятся системой и в любой момент могут быть объединены в общее множество) не удовлетворит пользователя.