Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kharina_ElizavetaLab1.docx
Скачиваний:
2
Добавлен:
09.11.2018
Размер:
103.89 Кб
Скачать

Этап 3. Изучение технологии реформулирования запроса “по обратной связи”

Итеративный эвристический поиск

KW: 'SCHEDUL'* или ('СОЦИАЛЬНОЕ УПРАВЛЕНИЕ’* или ‘ГОРОДСКИЕ ИНФОРМАЦИОННЫЕ СИСТЕ'*) или (('СОТРУДНИК'*или ‘СПЕЦИАЛИСТ’* или 'КАБИНЕТ'*) или ('РАСПИСАН'* или ('ПЛАН'* и 'РАБОТ'*) или 'РАСПОРЯД'*) ) или ('РАБОЧЕЕ ВРЕМЯ') или ('ОРГАНИЗАЦИЯ ТРУДА')

#17 {25} {Результат отмеченных предложений (Релевантных)}

Эврист.поиск - предложение запроса #16

Первая итерация дала 25 документов, из которых 5 релевантных

Точность

Полнота

0,28

0,28

Вторая итерация дала 25 документов, из которых 2 релевантные

Точность

Полнота

0,16

0,16

Третья итерация дала 25 документов, из которых 5 релевантных

Точность

Полнота

0,2

0,2

Объединение дало 46 документов, из которых 6 релевантных

Точность

Полнота

0,17

0,32

Эвристический поиск по итоговому результату

Были выделены в протоколе предложения – релевантные документы, полученные при поиске по ключевым словам (п.8) и релевантные документы, полученные при эвристическом поиске п.23.

Для итогового результата был произведен эвристический поиск:

В выдаче 5 документов, из которых 5 релевантных

Точность

Полнота

0,4

0,4

Сделано объединение результатов и выполнен эвристический поиск.

В выдаче 5 документов, из которых 6 релевантных

Точность

Полнота

0,44

0,44

Объединение результатов всех запросов дало 25 релевантных документов. Считаем их истинно релевантными.

Эффективный поиск по исходной теме (max релевантных при min просмотренных)

Выберем запрос:

AB:((SCH$D$L* или (СИСТ$М*(2) и ( (СОЦ$$ЛЬН*$НФ$РМ$Ц$$Н*) или ((КАБ$Н$Т*) или (РАСП$С$Н* или (ПЛАН$Р$В* + РАБ$Т*(1)) или РАСП$Р$Д*(2)) ) или (РАБ$Ч*ВР$М*) ИЛИ ОРГ$Н$З*ТР$Д*)) NOT БЗ NOT БИБЛ$$Т* NOT ЭКСП$Р* NOT ПОР$Д* NOT РАСПР$СТР$Н*))

В выдаче 41 документа, из них 15 релевантных (25%)

Точность

Полнота

1

1

AB:((SCH$D$L* или (СИСТ$М*(2) и ( (СОЦ$$ЛЬН*$НФ$РМ$Ц$$Н*) или ((КАБ$Н$Т*) или ((ВЕД$Н*(2) near[2] РАСП$С$Н*) или (ПЛАН$Р$В* + РАБ$Т*(1)) или РАСП$Р$Д*(2)) ) или (РАБ$Ч*ВР$М*) ИЛИ ОРГ$Н$З*ТР$Д*)) NOT БЗ NOT БИБЛ$$Т* NOT ЭКСП$Р* NOT ПОР$Д* NOT РАСПР$СТР$Н*))

В выдаче 54 документа, из них 17 релевантных (31,1%)

Точность

Полнота

0,31

0,68

AB:((SCH$D$L* или (СИСТ$М*(2) и ( (СОЦ$$ЛЬН *$НФ$РМ$Ц$$Н*) или ((КАБ$Н$Т*) или (((ВЕД$Н*(2) near[2] РАСП$С$Н*) или (СОСТ$ВЛ$Н*(2) near[2] РАСП$С$Н*)) или (ПЛАН$Р$В* + РАБ$Т*(1)) или РАСП$Р$Д*(2)) ) или (РАБ$Ч*ВР$М*) ИЛИ ОРГ$Н$З*ТР$Д*)) NOT БЗ NOT БИБЛ$$Т* NOT ЭКСП$Р* NOT ПОР$Д* NOT РАСПР$СТР$Н*))

В выдаче 43 документа, из них 14 релевантных (33%)

Точность

Полнота

0,33

0,68

При дальнейших модификациях запроса, точность поиска не увеличивалась, так что данный запрос можно считать наиболее эффективным.

Таблица 1. Оценка поиска при помощи показателей эффективности "полнота-точность".

N

Название этапа

Точность

Полнота

1

Поиск по полю KW

0,25

0,4

2

Поиск по полю KW(модиф.)

0,33

0,56

3

Поиск по полю AB

0,16

0,44

4

Поиск по полям AB, KW

0,12

0,4

5

Поиск по полям AB, KW, TI

0,13

0,76

6

С автомаскированием по AB

0,25

0,72

7

С автомаскированием по KW

0,24

0,72

8

Итеративный 1 итерация

0,28

0,28

9

Итеративный 2 итерация

0,16

0,16

10

Итеративный 3 итерация

0,2

0,2

11

Объединение всех итераций

0,17

0,32

12

Эвристический поиск по итоговому результату

0,4

0,4

13

Эвристический поиск по всем объединеным результатам

0,44

0,44

14

Эффективный поиск 1 итерация

0,25

0,72

15

Эффективный поиск 2 итерация

0,31

0,68

16

Эффективный поиск 3 итерация

0,33

0,68

Ось абсцисс – Точность поиска

Ось ординат – Полнота поиска

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]