Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Максимов Информационные ресурсы и поисковые системы 2008

.pdf
Скачиваний:
635
Добавлен:
16.08.2013
Размер:
8.18 Mб
Скачать

Результатом процедуры эвристического поиска является также словник терминов релевантных документов, снабженных частотой встречаемости во множестве релевантных документов. Отобразить лексику релевантных документов можно по соответст-

вующей ссылке (Поиск по лексике релевантных документов) на странице результатов эвристического поиска (рис. 10.14).

Отметив термины из предложенного списка (рис.10.15) и

инициировав функцию Поиска по комбинациям отмеченных тер-

минов, пользователь запускает процедуру обратной связи по релевантности, которая строит кластеры документов и включает эти кластеры как предложения запроса в Протокол поисковой сессии

(рис. 10.16).

Рис. 10.12. Окно вывода результатов поиска аналогов

281

Рис. 10.13. Форма заказа электронных копий

Рис. 10.14. Вывод результатов эвристического поиска

282

Рис. 10.15 Отображение лексики релевантных документов

Протокол поиска. На всем протяжении поисковой сессии система предоставляет возможность обращаться ко всем введенным и обработанным поисковым выражениям. Активизировав функцию Новый поиск и Протокол (см. рис. 10.11), пользователь попадает на страницу, которая (помимо формы запроса) содержит перечень предложений запроса, снабженных гипертекстовыми ссылками, позволяющими перейти к просмотру результата (см.

рис. 10.16).

Каждое из предложений запроса имеет в рамках Протокола свой номер, который может быть использован при формировании нового поискового условия (в соответствии с синтаксисом ИПЯ системы).

Помимо порядкового номера, у каждого предложения есть флаг отметки. Значения флагов используются при выполнении функций по обработке поисковых результатов.

Интерфейс функций Протокола содержит управляющие кнопки, а также флаги и текстовую область для ввода дополнительных параметром обработки.

283

Альтернативный флаг Выполнить задает множество предложений запроса (последнее, все предложения запроса или только отмеченные), для которых будет выполняться одна из следующих функций:

-Итог и эвристический поиск – для заданного подмноже-

ства предложений запроса будет выполнена операция логического сложения результатов и затем проведен эвристический поиск с использованием отметок релевантности документов. Результат эвристического поиска будет записан в Протокол.

-Итоговый результат – для заданного подмножества предложений запроса будет сформировано множество объединения результатов, из которого будут выделены подмножества релевантных документов и документов, для которых были заказаны копии.

ВПротокол будет записан общий итоговый результат объединения и (если таковые найдутся) результаты отбора релевантных и (отдельно) заказанных документов.

-Уничтожить – заданное подмножество предложений запроса будет удалено из Протокола. После выполнения операции возврат удаленных предложений в Протокол невозможен.

Рис. 10.16. Протокол поисковой сессии

284

Предложения запроса (а точнее – их результаты) можно использовать для формирования нового поискового запроса. Текстовая область по условию позволяет сформировать (в синтаксисе ИПЯ) выражение запроса, где вместо терминов могут быть указаны номера предложений Протокола. Например, выражение запроса #10 not #9 позволит получить документы, отнесенные к рубрикам, отличным от рубрики, по которой проведен поиск в предложении

#9.

Поиск в базах данных ИНИОН с использованием тематического рубрикатора и тезаурусов

Для формулировки поискового запроса можно использовать Рубрикатор ИНИОН и Тезаурус по тематике БД. Доступ к объектам лингвистического обеспечения возможен через соответствующие гипертекстовые ссылки в правом верхнем углу формы поискового запроса (см., например, рис. 10.9).

Дополнительные объекты лингвистического обеспечения представлены в той же структуре доступа, что и основные БД. В базах данных Рубрикатора и Тезауруса можно проводить поиск в режиме логического выражения (рис. 10.17, 10.19).

Тезаурус. В БД Тезаурус для формирования поискового запроса могут быть использованы следующие поля:

-дескриптор;

-вышестоящий дескриптор;

-нижестоящий дескриптор;

-ассоциативный дескриптор;

-рубрика ИНИОН (цифровой индекс).

Поисковые словари полей «Дескриптор», «Вышестоящий дескриптор», «Нижестоящий дескриптор», «Ассоциативный дескриптор» содержат дескрипторы тезауруса – слова и словосочетания без разбиения на отдельные слова.

Для поиска по отдельным словам из дескрипторовсловосочетаний служит словарь «Все поля», который включает термины-слова из содержимого всех перечисленных выше полей, кроме поля «Рубрики ИНИОН».

285

Рис. 10.17. Форма поискового запроса Тезауруса

Поисковая система ищет словарные статьи тезауруса, содержащие термины, указанные в запросе, и выводит их на экран

(рис. 10.18).

Рис. 10.18. Вывод результата поиска в Тезаурусе

Каждый дескриптор при выводе снабжается флагом отметки. При выполнении функции Возврат в основную БД из отмеченных дескрипторов тезауруса формируется поисковый запрос (дескрипторы в запросе связываются логической операцией И), по которому

286

проводится поиск в библиографической БД. Если при поиске система не найдет документов, соответствующих данному запросу, включается механизм эвристического поиска: операция И между терминами запроса меняется на логическое ИЛИ. Результаты поиска в этом случае ранжируются по степени соответствия содержания документов поисковому запросу.

Рубрикатор ИНИОН. Для поиска рубрик в тематическом Рубрикаторе ИНИОН (рис. 10.19) можно использовать поля, содержащие:

-цифровой код рубрики;

-заглавие на русском языке;

-заглавие на английском языке.

Словари полей построены по принципу разбиения содержимого поля на отдельные слова. Цифровые коды рубрик при выводе поискового результата снабжены флагами отметки (рис. 10.20). Коды отмеченных рубрик (аналогично поиску в Тезаурусе) используются для формирования запроса и проведения поиска в библиогра-

фической БД (функция Возврат в основную БД).

Рис. 10.19. Форма поискового запроса Рубрикатора

287

Рис. 10.20. Вывод результата поиска в Рубрикаторе

10.2. Базы реферативно-библиографической информации ВИНИТИ РАН

Всероссийский институт научной и технической информации ВИНИТИ РАН – крупнейший информационный центр, обеспечивающий с 1952 г. на основе анализа потока отечественных и зарубежных публикаций российское и мировое сообщество научнотехнической информацией по проблемам точных, естественных и технических наук.

База данных ВИНИТИ РАН включает материалы Реферативного журнала (РЖ) по естественным, точным и техническим наукам с 1981г. Общий объем БД – более 26 млн документов. База формируется по материалам периодических изданий, книг, фирменных изданий, материалов конференций, тезисов, патентов, нормативных документов, депонированных научных работ, 30% которых составляют российские источники. БД ВИНИТИ пополняется ежемесячно, а тематический фрагмент Химия – 2 раза в месяц. Документы БД содержат библиографию, ключевые слова, рубрики и

288

реферат первоисточника на русском языке. Информационный ресурс ВИНИТИ включает 29 тематических фрагментов и более 230 выпусков БД, а также генерируемую с 2001 г. единую политематическую БД, объединяющую все тематические фрагменты, и отдельный выпуск «Экономия энергии».

Вход в информационные ресурсы ВИНИТИ осуществляется через, приведенную на рис. 10.21 главную страницу (www.viniti.ru).

Рис 10.21. Главная страница ВИНИТИ РАН

Начало поиска в БД инициируется через ссылку «База данных», размещенную на главной странице. В поисковой форме, представленной на рис. 10.22, пользователь выбирает тематическую базу данных и поисковое поле, для которого в окне запроса задается выражение для отбора, в том числе на естественном языке. Для ограничения выдачи можно дополнительно указать нужный выпуск, год и язык публикации или другие библиографические поля.

289

Результат поиска (выражение запроса и количество найденных документов) будет зафиксирован в протоколе – «Истории поиска», который отображается в нижней части формы. Результаты поиска, полученные по отдельным запросам, могут быть использованы в новых запросах: множества документов, соответствующих отмеченным запросам, будут объединены или пересечены, в зависимости от выбранной опции «Объединение маркированных запросов».

Рис. 10.22. Форма запроса

Для отображения в краткой форме найденных по запросу документов необходимо в окне «История поиска» для соответствующего запроса инициировать ссылку «Показать», после чего в открывшемся окне для каждого документа будут выведены список авторов, заглавие, ключевые слова и шифры рубрик. Термины, по которым был отобран документ, будут подсвечены (рис. 10.23).

Для вывода полного описания документов на экран или выгрузки в файл, необходимо использовать функциональные кнопки в верхней части формы.

290

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]