Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Максимов Информационные ресурсы и поисковые системы 2008

.pdf
Скачиваний:
635
Добавлен:
16.08.2013
Размер:
8.18 Mб
Скачать

Флаг Многооконный режим устанавливает дополнительную возможность вывода результатов работы некоторых функций в дополнительных окнах браузера.

Параметр Объем выдачи позволяет указать количество записей для просмотра на одном экране (5, 10, 20 или 50 записей).

Раскрывающийся список Запрос появляется только для зарегистрированных пользователей. В списке можно выбрать режим работы с новым запросом или с одним из поименованных и сохраненных пользователем ранее. В случае работы с сохраненным запросом его данные загружаются в Протокол системы и могут быть использованы для продолжения поисковой сессии.

Рис. 10.3. Начало поисковой сессии

Кнопка Установка параметров и начало поиска инициирует функцию задания дополнительных параметров поиска и просмотра (стр. 10.4). При этом параметры поиска должны быть установлены до выполнения поисковых операций, а параметры просмотра могут быть изменены после поиска, перед просмотром порции документов.

Альтернативный флаг Тип поискового запроса позволяет установить форму ввода поискового запроса для интерфейса профессионального поиска (по простому вхождению, по логическому выражению или по образцу).

В результат поиска по очередному выражению (предложению запроса в терминах ИПЯ системы) могут быть включены либо все найденные по предложению запроса документы, либо только новые по отношению к предыдущему предложению (исключая док-

ты последнего поиска) или ко всему запросу (исключая все ранее найденные).

271

Рис. 10.4. Установка дополнительных параметров поиска

Для просмотра документов может быть выбран один из следующих форматов:

-Full Ref.(Eng) – названия элементов данных выводятся на английском языке. Запись выводится на языке первоисточника.

-Full Ref. (Rus) – названия элементов данных выводятся на русском языке. Запись выводится на языке первоисточника.

-Full Ref.(Transl) – названия элементов данных выводятся на английском языке. Запись выводится на языке первоисточника. Кириллические символы в названии первоисточника, аннотации и терминах выводятся в латинской транслитерации (стандарт библиотеки Конгресса США). Этот формат можно использовать для вывода на печать записей на кириллице, если устройство вывода не имеет соответствующих шрифтовых возможностей.

-Short Ref. (Eng) – названия элементов данных выводятся на английском языке. Запись выводится на языке первоисточника. Сокращенная форма вывода записи.

-Short Ref. (Rus) – названия элементов данных выводятся на русском языке. Запись выводится на языке первоисточника. Сокращенная форма вывода записи.

272

-Short Ref. (Transl) – названия элементов данных выводятся на английском языке. Запись выводится на языке первоисточника. Кириллические символы в названии первоисточника, аннотации и терминах выводятся в латинской транслитерации. Сокращенная форма вывода записи.

-FR & Subj. (Eng) – названия элементов данных выводятся на английском языке. Запись выводится на языке первоисточника. Вместе с кодами рубрикатора ИНИОН в записи выводятся названия рубрик на русском и английском языках.

-FR & Subj. (Rus) – названия элементов данных выводятся на русском языке. Запись выводится на языке первоисточника. Вместе с кодами рубрикатора ИНИОН в записи выводятся названия рубрик на русском и английском языках.

-FR & Subj. (Transl) – названия элементов данных выводятся на английском языке. Запись выводится на языке первоисточника. Кириллические символы в названии первоисточника, аннотации и терминах выводятся в латинской транслитерации. Вместе с кодами рубрикатора ИНИОН в записи выводятся названия рубрик на английском языке и транслитерация названий рубрик на кириллице.

-Biblio View (INION) – названия элементов данных выводятся на русском языке. Запись выводится на языке первоисточника. Формат вывода описания первоисточника на каталожную карточку ИНИОН (с добавлением аннотации, терминов и кодов рубрик).

-Citation – названия элементов данных выводятся на русском языке. Запись выводится на языке первоисточника. Сокращенный формат вывода описания первоисточника на каталожную карточку ИНИОН.

При установке параметров можно также дополнительно выбрать для поиска еще не более четырех баз данных. Результаты поиска по отдельным базам фиксируются в Протоколе поисковой сессии как отдельные предложения запроса.

273

Рис. 10.5. Интерфейс простого поиска.

Поисковые интерфейсы

Интерфейс простого поиска. Страница простого поиска содержит строку формирования запроса и интерфейсные элементы для задания дополнительных условий отбора и выдачи документов

(рис. 10.5, 10.6).

Запрос вводится как последовательность терминов, относимых при поиске ко всем полям документа и объединяемых логической операцией ИЛИ, а выдача ранжируется по количеству терминов запроса, найденных в документе. Термины включаются в выражение запроса либо в том виде, в котором они введены в строку поиска (символ «*» при этом указывает на усечение), либо в нормализованной форме с автоматическим усечением окончаний (по вариантам словоформ).

Флаг При выводе использовать краткий список… включает сокращенный формат выдачи документов, при котором содержимое документа урезается до одного поля.

При формировании запроса может быть использован словарь одного из предлагаемых в списке выбора полей. Термины словаря при выдаче оформлены как гиперссылки и снабжены числовым значением, характеризующим количество документов, содержащих

274

термин (например, при формировании поискового запроса, представленного на рис. 10.6, термин ЦИКЛ не был включен в выражение по причине высокой частотности).

Рис. 10.6. Формирование запроса при простом поиске

Результаты поиска (в режиме простого поиска) выводятся постранично. В верхней части первой страницы содержится справочная информация о количестве документов, найденных во всех отмеченных для поиска БД (рис. 10.7). В нижней части каждой страницы размещены элементы управления поисковым процессом, доступные в режиме простого поиска. Подробно возможности управления поисковым процессом будут представлены ниже.

Интерфейс профессионального поиска. Страница профес-

сионального поиска содержит форму запроса в одном из трех вариантов.

Форма по простому вхождению аналогична форме запроса простого поиска.

Форма по логическому выражению содержит три области ввода поисковых условий, относимых к различным полям. Поиско-

275

вые условия традиционно объединяются в логическое (булевоподобное) выражение одной из логических операций (И, ИЛИ, НЕ). По умолчанию логика реализации поискового выражения соответствует приоритету логических операций. Если же отмечен флаг

Выполнение в порядке следования, то поисковые условия будут вы-

полняться в естественном порядке. Например, для поискового запроса, представленного на рис. 10.8, будут сформированы следующие выражения (в соответствии с ИПЯ системы):

ALL: (ядерн* И реактор*) ИЛИ (ALL: (ядерн* И цикл*) И LG: русский)

– если флаг не установлен и

(ALL: (ядерн* И реактор*) ИЛИ (ALL: (ядерн* И цикл*)) И LG: русский

если флаг установлен.

Впервом случае требование русскоязычного документа будет относиться только к документам, содержащим модификации терминов ядерн и цикл.

Рис. 10.7. Результаты поиска в режиме простого поиска

Форма по образцу содержит несколько строк для ввода отдельных поисковых условий, одни из которых относятся к фиксированным полям, а другие предлагают список из группы полей на выбор. Форма запроса задается схемой конкретной БД и может

276

быть различной для разных источников данных. На рис. 10.9 представлена форма запроса, в которой зафиксированы условия поиска для полей Авторы, Язык, Тип документа. Каждое из полей Загла-

вие, Общий словарь и Год издания задает свою группу полей, одно из которых можно выбрать в образец (например, группа Год изда-

ния содержит поле Год поступления). Для каждого из полей в об-

разце можно сформировать условие из одного термина или нескольких, связав их логическими операторами. Условия для отдельных полей объединяются в выражение запроса логическим оператором И.

Рис. 10.8. Форма запроса «по логическому выражению».

Вывод результатов поиска

Полные функциональные возможности работы с поисковыми результатами доступны пользователю в режиме профессионального поиска.

Верхняя часть первой страницы результатов позволяет инициировать следующие функции (рис.10.10):

277

Переотобразить результат – интерфейс выполнения функ-

ции включает раскрывающийся список Сортировать по ключу для выбора поля, по значению которого необходимо отсортировать выдачу, флаг альтернативного выбора последовательности сортировки (по убыванию/возрастанию), раскрывающийся список Формат для выбора формы отображения документа внутри страницы, раскрывающийся список Объем выдачи для выбора размера страницы и кнопку «Выполнить» для запуска функции на исполнение.

Новый поиск – интерфейс выполнения функции нового поиска содержит строку ввода/редактирования поискового запроса (Поиск.условие/Имена полей), в которой можно также и ввести новый запрос, используя синтаксис ИПЯ системы, флаг Уточняя последнюю выдачу, включающий режим нового поиска только среди документов предыдущего результата, и кнопку Найти для запуска функции.

Рис. 10.9. Форма запроса «по образцу».

При отображении на странице результатов поиска каждый документ снабжается альтернативным переключателем Релевантный/Не релевантный. Установка переключателя в одно из значений

278

позволяет дополнительно объявить документ «нужным», соответствующим поисковой потребности пользователя (релевантным) или «не нужным». Эти отметки в дальнейшем могут быть использованы при выполнении функций Эвристический поиск и Новый поиск и Протокол (управляющие кнопки для запуска функций расположены в нижней части каждой страницы результата – рис. 10.11).

В режиме просмотра при каждом документе размещается флаг Заказ копии, значение которого использует одноименная функция.

От каждого документа можно по гиперссылке Аналоги (в случае многооконного режима) перейти в новое окно просмотра документов-аналогов, т.е. документов, похожих на текущий (функция похожести выполняется как поиск документов, содержащих определенное количество общих терминов с текущим – рис.10.12).

Рис. 10.10. Первая страница результата поиска

Заказ копии. Страница заказов копий документов, отмеченных флагом Заказ копии, доступна только зарегистрированным пользователям (рис. 10.13). Документы, для которых заказаны ко-

279

пии, еще раз выводятся на странице. Отметки заказов могут быть еще раз пересмотрены и сняты у отдельных документов. В случае, если количество отмеченных документов меняется, необходимо выполнить функцию Пересчитать, т.е. заново рассчитать стоимость заказа. Заказ передается на исполнение только после актива-

ции кнопки Подтверждение заказа.

Эвристический поиск. Кнопка эвристического поиска запускает функцию поиска документов, похожих на документы, отмеченные в выдаче как релевантные, в соответствии с эвристической процедурой. В основе процедуры лежит формирование кластеров документов, содержащих наборы терминов (из лексики релевантных документов), имеющих значение весового коэффициента выше порогового, и упорядочение кластеров для вывода. Результат эвристической процедуры ограничен (в рассматриваемой реализации – не больше 20 документов) и содержит документы, имеющие максимальный суммарный вес.

Рис. 10.11. Нижняя часть страницы результатов поиска.

280

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]