Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Голицына Информационные системы 2004.pdf
Скачиваний:
323
Добавлен:
16.08.2013
Размер:
5.01 Mб
Скачать

1.Три первые буквы дескриптора остаются без изменения.

2.Все следующие гласные буквы заменяются символом маскирования произвольного числа рядом стоящих букв.

3.Конечные буквы в, г, м, х в дескрипторе заменяются символом маскирования произвольного числа рядом стоящих букв.

4.В конце дескриптора проставляется символ маскирования произвольного числа рядом стоящих букв (если после всех преобразований конечный символ дескриптора не является символом маскирования).

Лингвистическое обоснование такой замены заключается в том, что смыслоразличительная роль согласных во много раз больше, чем гласных. Начальная часть слова включается в новый дескриптор без изменения, т.к. информативность первых трех букв в слове велика. Согласные в, г, м, х могут попадать в дескриптор из окончаний существительных и прилагательных, поэтому исключение этих согласных из дескриптора и замена их символом маскирования ведет к отсечению окончаний.

Нормализованный таким образом дескриптор позволяет обеспечить более полный дескрипторный поиск с использованием только лишь частотного словаря БД.

Рассмотрим, например, запрос, который на естественном языке представляет собой предложение: «Частотный анализ терминов словаря». Такой запрос в системе (с применением правил нормализации) автоматически преобразуется в следующий ПОЗ:

част$тн$ AND анал$з$ AND терм$н$ AND слов$р$ Нормализованный таким образом ПОЗ обеспечивает поиск по

логическому выражению с разрешением символов маскирования: част$тн$ = частотность, частотности, частотный, частотные,

частотных, частотного, частотной; анал$з$ = анализ, анализа, анализе, анализу, анализируется,

анализируются; терм$н$ = термин, термина, термину, термином, термины,

терминов, терминах, терминология, терминологии, терминологию, терминологические, терминологическим, терминологических, терминологической, терминологический, терминосистем, терминологичности;

слов$р$ = словарь, словаря, словаре, словарем, словарей, словарные, словарными, словарных, словарного, словоформа, словоформе, словоформы, словоформ, словарные, словарнограмматический, словоупотреблений.

4.5.4. Использование ранее полученных результатов поиска

127

В качестве операнда условия поиска в предложении запроса может использоваться ранее полученный результат поиска:

<Результат поиска> ::= # <Идентификатор результата поиска> Для включения в предложение поискового запроса результатов

ранее проведенного поиска используются ссылки на номер предложения в текущем запросе.

Например, запрос может иметь вид:

#2 and ((KW or AB) : Россия)

где #2 - ссылка на результат второго предложения запроса.

Символ "#" является индикатором ссылки. За ним указывается номер одного из предыдущих предложений текущего запроса или имя сохраненного запроса, результат поиска по последнему предложению которого используется для уточнения в этом предложении.

128

Контрольные вопросы

1.Охарактеризуйте оценки эффективности информационного

поиска.

2.Охарактеризуйте взаимосвязь показателей эффективности и компонентов ИС.

3.Определите понятие универсального информационного потока.

4.Дайте определение первичных координат описания выхода

ИПС.

5.Охарактеризуйте матрицу «термин-документ» и ее свойства.

6.Дайте формальное определение понятия «механизм поиска».

7.Охарактеризуйте сходства и отличия механизма поиска по совпадению терминов и механизма поиска документов-аналогов.

8.Перечислите механизмы поиска документов по сходству.

9.Определите понятие расширенного логического выражения, операции и операнда.

10.Охарактеризуйте возможную семантику использования дескрипторов в дескрипторных ИПЯ документальных ИПС.

129