Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гайдамакин Н. А. Автоматизированные информационные системы, базы и банки данных. Вводный курс.doc
Скачиваний:
372
Добавлен:
02.05.2014
Размер:
4.3 Mб
Скачать

6.2.2. Координация понятий в классификационных системах

Еще одним аспектом развития систем классификации и поиска документов является координация понятий(классов, рубрик), выражающаяся в использованииразличных операций над совокупностью понятий при индексировании документов или при поиске документов(см. рис. 6.3). При этом выделяютдванаправления —использование только логических операций* (объединение, пересечение, дополнение, включение) иисполь­зование определенной грамматики понятий,** классов, рубрик в рамках определенного семантического языка.

* Точнее операций из теории множеств.

** Так называемые синтагматические отношения.

Рассмотрим содержание простейших логических операций в отношении классификационных понятий. Под классом(по­нятием) будем понимать совокупность (множество) докумен­тов, проиндексированных кодом соответствующего класса.ОбъединениемклассовХиYназывается множество докумен­товХ И Y,которые проиндексированы кодом классаХили ко­дом классаYили одновременно кодами обоих классов.Пере­сечением классов Х иYназывается множество документовХ Y, одновременно проиндексированных классомХ и классомY.ДополнениемклассаХклассом называется множество докумен­тов Х' =X, не проиндексированных кодом класса X.* В фор­мальной логике операция объединения может выражаться тер­минами «логическая сумма», дизъюнкция или «операция ИЛИ», операция пересечения терминами «логическое произведение», конъюнкция, или «операция И», операция дополнения терми­нами «логическое отрицание» или операция «НЕ».

* В свою очередь обратно Х является дополнением X',

Еще одной важной операцией является операция включе­ния. Класс ХявляетсявключениемклассаYX,когда любой документ, проиндексированный классомX,является одновре­менно документом, проиндексированным классомY.

Рассмотренные операции в терминах теории множеств ил­люстрируются на рис. 6.7.

Рис. 6.7. Иллюстрация операции над классами

Логические операциинад понятиями предоставляют воз­можности отображения при индексировании документов и фор­мировании запросовболее сложных и многоаспектных поня­тий.Так, к примеру, рубрика Ac Bgt Lgиз примера на рис. 6.6 по фасетной классификации в терминах логических операций представляет собой пересечение трех классов — Ac  Bgt Lg, соответственно. При этом использование дополнительных опе­раций объединения (ИЛИ) и отрицания (НЕ) обеспечивает по­строение более сложных, чем при чисто фасетной классифика­ции, комбинаций рубрик, классов и понятий. Кроме того, опе­рация включения дает возможность так называемого цепного представления и описания иерархических структур каталогов, формализуя систематизированный аспект классификаторов.

Идеи координации понятий, т. е. использования операций над классами, активно развивались в 40-с—50-с гг. в первых механизированных системах организации поиска документов (уже упоминавшиеся карты У. Баттена на основе оптического совпадения, система «Зато-кодирования» К. Муэрса и система унитермов М. Тауба). При этом определилось два направления координации понятий —предкоординацияипосткоординация (см. рис. 6.3).

Предкоординацияпонятий предусматривает использова­ние операций над классамипри индексировании документов. Иначе говоря, индекс документа представляет собой конструкцию из исходных понятии (классов) классификатора, постро­енную на основе логических операций. В системах на основепосткоординациипонятий логические операции над класса­ми осуществляютсяпри поискедокументов, т. е. в процессе фор­мирования поискового образа запроса. Технология и механизм поиска при этом включают предварительный отбор всех доку­ментов с индексами классов (рубрик), входящих в логическую конструкцию запроса, с последующим осуществлением соб­ственно логических операций над отобранными совокупностями (множествами) документов.