Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Документальные информационно-поисковые системы.doc
Скачиваний:
114
Добавлен:
10.05.2014
Размер:
5.47 Mб
Скачать

45. Классификация. Определение и формально–логические правила построения.

В основе любой классификации лежит принцип деления объектов рассматриваемой предметной области. Каждый объект с точки зрения решаемых классификацией задач характеризуется фиксированным множеством свойств, совокупность значений которых может говорить об эквивалентности (или близости) данного объекта некоторому множеству объектов. Назовем такие характеристические свойства объекта атрибутоми.

Классификация – выделение из екоторого множества объктов, принадлежащих универсальному классу, всех подклассов на основе значений выделенных в предметной области атрибутов и устонавление между выделенными подклассами отношений порядка.

Атрибуты, учавствующие в делении на классы, называются классификационными или основаниями деления.

Классификация должна подчиняться следующим логическим правилам.

  1. очередной шаг классификации проводится только по одному атрибуту

Пусть К – некоторый класс, который на основе заданного множества n значений некоторого атрибута разделен наподклассыk1, k2, k3, …, kn.

k1U k2 U k3 U … U kn = K;

ki ∩ kj= ø ; V i ≠ j , i = 1,n j=1,n.

  1. получаемые в результате деления подклассы не должны пересекаться (в практике соблюдается редко)

  2. деление на подклассы должно быть соразмерным.

Классификационная схема характеризуется множеством атрибутов и множеством различных классов, которые могут быть выделены на базе зафиксированных множеств значений атрибутов.

46. Типы классификаций. Иерархические классификации. Примеры.

Типы классификаций:

  1. Иерархические классификации

  2. Фасетные классификации

  3. Булевы классификации.

Иерархические классификации.

Если между классами установлено отношение порядка при пустом попарном пересечении соподчиненных классов, э то означает, что отношение порядка установлено и для классификационных атрибутов. Такие классификации называются древовидными или иерархическими.

В данном случае представлена классификационная структура, построенная для упорядоченного множества атрибутов{A,B,C} со значениямиA= {V¹А, V²А, V³А},B= {V¹B, V²B, V³B},C= {V¹C, V²C}

Общие принципы построения иерархических классификаций таковы, что они не позволяют иметь в классификации один и только один исчерпывающий класс для каждой группы объектов.

Пример:

Рассмотрим в качестве исходного класса К класс «Преподаватели института», а в качестве оснований деления – соответственно следующие атрибуты: «факультет» (А) со значениями А = {«Экономический факультет», «Факультет управления», «Юридический факультет»}, «возраст» (В) со значениями В = {«до 40», «40-55», «старше 55»} и «ученая степень» (С) со значениями С = {«Имеет», «Не имеет»}. Применение основания деления А к исходному классу дает нам подклассы «Преподаватели экономического факультета» (К1), «Преподаватели факультета управления» (К2) и «Преподаватели юридического факультета» (К3). Применение признака В соответственно к классам К1, К2 и К3 дает нам подклассы «Преподаватели экономического факультета возраста до 40» (К11), «Преподаватели экономического факультета возраста 40-55» (К12), «Преподаватели экономического факультета старше 55» (К13) и т.д. наконец применение признака С соответственно к классам К11, К12, К13, К21, К22, К23, К31, К32 и К33 порождает подклассы «Преподаватели экономического факультета возраста до 40, имеющие ученую степень» (К111), «Преподаватели экономического факультета возраста до 40, не имеющие ученой степени» (К112) и т.д.

При построении этой классификации деление на каждом уровне иерархии, как того требует формально-логические правила, должно проводиться только по одному основанию. Но соблюдение формаьно-логических правил не устраняет ее главного недостатка – невозможность проведения группировки документов и информационного поиска по любому сочетанию характеристик: для построения иерархической классификации используется определенный ряд атрибутов (оснований деления), применяющихся только в одной последовательности.

Если приведенную на схеме классификацию использовать для информационного поиска по любому сочетанию атрибутов, взятых из некоторого данного множества, необходимо построить отдельные классы для всех возможных сочетаний этих атрибутов. Эффективность этого метода зависит от числа классов самого нижнего уровня иерархии (N), которое можно построить путем применения в разной последовательности исходного множества атрибутов. => чем больше N, тем выше трудоемкость процедуры классифицирования документов.