Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Распознаная методичка.doc
Скачиваний:
1
Добавлен:
22.08.2019
Размер:
416.26 Кб
Скачать

1.3. Методи класифікації

Структура окремих класифікаторів переважно визначається методами класифікації та методами кодування. Аналіз різноманітних структур пока­зує, що всі ці методи застосовуються у тісному взаємозв'язку. Але доціль­но розглянути їх окремо.

Під час класифікації найширше використовуються ієрархічний та фа­сетний методи класифікації.

Ієрархічний метод класифікації - це метод, при якому задана мно­жина послідовно розподіляється на підпорядковані групи (рис. 1.1). Спочат­ку множина розподіляється за обраною ознакою на великі угруповання. Потім кожне угруповання відповідно до обраної ознаки (або критерію) розбивається на низку наступних угруповань, які, у свою чергу, розпада­ються на ще дрібніші групи за іншими ознаками. Таким чином, множина утворює класифікаційні угруповання, між якими встановлюються підпо­рядковані відносини (ієрархія).

Під час побудови ієрархічної класифікації для забезпечення зарахуван­ня конкретного об'єкта класифікації на кожному її рівні лише до одного.кла-сифікаційного угруповання потрібно дотримуватися таких важливих правил:

  • розподіл кожного класифікаційного угруповання на кожному рівні має проводитися лише за однією підставою ділення. Це забезпечить ма­шинну обробку інформації, яка міститься у класифікаторі. При цьому під­ставою розподілу можуть бути одночасно декілька окремих ознак або якась одна ознака;

  • угруповання, які отримуються в результаті розподілу на кожному рів­ні, мають належати лише до одного угруповання, що стоїть на вищому рівні, і не перетинатися, тобто не повторюватися. Повторення призводить до дуб­лювання, яке не дозволяє точно ідентифікувати угруповання або об'єкти;

  • розподіл має бути послідовним, без пропусків наступного рівня класифікації або без додавання проміжного рівня. Порушення послідовності призводить до викривлення ієрархічної структури класифікатора і вимагає створення спеціальних алгоритмів збирання угруповань, що ускладнює машинну обробку інформації.

Ієрархічна класифікація характеризується кількістю рівнів класифіка­ції, глибиною, ємністю та гнучкістю. Кількість рівнів визначає глибину класифікації. Глибина визначається залежно від ступеня конкретизації угруповань і кількості ознак, які необхідні для вирішення конкретних за­вдань. Від глибини класифікації та кількості угруповань, які створюються на кожному рівні класифікації, залежить ємність класифікації. Як правило, найбільша кількість наступних угруповань, на які може поділитися дане угруповання, встановлюється постійною або для всієї класифікації, або для даного рівня. Як правило, кількість угруповань на одному рівні дорівнює десяти або кратне десяти.

6

До переваг ієрархічної класифікації належать велика інформаційна ємність, традиційність та звичність її застосування, пристосованість до руч­ної обробки інформації.

Значним недоліком ієрархічної класифікації є слабка гнучкість її структури, яка обумовлена фіксованістю ознак та заздалегідь установле­ним порядком їх розташування. Унаслідок цього за відсутності резервної ємності неможливе включення нових об'єктів до класифікації. У такому випадку зміни хоча б однієї ознаки ведуть до перерозподілу багатьох кла­сифікаційних угруповань. Тому в класифікаторах, які побудовані за ієрар­хічним методом, мають передбачатися значні резервні ємності. Крім того, даний метод не дозволяє проводити агрегування об'єктів і здійснювати ін­формаційний пошук за будь-яким вільним сполученням ознак, а також ускладнює машинну обробку інформації внаслідок нестандартного виок­ремлення та розташування значень конкретних ознак об'єктів в різних на­прямках класифікації.

Фасетний метод класифікації передбачає розподіл заданої множини на угруповання незалежно за різними ознаками класифікації. Фасетна кла­сифікація не має суворої класифікаційної структури та заздалегідь побудо­ваних кінцевих угруповань. У класифікаторах фасети найчастіше розташо­вуються у вигляді простого переліку та мають свій код (рис. 1.2).

8

Рис. 1.2. Схема фасетної класифікації

Під час створення фасетної класифікації необхідно дотримуватись та­ких правил:

  • значення ознак в різних фасетах не повинні перетинатися (принцип взаємного виключення фасетів). Це необхідно для забезпечення повної ідентифікації значення ознаки;

  • з усіх можливих фасетів, що характеризують множину об'єктів, яка класифікується, відбираються та фіксуються лише суттєві, тобто фасети, які забезпечують вирішення конкретних завдань. Під час використання фа­сетного методу класифікації ознаки повинні мати найбільший ступінь од­норідності для більшості об'єктів множини, що класифікується, і мати практичну цінність;

  • фасети класифікатора, який створюється, повинні займати суворо фіксоване місце. Під час використання різних комбінацій фасетів для розв'язання різних техніко-економічних завдань, варто проводити їх іден­тифікацію за допомогою відповідного кодового позначення фасета. Часто це просто порядковий номер фасета у класифікаторі. Ідентифікація фасета потрібна для складання фасетної формули, створення найбільш ефектив­них структур запису інформації до машинних масивів та полегшення її машинної обробки.

Основна перевага фасетної класифікації - гнучкість структури її по­будови, оскільки зміни в будь-якому з фасетів не мають суттєвого впливу на інші фасети. Фасетний метод класифікації дозволяє не лише створювати нові класифікаційні угруповання з тих фасетів, що вже є, але включати до класифікатора нові або виключати старі фасети без переробки всієї струк­тури. Гнучкість фасетної класифікації дає можливість здійснювати інфор­маційний пошук за будь-яким сполученням фасетів. Тобто інформація пристосована до машинної обробки.

Недоліком фасетної класифікації слід вважати недостатньо повне ви­користання ємності внаслідок відсутності багатьох з можливих сполучень фасетів, нетрадиційність і незвичність застосування, а також складність використання даного методу для ручної обробки інформації.