Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекція5.doc
Скачиваний:
6
Добавлен:
02.05.2019
Размер:
463.36 Кб
Скачать

5. Оцінка якості кластеризації

Оцінка якості кластеризації може бути проведена на основі наступних процедур:

  • ручна перевірка;

  • встановлення контрольних крапок і перевірка на отриманих кластерах;

  • визначення стабільності кластеризації шляхом додавання в модель нових змінних;

  • створення і порівняння кластерів з використанням різних методів. Різні методи кластеризації можуть створювати різні кластери, і це є нормальним явищем. Однак створення схожих кластерів різними методами вказує на правильність кластеризації.

Процес кластеризації

Процес кластеризації залежить від обраного методу і майже завжди є ітеративним. Він може стати захоплюючим процесом і включати безліч експериментів на вибір різноманітних параметрів, наприклад, міри відстані, типу стандартизації змінних, кількості кластерів і т.д. Однак експерименти не повинні бути самоціллю – адже кінцевою метою кластеризації є одержання змістовних відомостей про структуру досліджуваних даних. Отримані результати вимагають подальшої інтерпретації, дослідження та вивчення властивостей і характеристик об'єктів для можливості точного опису сформованих кластерів.

Застосування кластерного аналізу

Кластерний аналіз застосовується в різних областях. Він корисний, коли потрібно класифікувати велику кількість інформації. Огляд багатьох опублікованих досліджень, проведених за допомогою кластерного аналізу, дав Хартиган (Hartigan, 1975).

Так, у медицині використовується кластеризація захворювань, лікування захворювань або їхніх симптомів, а також таксономія пацієнтів, препаратів і т.д. В археології встановлюються таксономії кам'яних споруджень і древніх об'єктів і т.д. У маркетингу це може бути задача сегментації конкурентів і споживачів. У менеджменті прикладом задачі кластеризації буде розбивка персоналу на різні групи, класифікація споживачів і постачальників, виявлення схожих виробничих ситуацій, при яких виникає брак. У медицині – класифікація симптомів. У соціології задача кластеризації – розбивка респондентів на однорідні групи.

Кластерний аналіз у маркетингових дослідженнях

У маркетингових дослідженнях кластерний аналіз застосовується досить широко – як у теоретичних дослідженнях, так і практикуючими маркетологами, що вирішують проблеми групування різних об'єктів. При цьому вирішуються питання про групи клієнтів, продуктів і т.д.

Так, однією з найбільш важливих задач при застосуванні кластерного аналізу в маркетингових дослідженнях є аналіз поводження споживача, а саме: групування споживачів в однорідні класи для одержання максимально повного представлення про поводження клієнта з кожної групи і про фактори, що впливають на його поведінку. Ця проблема докладно описана в роботах Клакстона, Фрая і Портіса (1974), Кіля і Лейтона (1981).

Важливим завданням, що може вирішити кластерний аналіз, є позиціювання, тобто визначення ніши, у якій варто позиціювати новий продукт, що запропонований на ринку. У результаті застосування кластерного аналізу будується карта, по якій можна визначити рівень конкуренції в різних сегментах ринку і відповідні характеристики товару для можливості попадання в цей сегмент. За допомогою аналізу такої карти можливе визначення нових, незайнятих ніш на ринку, у яких можна пропонувати існуючі товари або розробляти нові.

Кластерний аналіз також може бути зручний, наприклад, для аналізу клієнтів компанії. Для цього всі клієнти групуються в кластери, і для кожного кластера виробляється індивідуальна політика. Такий підхід дозволяє істотно скоротити об'єкти аналізу, і, у той же час, індивідуально підійти до кожної групи клієнтів.

Практика застосування кластерного аналізу в маркетингових дослідженнях

Приведемо деякі відомі статті, присвячені застосуванню кластерного аналізу для маркетингових досліджень.

В 1971 році була опублікована стаття про сегментацію клієнтів по сфері інтересів на основі даних, що характеризують переваги клієнтів.

В 1974 році була опублікована стаття Секстона (Sexton), метою якої була ідентифікація груп родин – споживачів продукту, у результаті були розроблені стратегії позиціонування бренда. Основою для досліджень були рейтинги, які респонденти привласнювали продуктам і брендам.

В 1981 році була опублікована стаття, де проводився аналіз поводження покупців нових автомобілів на основі даних факторних навантажень, отриманих при аналізі набору змінних.

Висновки

У цій лекції нами було докладно розглянуті завдання класифікації та кластеризації. Незважаючи на подібність цих задач, вирішуються вони різними способами і за допомогою різних методів. Розходження задач насамперед у вихідних даних.

Класифікація, будучи найбільш простою задачею Data Mining, відноситься до стратегії "навчання з вчителем", для її вирішення навчальна вибірка повинна містити значення як вхідних змінних, так і вихідних (цільових) змінних. Кластеризація, напроти, є задачею Data Mining, що відноситься до стратегії "навчання без вчителя", тобто не вимагає наявності значення цільових змінних у навчальній вибірці.

Завдання класифікації вирішується за допомогою різних методів, найбільш простий – лінійна регресія. Вибір методу повинен базуватися на дослідженні вихідного набору даних. Найпоширеніші методи вирішення задач кластеризації: метод k-середніх (працює тільки з числовими атрибутами), ієрархічний кластерний аналіз (працює також з символьними атрибутами), метод SOM. Складністю кластеризації є необхідність її оцінки.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]