Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекція7.doc
Скачиваний:
12
Добавлен:
09.08.2019
Размер:
101.38 Кб
Скачать

У лекції розглянуті основні сфери діяльності людини, де може успішно застосовуватися технологія Data Mining. Вводяться поняття Web Mining, Text Mining, Call Mining.

У попередніх лекціях ми розглянули задачі і методи Data Mining. Однак вступна частина не буде повною, якщо не розглянути, для яких конкретних задач і у яких сферах життєдіяльності людини можна використовувати цю технологію. Варто відразу сказати, що область використання Data Mining нічим не обмежена – вона повсюди, де є які-небудь дані. У цій лекції ми розглянемо будь-які сфери застосування Data Mining.

Ціль цього огляду є не перерахування абсолютно всіх сфер застосування, а знайомство з тими напрямками, де Data Mining працює і дає реальні результати.

В [16] виділені два напрямки застосування систем Data Mining: як масового продукту і як інструмента для проведення унікальних досліджень.

Слід зазначити, що на сьогоднішній день найбільше поширення технологія Data Mining одержала при вирішенні бізнес-завдань. Можливо, причина в тому, що саме в цьому напрямі віддача від використання інструментів Data Mining може складати, по деяких джерелах, до 1000% і витрати на її впровадження можуть досить швидко окупитися.

В даний час технологія Data Mining використовується практично у всіх сферах діяльності людини, де накопичені ретроспективні дані.

Ми будемо розглядати чотири основні сфери застосування технології Data Mining докладно [22, 27]: наука, бізнес, дослідження для уряду і Web-напрямок.

  • Застосування Data Mining для вирішення бізнес-задач. Основні напрямки: банківська справа, фінанси, страхування, CRM, виробництво, телекомунікації, електронна комерція, маркетинг, фондовий ринок та інші.

  • Застосування Data Mining для вирішення задач державного рівня. Основні напрямки: пошук осіб, що ухиляються від податків; засобу в боротьбі з тероризмом.

  • Застосування Data Mining для наукових досліджень. Основні напрямки: медицина, біологія, молекулярна генетика і генна інженерія, біоінформатика, астрономія, прикладна хімія, дослідження, що стосуються наркотичної залежності, і інших.

  • Застосування Data Mining для вирішення Web-задач. Основні напрямки: пошукові машини (search engines), лічильники і інших.

2. Застосування Data Mining для вирішення бізнес-задач

Банківська справа

Технологія Data Mining використовується в банківській сфері для вирішення ряду типових завдань.

Задача "Чи видавати кредит клієнтові?"

Класичний приклад застосування Data Mining у банківській справі – вирішення задачі визначення можливої некредитоздатності клієнта банку. Цю задачу також називають аналізом кредитоспроможності клієнта або "Чи видавати кредит клієнтові?".

Без застосування технології Data Mining задача вирішується співробітниками банківської установи на основі їх досвіду, інтуїції і суб'єктивних понять про те, який клієнт є благонадійним. За схожою схемою працюють системи підтримки прийняття рішень і на основі методів Data Mining. Такі системи на основі історичної (ретроспективної) інформації та за допомогою методів класифікації виявляють клієнтів, які в минулому не повернули кредит.

Задача "Чи видавати кредит клієнтові?" за допомогою методів Data Mining вирішується в такий спосіб. Сукупність клієнтів банку розбивається на два класи (повернули та не повернули кредит); на основі групи клієнтів, що не повернули кредит, визначаються основні "риси" потенційного неплатника; при надходженні інформації про нового клієнта визначається його клас ("поверне кредит", "не поверне кредит").

Задача залучення нових клієнтів банку.

За допомогою інструментів Data Mining можливо провести класифікацію на "більш вигідних" і "менш вигідних" клієнтів. Після визначення найбільш вигідного сегменту клієнтів банку є сенс проводити більш активну маркетингову політику по залученню клієнтів саме серед знайденої групи.

Інші задачі сегментації клієнтів.

Розбиваючи клієнтів за допомогою інструментів Data Mining на різні групи, банк має можливість зробити свою маркетингову політику більш цілеспрямованою, а тому – ефективною, пропонуючи різним групам клієнтів саме ті види послуг, яких вони потребують.

Задача керування ліквідністю банку. Прогнозування залишку на рахунках клієнтів.

Проводячи прогнозування часового ряду з інформацією про залишки на рахунках клієнтів за попередні періоди, застосовуючи методи Data Mining, можна одержати прогноз залишку на рахунках у певні майбутні моменти. Отримані результати можуть бути використані для оцінки і керування ліквідністю банку.

Задача виявлення випадків шахрайства з кредитними картками.

Для виявлення підозрілих операцій з кредитними картками застосовуються так названі "підозрілі стереотипи поводження", що визначаються в результаті аналізу банківських транзакцій, які згодом виявилися шахрайськими. Для визначення підозрілих випадків використовується сукупність послідовних операцій на певному часовому інтервалі. Якщо система Data Mining вважає чергову операцію підозрілою, банківський працівник може, орієнтуючись на цю інформацію, заблокувати операцію з певною карткою.

Страхування

Страховий бізнес пов'язаний з певним ризиком. Тут задачі, що розв'язуються за допомогою Data Mining, подібні з задачами в банківській справі.

Інформація, отримана в результаті сегментації клієнтів на групи, використовується для визначення груп клієнтів. У результаті страхова компанія може з найбільшим зиском і найменшим ризиком пропонувати певні групи послуг конкретним групам клієнтів.

Задача виявлення шахрайства вирішується шляхом знаходження якогось загального стереотипу поводження клієнтів-шахраїв.

Телекомунікації

У сфері телекомунікації досягнення Data Mining можуть використовуватися для вирішення задач, типових для будь-яких компаній, що працюють з метою залучення постійних клієнтів, – визначення лояльності цих клієнтів. Необхідність вирішення таких задач обумовлена твердою конкуренцією на ринку телекомунікації і постійною міграцією клієнтів від однієї компанії в іншу. Як відомо, втримання клієнта набагато дешевше його повернення. Тому виникає необхідність виявлення певних груп клієнтів і розробка набору послуг, які найбільш привабливі саме для них. У цій сфері, так само як і у багатьох інших, важливим завданням є виявлення фактів шахрайства.

Крім таких задач, що є типовими для багатьох областей діяльності, існує група задач, що обумовлені специфікою сфери телекомунікації.

Електронна комерція

У сфері електронної комерції Data Mining застосовується для формування рекомендаційних систем і вирішення задач класифікації відвідувачів Web-сайтів. Така класифікація дозволяє компаніям виявляти певні групи клієнтів і проводити маркетингову політику відповідно до виявлених інтересів і потреб клієнтів. Технологія Data Mining для електронної комерції тісно пов'язана з технологією Web Mining [28].

Промислове виробництво

Особливості промислового виробництва і технологічних процесів створюють гарні передумови для можливості використання технології Data Mining у ході вирішення різних виробничих задач. Технічний процес по своїй природі повинен бути контрольованим, а всі його відхилення перебувають у заздалегідь відомих межах; тобто, тут ми можемо говорити про певну стабільність, що звичайно не властива більшості задач, що стоять перед технологією Data Mining.

Основні задачі Data Mining у промисловому виробництві [29]:

  • комплексний системний аналіз виробничих ситуацій;

  • короткостроковий і довгостроковий прогноз розвитку виробничих ситуацій;

  • вироблення варіантів оптимізаційних рішень;

  • прогнозування якості виробу залежно від деяких параметрів технологічного процесу;

  • виявлення схованих тенденцій і закономірностей розвитку виробничих процесів;

  • прогнозування закономірностей розвитку виробничих процесів;

  • виявлення схованих факторів впливу;

  • виявлення та ідентифікація раніше невідомих взаємозв'язків між виробничими параметрами і факторами впливу;

  • аналіз середовища взаємодії виробничих процесів і прогнозування зміни її характеристик;

  • вироблення оптимізаційних рекомендацій з керування виробничими процесами;

  • візуалізацію результатів аналізу, підготовку попередніх звітів і проектів допустимих рішень з оцінками імовірності та ефективності можливих реалізацій.

Маркетинг

У сфері маркетингу Data Mining знаходить дуже широке застосування.

Основні питання маркетингу "Що продається?", "Як продається?", "Хто є споживачем?"

У лекції, присвяченій задачам класифікації і кластеризації, докладно описане використання кластерного аналізу для вирішення задач маркетингу, як, наприклад, сегментація споживачів.

Інший розповсюджений набір методів для вирішення задач маркетингу – методи і алгоритми пошуку асоціативних правил.

Також успішно тут використовується пошук тимчасових закономірностей.

Роздрібна торгівля

У сфері роздрібної торгівлі, як і у маркетингу, застосовуються:

  • алгоритми пошуку асоціативних правил (для визначення набору товарів, що часто зустрічаються, які покупці купують одночасно). Виявлення таких правил допомагає розміщати товари на прилавках торговельних залів, виробляти стратегії закупівлі товарів та їх розміщення на складах і т.д.

  • використання часових послідовностей, наприклад, для визначення необхідних обсягів запасів товарів на складі.

  • методи класифікації і кластеризації для визначення груп або категорій клієнтів, знання яких сприяє успішному просуванню товарів.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]