У цій лекції ми докладно зупинимося на задачах прогнозування і візуалізації.
1. Задача прогнозування
Задачі прогнозування розв’язуються в найрізноманітніших областях людської діяльності, таких як наука, економіка, виробництво і в багатьох інших сферах. Прогнозування є важливим елементом організації керування як окремими господарюючими суб'єктами, так і економіки в цілому.
Розвиток методів прогнозування безпосередньо пов'язане з розвитком інформаційних технологій, зокрема, з ростом обсягів збережених даних і ускладненням методів та алгоритмів прогнозування, реалізованих в інструментах Data Mining.
Задача прогнозування, може вважатися однієї з найбільш складних задач Data Mining, вона вимагає ретельного дослідження вихідного набору даних і методів, що підходять для аналізу.
Прогнозування (від грецького Prognosis), у широкому розумінні цього слова, визначається як випереджальне відбиття майбутнього. Метою прогнозування є передбачення майбутніх подій.
Прогнозування (forecasting) є однією з задач Data Mining і одночасно одним з ключових моментів при прийнятті рішень.
Прогностика (prognostics) – теорія і практика прогнозування.
Прогнозування спрямоване на визначення тенденцій динаміки конкретного об'єкта або події на основі ретроспективних даних, тобто аналізу його стану колись і тепер. Таким чином, вирішення задачі прогнозування вимагає деякої навчальної вибірки даних.
Прогнозування – встановлення функціональної залежності між залежними і незалежними змінними.
Прогнозування є розповсюдженою і затребуваною задачею у багатьох областях людської діяльності. У результаті прогнозування зменшується ризик прийняття невірних, необґрунтованих або суб'єктивних рішень.
Приклади його задач: прогноз руху грошових коштів, прогнозування врожайності агрокультури, прогнозування фінансової стійкості підприємства.
Типовою в сфері маркетингу є задача прогнозування ринків (market forecasting). В результаті вирішення даної задачі оцінюються перспективи розвитку кон'юнктури певного ринку, зміни ринкових умов на майбутні періоди, визначаються тенденції ринку (структурні зміни, потреби покупців, зміни цін).
Звичайно в цій області вирішуються наступні практичні завдання:
прогноз продажу товарів (наприклад, з метою визначення норми товарного запасу);
прогнозування продажу товарів, що роблять вплив один на одного;
прогноз продажу залежно від зовнішніх факторів.
Крім економічної і фінансової сфери, задачі прогнозування ставляться в найрізноманітніших областях: медицині, фармакології; популярним зараз стає політичне прогнозування.
Загалом вирішення задачі прогнозування зводиться до вирішення таких підзадач:
вибір моделі прогнозування;
аналіз адекватності і точності побудованого прогнозу.
Порівняння задач прогнозування і класифікації
У попередній лекції нами було розглянута задача класифікації. Прогнозування подібно з задачею класифікації.
Багато методів Data Mining використовуються для вирішення задач класифікації і прогнозування. Це, наприклад, лінійна регресія, нейронні мережі, дерева рішень (які іноді так і називають – дерева прогнозування і класифікації).
Задачі класифікації і прогнозування мають подібності і розходження.
Так у чому ж подібність задач прогнозування і класифікації? При вирішенні обох задач використовується двоетапний процес побудови моделі на основі навчального набору і його використання для передбачення невідомих значень залежної змінної.
Розходження задач класифікації і прогнозування полягає в тому, що в першій задачі передбачається клас залежної змінної, а в другій – числові значення залежної змінної, пропущені або невідомі (що відносяться до майбутнього).
Повертаючись до прикладу про туристичне агентство, розглянутого в попередній лекції, ми можемо сказати, що визначення класу клієнта є вирішенням задачі класифікації, а прогнозування доходу, що принесе цей клієнт наступного року, буде вирішенням задачі прогнозування.