Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КурсоваДейнега1.docx
Скачиваний:
9
Добавлен:
23.02.2016
Размер:
1.48 Mб
Скачать

3 Імпорт даних, оцінка якості, відновлення, корекція і очистка даних

Для імпортування даних у систему ми використовуємо Майстер імпорту. Особливістю Deductor Academic є те, що дані можливо завантажити лише з текстового фалу.

Рис.1 Вхідні дані у форматі Microsoft Exel

Тому для подальшої роботи з вибіркою створюємо текстовий файл за допомогою Блокнот.

Рис.2 Вхідні дані у форматі .txt

Далі запускаємо Майстер імпорту і вказуємо подальші параметри імпортування, а саме:

  • Формат вихідних даних;

  • Парамаетри імпорту файла з розмежуваннями;

  • Визначення призначення величин, тип даних, їх форма;

Рис.3 Майстер імпорту

Рис.4 Зображення даних

Рис.5 Параметри імпорту

Рис.6 Визначення призначення величин (вхідні\ вихідні\ інформаційні), тип даних (дата, ціле число, строка, тощо), їх форма (дискретна, неперервна)

Рис.7 Фрагмент зображення даних

Рис.8 Статистика

Для цього набору даних також було використано візуалізацію як одну із задач аналізу даних. На наступному рисунку було показано параметри відображення для нашої вибірки:

Рис.9 Параметри візуалізації

Рис.10 Показники, які відображаються на діаграмі

Рис.11 Показники, які відображаються на графіку

На рис.12 показано отриманий графік обсягів видобування біоресурсів для різних видів видобутку, взалежності від року видобування. Цей графік демонстує обсяг видубутку біоресурсів (відносний спад):

Рис.12

Ми бачимо тенденцію зміни об`ємів видобутку. Проте дані, які показують об`єми видобутку біоресурсів Україною у світовому океані задані не повністю і існує декілька пропусків значень в таблиці. Тому, щоб проводити подальший аналіз та згладити проміжки ми використаємо вбудований інструмент Deductur- «Заповнення пропущених даних».

Спосіб заповнення даних був взятий «Найбільш вірогідний»:

Рис.13 Заповнення даних

Рис.14 Фрагмент відновлених даних

Рис.15 Графік видобутку за відновленими даними

Ми отримали відновлені дані і тепер потрібно провести оцінку їх якості. Це робиться за допомогою вбудованого інструмента «Оцінка якості даних».

Рис.16 Оцінка якості даних

Рис.17 Результат оцінки якості

Як ми бачимо на рис.17 зараз не усі дані відповідають оцінці якості, якість даних нас не влаштовують і тому ми маємо коригувати їх за допомогою функції «Редагування викидів».

Рис.18 Редагування викидів

Рис.19 Фрагмент відредагованих даних

Після від редагування викидів знову проводимо оцінку даних для подальшої роботи з ними:

Рис.20 Результат оцінки якості, після редагування викидів

Як ми бачимо на рис.20 зараз усі дані відповідають оцінці якості, якість даних нас повністю влаштовують і ми можемо проводити досдження.

4 Дослідження видобутку біоресурсів Україною із застосуванням методів аналітичної обробки даних

4.1 Кореляційний аналіз

За допомогою кореляційного аналізу дізнаймося від чого найбільше залежить загальна кількість видобутих біоресурсів:

Рис.21 Вибір даних для кореляційного аналізу

Рис.22 Вибір значущих факторів

Рис.23 Кореляційна залежність

Як ми можемо побачити значним впливом на загальну кількість біоресурсів являє собою видобуток «У виключних (морських) економічних зонах інших держав». Також можна зазначити, що найменший вплив має видобуток біоресурсів у Світовому океані.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]