Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
3
Добавлен:
16.03.2016
Размер:
87.42 Кб
Скачать

ОБ ЭФФЕКТИВНОСТИ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В ЗАДАЧАХ ИССЛЕДОВАНИЯ ЗЕМНОЙ АТМОСФЕРЫ1

Я.С. Полонская, студент, А.В. Скороход, студент Научный руководитель - Е.С. Семенкин, д.т.н., профессор

Сибирский государственный аэрокосмический университет имени академика М.Ф. Решетнева

Россия, 660014, г. Красноярск, пр. имени газеты «Красноярский рабочий», 31. E-mail:SkorokhodAV@yandex.ru , yanapolonskaya1413@yandex.ru

За последний век земное воздушное пространство стало невероятно важной частью жизни человечества. Изучение, освоение и завоевание атмосферы представляет большой научно-практический интерес. Атмосфера имеет как биологическое значение, к примеру, влияние атмосферного давления или процентного содержание веществ на жизнедеятельность флоры и фауны Земли, так и научно-техническое значение. Воздушно-транспортное сообщение, космические полеты, передача радиосигналов, метеопрогнозы, все это не представляется возможным без изучения атмосферы.

Но так же, как неоспоримо влияние атмосферы на жизнь на Земле, так и неоспоримо влияние процессов, происходящих на земной поверхности, на атмосферу. К примеру, при движении тектонических плит, землетрясениях, часто происходит подъем лавовых масс, что приводит к выделению в атмосферу вулканических газов. Это так же влияет на химический состав атмосферы в определенных регионах.

Для проведения исследования были взяты четыре базы данных [1]. Первая из них, Ionosphere, соответствует задаче классификации высокочастотных радарных сигналов, возвращаемых из ионосферы. Создателями второй базы данных, Ozone Level Detection, решалась задача обнаружения озоновых дыр на основе метеорологических показателей, таких как температура, скорость ветра, давление, относительная влажность и т.д., в разное время в течение дня. Далее была взята база Seismic-bumps о прогнозировании сейсмических толчков, так как это важнейшее мероприятие в системе контроля сейсмической обстановки, позволяющее своевременно принять меры к защите населения и территорий, резко снизить затраты на ликвидацию последствий землетрясений. В четвертой базе MAGIC Gamma Telescope поставлена задача регистрации гамма - частиц с высокой энергией в атмосфере при помощи гамма телескопа.

Для решения поставленной задачи были созданы процессы в платформе программной системы RapidMiner [2]. Процесс проверки гипотезы о различии средних для двух выборок для данных векторов производительности использованных методов с помощью оператора T-test по t-критерию Стьюдента (для обучения каждой технологии системы был использован метод перекрестной проверки (CrossValidation)), процесс оптимизации классификационных моделей с оператором OptimizeParameters и ансамбль методов при помощи оператора Vote (в этих процессах для обучения каждой технологии системы был использован метод (SplitData)) [2]. В качестве методов анализа данных для обоих наборов данных были выбраны следующие алгоритмы: искусственная нейронная сеть (ANN), индукция правил (RI), метод k ближайших

1 Работа выполнена в рамках и при финансовой поддержке проекта RFMEFI57414X0037

соседей (k-NN), дерево решений (DT),наивный Байесовский классификатор (NB), случайный лес (RF), логистическая регрессия (LR), метод опорных векторов (SVM).

Для первого набора данных Ionosphere лучшие результаты показали методы DT - 92.88% и NN - 91.84%. После оптимизации параметров, которая улучшила показатели всех методов, лучший результат было получен нейронной сетью NN - 98.21%. Применение ансамблей привело к ухудшению результатов. Для набора данных Seismicbumps лучшие результаты показали DT - 92.8%, RI - 91.23%, NN - 92,6%, LR - 92.33%. Оптимизация параметров также дала улучшение для всех методов, а лучший результат продемонстрировали RI - 93,53% и LR - 93.67%. Ансамбль из лучших четырех методов не привел к улучшению результатов. Задача классификации гамма-лучей (MAGIC Gamma Telescope) была решена с наивысшей точностью (93.75%) ансамблем методов. Ни один из используемых методов, даже с применением оптимизации настроек, не позволяет построить достаточно эффективные системы классификации гамма-лучей. Задача поиска озоновых дыр не была решена с необходимою точностью. Наивысшую точность показал метод DT (60.67%) с оптимизированными настройками параметров, что не достаточно для эффективной работы системы. Ансамбль не позволяет построить достаточно эффективную классификационную систему.

Не во всех случаях удалось создать процесс, который можно было применить на практике в организациях, решающих задачи в изучаемых областях. Исходя из этого, можно сделать вывод, что использование универсальной системы интеллектуального анализа данных RapidMiner, хотя и удобно конечному пользователю, не являющемуся экспертом-аналитиком, не во всех случаях позволяет получать требуемые результаты. Для существенного повышения эффективности использования интеллектуальных технологий анализа данных при решении реальных задач необходим переход к более мощным методам, основанным на специальных эволюционных алгоритмах [3, 4] автоматизированного проектирования таких технологий [5, 6].

Список литературы:

1.UCI Machine Learning repository URL: http://archive.ics.uci.edu/ml/datasets (дата обращения: 22.09.2015).

2.RapidMiner [Электронный ресурс]. URL: https://rapidminer.com/ (дата обращения: 11.09.2015).

3.Ахмедова Ш.А., Семенкин Е.С. Новый коллективный метод оптимизации на основе кооперации бионических алгоритмов // Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева. 2013.

4 (50). С. 92-99.

4.Semenkin E., Semenkina M. Self-configuring genetic algorithm with modified uniform crossover operator // Lecture Notes in Computer Science. 2012. Т. 7331 LNCS. № PART 1. С. 414-421.

5.Stanovov V.V., Semenkin E.S. Self-adjusted evolutionary algorithms based approach for automated design of fuzzy logic systems // Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева. 2013.

4 (50). С. 148-152.

6.Brester Ch.Yu., Semenkin E.S. Development of adaptive genetic algorithms for neural network models multicriteria design // Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева. 2013. № 4 (50). С. 99103.

Соседние файлы в папке 3-Prikladnye-informacionnye-tehnologii