Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2488

.pdf
Скачиваний:
7
Добавлен:
07.01.2021
Размер:
12.38 Mб
Скачать

кривая в плане, горизонтальная, уклон, конец спуска, вершина подъема); сооружения и инженерные устройства (мост, эстакада, тоннель, пешеходный переход, перекресток, перегон, остановка общественного транспорта, регулируемый железнодорожный переезд с дежурным, регулируемый железнодорожный переезд без дежурного, нерегулируемый железнодорожный переезд); вид покрытия (асфальтобетон, цементобетон, щебеночный, грунтовое, иной вид покрытия); состояние проезжей части (сухое, мокрое, загрязненное, свежеуложенная поверхность, заснеженное, гололед, обработанное противогололедными материалами, иной вид покрытия); состояние погоды (ясно, пасмурно, туман, дождь, снегопад); дорожные условия, сопутствующие возникновению ДТП (неровное покрытие, дефекты покрытия, низкие сцепные качества покрытия и т.д.); командир СПДПС (фамилия); дата регистрации ДТП.

Для потока «Сведения о транспортных средствах, участвовавших в ДТП» необходимо сформировать следующие данные: № транспортного средства; транспортное средство скрылось (да, нет, задержано – 1 сутки, 1–3 суток, 3–10 суток, свыше 10 суток); тип транспортного средства; транспортное средство в розыске (да, нет); № двигателя; № кузова; № шасси; группа цвета (белый, желтый, коричневый, красный, оранжевый, фиолетовый, синий, зеленый, иной); технические неисправности; код завода-изготовителя; расположение руля и тип привода (левый, правый, передний привод, задний привод, полноприводный, иной); модель транспортного средства; код модели; год выпуска; пассажировместимость; места наибольшего повреждения; количество прицепов; регион регистрации; принадлежность (форма собственности, организационно-правовая форма); лицензия (есть, нет, неопределенно); государственный регистрационный знак; свидетельство о регистрации.

Для потока «Сведения об участниках ДТП» необходимо сформировать следующие данные: фамилия, имя, отчество; адрес места жительства; место работы; водительское удостоверение; категория участника ДТП (водитель, пассажир, пешеход, иной участник); № транспортного средства; скрылся с места ДТП (нет, да, впоследствии разыскан, не установлен); пол (мужской, женский); дата рождения (число, месяц, год); водительский стаж (количество лет); время за рулем (в часах); социальная характеристика (рабочий, служащий, военнослужащий, пенсионер, безработный, учащийся, предприниматель, сотрудники ОВД, иной); тяжесть (не пострадал, погиб, ранен); страна

121

гражданства; нарушения ПДД.

Рассмотрим выходные потоки информации, которые необходимо сформировать в данной системе. Они представлены в табл. 5.

Таблица 5

Выходные параметры ИА СППР

Наименование

Описание

Периодичность

 

 

 

Хранилище данных

Содержит всю информацию о

Ежедневная, ежегод-

 

данных, получаемых в резуль-

ная, ежемесячная

 

тате возникновения ДТП, ста-

 

 

тистическую информацию

 

 

и т.д.

 

 

 

 

Отчетность за опре-

Содержит информацию о числе

Ежедневная, ежегод-

деленный период

сформированных отчетов о

ная, ежемесячная

 

ДТП

 

 

 

 

Информация, необхо-

Содержит информацию, полу-

По запросу пользова-

димая для принятия

ченную после анализа ДТП

теля

управленческого ре-

 

 

шения

 

 

 

 

 

Для выходного потока «Отчетность за определенный период» будет характерно обобщение всей входной информации и на ее основе формирование карточки учета дорожно-транспортного происшествия. Для системы анализа и учета ДТП целесообразно использовать

Multidimensional OLAP (MOLAP), предназначенную для реализация механизма при помощи многомерной базы данных на стороне сервера.

Вследствие того, что некоторые измерения содержатся в нескольких связанных таблицах, такая схема хранилища данных носит название «снежинка». Дополнительные таблицы измерений в такой схеме, обычно соответствующие верхним уровням иерархии измерения и находящиеся в соотношении «один-ко-многим» в главной таблице измерений, соответствующей нижнему уровню иерархии, иногда называют консольными таблицами (outrigger table).

Одним из важных вопросов при разработке ИА КСППР является вопрос выбора структуры. Существует два вида структур КСППР:

122

КСППР на основе транзакционной системы обработки данных и

предметной экспертизы; КСППР с аналитической экспертизой и хра-

нилищем данных.

 

 

 

В КСППР для

анализа

и учета

ДТП как информационно-

аналитической системы необходимо включить методы анализа данных

(Data Mining). Это

говорит о необходимости использования процедур

аналитической экспертизы и создании базы оперативных данных, кото-

рые потребуются для принятия решений ЛПР. Детализированная схема

хранения информации в ИА КСППРпредставлена на рис.18.

Нормативные и

 

Оперативные

справочные дан-

 

данные

ные

 

Пользователь

 

 

 

 

Хранилище данных

БД оперативных

Витрины данных

 

данных

 

 

 

Репозиторий

Формирование

1

n

 

Хранение

метаданных

. . .

 

 

метаданных

 

m

n

 

 

. . .

 

 

 

БД аналитической информации

 

 

 

 

Система хранения

 

 

 

информации

Рис.18. Детализированная схема системы хранения информации в КСПП

На рис. 18 видно, что различные данные поступают в хранилище, из которого могут быть сформированы оперативные данные, исполь-

123

зуемые для дальнейшей обработки и анализа информации. Из храни-

лища данных можно выделить витрины данных, которые содержат

набор данных, не подвергающихся аналитической обработке, и БД

аналитической информации, где содержится анализ предыдущих ис-

следований, а также репозиторий – место хранения метаданных и

случайных ошибок работы программы.

 

Данные

Данные из БД

Оперативные

из ВД

аналитической

данные

 

информации

 

 

Информационный

Система обработки информации

анализ данных

 

 

 

Разбор данных

 

 

 

Анализируемые данные

Аналитическая экспер-

 

 

тиза

Разобранные

Подбор

Data Mining

данные

вариантов

 

Регрессия

 

 

Ассоциация

 

Правила

Трансформация

разбора

 

 

Классификация

и нормализация

 

данных

 

 

 

 

Предметная экспертиза

Таблицы

 

Деревья

 

Диаграммы

 

Результаты для

 

 

принятия решения

 

Решение

 

 

Рис. 19. Детализированная схема системы анализа информации в КСППР

Система анализа информации (рис. 19) позволит формировать отчеты с использованием математических вычислений, сравнительного анализа и многих других возможностей, которые позволяют поль-

124

зователю привести данные к желаемому виду и принять необходимое решение. Технология использования хранилищ данных позволяет принимать высокоэффективные решения, повысить качество и скорость обработки информации, при этом КСППР будет хранить исторический анализ данных в БД аналитической информации, что позволит проводить более полное моделирование и прогнозирование.

Система анализа информации позволяет формировать отчеты с использованием математических вычислений, сравнительного анализа и многих других возможностей, которые позволяют пользователю привести данные к желаемому виду.

В общем виде система поддержки принятия решений (СППР) представляет собой совокупность инструментальных средств, которые используются для манипулирования данными, их анализа и представления результатов анализа конечному пользователю. В качестве универсальной технологии анализа данных можно указать на техно-

логию Knowledge Discovery in Databases (KDD), которая включает в себя следующие этапы: подготовку данных, выбор информативных признаков, очистку данных, методы анализа данных или технологию Data Mining (DM), постобработку данных и интерпретацию полученных результатов. Данная технология представляет собой своеобразный конструктор, который позволяет в зависимости от специфики решаемой задачи выбирать наиболее подходящий алгоритм решения, методы и модели обработки данных, обнаружения новых знаний из данных больших объемов. KDD – это современная технология поиска полезных знаний в «сырых» данных. Этими знаниями могут быть правила, описывающие связи между свойствами данных (деревья решений), часто встречающиеся шаблоны (ассоциативные правила), а также результаты классификации (нейронные сети) и кластеризации данных (карты Кохонена) и т.д.

Для поддержки принятия решений в задаче учета и анализа ДТП применяются различные методы. В СибАДИ в рамках дипломного проекта была разработана ИАСППР на основе технологии хранилища данных и технологии KDD. Были решены такие задачи поддержки принятия решений, как определение травмоопасных участков дорог, определение вероятности наступления дорожно-транспортного происшествия при заданном наборе параметров и другие задачи. Для

125

решения первой задачи используется метод анализа с использованием самоорганизующихся карт Кохонена. Данный метод позволяет провести сегментацию всех участков дороги относительно объекта исследования, определить правила отнесения определенного травмоопасного участка с полученными сегментами, осуществить анализ карт Кохонена и на их основе построить деревья решений, тем самым ответить на вопрос «что будет, если». Метод анализа с использованием самоорганизующихся карт Кохонена позволяет автоматизировать все действия по поиску закономерностей. В данном случае объектами рассмотрения будут травмоопасные участки некоторого района.

Для того чтобы классифицировать и определить травмоопасные участки, необходимо:

-провести сегментацию всей участков трассы вокруг района с помощью карты Кохонена;

-определить правила отнесения определенного травмоопасного участка с полученными сегментами;

-проанализировать карты Кохонена и построить на их основе дерево решений.

В данном примере карты Кохонена имеют несколько признаков, таких как:

а) расстояние; б) категория дороги; в) код дороги.

Полученная карта обладает следующим свойством – узлы ее расположены таким образом, что объектам, похожим между собой, соответствуют соседние узлы карты. Для того чтобы определить, какие объекты попали в какие узлы карты, необходимо определить ближайший к нему узел. В результате всех этих операций объекты со схожими параметрами попадут в один узел или в соседние узлы. На рис. 20 представлена карта Кохонена, при рассмотрении которой можно сделать вывод, что некоторые просегментированные области можно объединить вследствие близостик определенным узлам.

Далее для получения правил отнесения клиентов к этим сегментам воспользуемся деревом решений (рис. 21). Дерево принятия решений – это дерево, на ребрах которого записаны атрибуты, от которых зависит целевая функция, в листьях записаны значения целевой функции, а в остальных узлах – атрибуты, по которым различаются случаи. Входными для дерева решений будут те же характеристики, а выходным – номер кластера.

126

Рис. 20. Сегментация травмоопасных участков в районе

Рис. 21. Правила отнесения к сегменту

Для определения вероятности наступления дорожно-транс- портного происшествия при заданном наборе параметров используется логистическая регрессия, для построения прогнозных решений применяется порядковая, классическая регрессия и другие методы. В

127

настоящее время КСППР «Анализ и учет ДТП» проходит стадию опытной эксплуатации. В дальнейшем планируется внедрение системы в районное ГИБДД.

Для анализа соотнесения пунктов ПДД и схем ДТП целесообразно воспользоваться деревьями решений с целью классификации данных. На рис. 22 представлено дерево решений соотнесения пунктов ПДД со схемами ДТП.

Рис. 22. Дерево решений соотнесения пунктов ПДД со схемами ДТП

Из дерева решений видно, что важнейшими показателями, не зависящими от времени, являются нарушения ПДД и схема ДТП. Можно сказать, что схема ДТП формируется из основных нарушений ПДД, таких как:

а) несоблюдение очередности проезда; б) выезд на полосу встречного движения;

в) несоответствие скорости конкретным условиям; г) управлениетехническимсредством(ТС) внетрезвом состоянии; д) превышение скорости.

Решение задачи классификации является одним из важнейших применений нейронных сетей. Задача классификации представляет собой задачу отнесения образца к одному из нескольких попарно не пересекающихся множеств.

Для построения классификатора необходимо определить, какие

128

параметры влияют на принятие решения о том, к какому классу принадлежит образец. При этом могут возникнуть две проблемы. Вопервых, если количество параметров мало, то может возникнуть ситуация, при которой один и тот же набор исходных данных соответствует примерам, находящимся в разных классах. Тогда невозможно обучить нейронную сеть, и система не будет корректно работать (невозможно найти минимум, который соответствует такому набору исходных данных). Исходные данные обязательно должны быть непротиворечивы. Для решения этой проблемы необходимо увеличить размерность пространства признаков (количество компонент входного вектора, соответствующего образцу). Но при увеличении размерности пространства признаков может возникнуть ситуация, когда число примеров может стать недостаточным для обучения сети, и она вместо обобщения просто запомнит примеры из обучающей выборки и не сможет корректно функционировать. Таким образом, при определении признаков необходимо найти компромисс с их количеством.

Далее необходимо определить способ представления входных данных для нейронной сети, т.е. определить способ нормирования. Нормировка необходима, поскольку нейронные сети работают с данными, представленными числами в диапазоне 0...1, а исходные данные могут иметь произвольный диапазон или вообще быть нечисловыми данными. При этом возможны различные способы, начиная от простого линейного преобразования в требуемый диапазон и заканчивая многомерным анализом параметров и нелинейной нормировкой в зависимости от влияния параметров друг на друга.

На рис. 23 представлен граф нейронной сети, который показывает наиболее травмоопасный участок дороги, выходами которой являются конкретный участок дороги, вид ДТП и его схема.

Данная нейронная сеть позволяет выделить ряд факторов и изучить их влияние на определенном участке дорожного полотна. В качестве примера рассмотрим таблицы «Что - Если» как один из вариантов выходов нейронной сети и проанализируем их графические интерпретации. Рассмотрим ситуацию, представленную на рис. 24.

129

Расстояние

 

 

 

Категория дороги

 

 

 

 

 

 

 

Вид покрытия

 

Состояние пр. части

 

 

Освещение

 

Дорога

 

 

Состояние погоды_0

 

 

Состояние погоды_1

 

 

Нарушение ПДД_0

 

 

НарушениеПДД_1

 

 

Нарушение ПДД_

2

 

Вид ДТП

Схема ДТП_0

 

 

 

 

Схема ДТП_1

 

 

Схема ДТП_2

 

 

Схема ДТП_3

 

 

 

 

 

 

Рис. 23. Нейронная сеть для определения мер факторов, оказывающих наибольшее влияние на возникновение ДТП на определенном участке Любинского района

Рис. 24. Пример данных для анализа нейронной сети

Проанализируем зависимости факторов на основе графиков входных и выходных функций на основе нейронной сети (рис. 25).

При рассмотрении графика зависимости можно сказать, что для такого ДТП, как столкновение ТС на различных участках изучаемого района, преимущественное значение имеет вид покрытия асфальтобетон.

При рассмотрении данного графика можно также сделать вывод, что ДТП данного вида происходит преимущественно в светлое время суток (рис. 26).

130

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]