Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Управление информационными рисками – Т. Ю. Зырянова, А. А. Захаров, Ю. И. Ялышев (2008)

.pdf
Скачиваний:
98
Добавлен:
23.03.2016
Размер:
12.57 Mб
Скачать

ственного и количественного подхода сочетают в себе методики CRAMM

èГРИФ. На рис. 4.2 приведено соотношение между типом критериев

èвидом шкал оценки рисков в существующих методиках.

Ðèñ. 4.2. Соотношение типов критериев и шкал в существующих методиках анализа информационных рисков

Рассмотренное выше ПО процесса УИР отвечает следующим требованиям:

поддержка всего жизненного цикла управления рисками (планирование управления рисками, идентификация, анализ, планирование реагирования, мониторинг и контроль);

поддержка анализа всех составляющих риска (стоимостной, временной, ресурсной);

поддержка различных методов расчета и моделирования;

широкие графические возможности и автоматическая генерация отчетов;

документирование и поддержка базы данных по рискам. Также необходимо отметить, что конкретную методику проведе-

ния анализа рисков на предприятии и инструментальные средства, поддерживающие ее, нужно выбирать, учитывая следующие факторы:

151

наличие экспертов, способных дать достоверные оценки объема потерь от угроз информационной безопасности;

наличие на предприятии достоверной статистики по инцидентам в сфере информационной безопасности;

наличие необходимости в точной количественной оценке последствий реализации угроз (либо достаточно оценки на качественном уровне).

Итак, инструментальные средства анализа рисков, основанные на современных базах знаний и процедурах логического вывода, позволяют построить структурные и объектно-ориентированные модели информационных активов предприятия, модели угроз и модели рисков. Таким образом, можно выявить такие информационные активы предприятия, риск нарушения защищенности которых является крити- ческим, то есть неприемлемым.

Такие инструментальные средства предоставляют возможность построить различные модели защиты информационных активов предприятия, сравнивать между собой по критерию «эффективность-сто- имость» различные варианты комплексов мер защиты и контроля, а также вести мониторинг выполнения требований по организации режима информационной безопасности отечественного предприятия.

4.2.Статистические методы анализа информационных рисков

На рис. 4.2 видно, что практически незанятым остается пространство методик, основанных на объективных критериях оценки информационных рисков. Если принять во внимание справедливое предположение о том, что информационный риск формируется под воздействием множества факторов самого различного характера (от технических до социально-психологических), становится обоснованным применение для анализа рисков методов теории вероятностей и математической статистики. Примерами таких методов могут быть два: метод корреляционно-регрессионного анализа и метод анализа временных рядов.

4.2.1. Метод корреляционно-регрессионного анализа

Изучение всевозможных объектов и процессов, в том числе информационных, предполагает наблюдение над системами случайных величин. Вследствие этого возникает задача установления взаимосвя-

152

зей между ними. Эту задачу решают методы корреляционно-регресси- онного анализа. Метод корреляционного анализа применяется для оценки существенности влияния одной случайной величины на другую и установления зависимости между случайными величинами.

Задача корреляционно-регрессионного анализа

Задача корреляционно-регрессионного анализа состоит в определении вида зависимостей в системе данных.

Далее будем рассматривать две переменных. Переменная X называется независимой переменной, èëè предиктором, èëè регрессором. Переменная Y носит название зависимой переменной, èëè отклика.

Методы корреляционно-регрессионного анализа могут применяться для анализа данных, обладающих следующими свойствами:

1)известен вид функциональной составляющей зависимости Y = f(X);

2)значения независимых переменных заданы без ошибок;

3)остатки Yi – yi имеют нормальное распределение;

4)если независимых переменных несколько, то они некоррелиро-

âàíû;

5)последовательные значения переменных и остатков некоррелированы.

Математические основы корреляционно-регрессионного анализа

Предположим, что случайная величина Y каким-то образом зависит от X. Эта зависимость имеет две составляющих.

Функциональная составляющая — зависимость, которую можно выразить функцией y = f(x), ãäå x, y — значения переменных X, Y. Эта составляющая связана с истинной зависимостью X è Y и обусловлена тем, что при изменении одной случайной величины изменяется и другая.

Но мы имеем дело со случайными величинами, значения которых нельзя точно предсказать до проведения исследований, учитыващих и другую составляющую взаимосвязи — случайную составляющую. Она обусловлена тем, что, кроме X, íà Y оказывают влияние и другие факторы, поведение которых мы предсказать не можем.

Если во взаимосвязи случайных величин отсутствует первая составляющая, то зависимости Y îò X нет. Если отсутствует вторая, то Y зависит от X функционально.

153

Функциональная зависимость может быть разнообразного характера. Примеры приведены на рис. 4.3.

Ðèñ. 4.3. Виды зависимости случайных величин

Теснота зависимости между случайными величинами X è Y измеряется с помощью моментов.

Начальным моментом порядка s, h системы случайных величин называется величина:

,

ãäå M — математическое ожидание.

Центральным моментом порядка s, h системы случайных вели- чин называется величина:

, ãäå .

154

Основным моментом порядка s, h системы случайных величин называется величина:

ãäå — средние квадратичные отклонения случайных величин

X è Y.

Частными случаями моментов являются:

первые центральные моменты:

;

вторые центральные моменты:

второй смешанный центральный момент:

Этот момент называется корреляционным моментом системы случайных величин.

Наконец, основной момент порядка s = 1, h = 1:

,

называется коэффициентом линейной корреляции. Для системы дискретных случайных величин он вычисляется как:

155

Коэффициент линейной корреляции изменяется от 0 до 1 и выражает тесноту линейной зависимости между случайными величинами. Если зависимости между случайными величинами нет, то rXY = 0. Если зависимость Y îò X линейная, то rXY = 1.

Если система содержит более двух случайных величин, рассматривают также частные корреляции — это корреляции между парами случайных величин при отсутствии влияния остальных. Рассмотрим систему трех случайных величин: X, Y, Z.

1.Вычислим коэффициент частной корреляции rXY (в формуле для вычисления коэффициента корреляции отсутствует случайная вели- чина Z, следовательно, ее влияние не учитывается).

2.Вычислим коэффициент частной корреляции rXZ (без учета влияния Y).

3.Вычислим коэффициент частной корреляции rXZ (без учета влияния X).

4.Вычислим коэффициент полной корреляции по формуле:

 

 

 

.

 

 

 

 

 

 

 

5. Делаем вывод о характере зависимости в системе:

— åñëè

, то взаимосвязь между случайными величина-

ìè X è Y частично возникает под воздействием Z;

— åñëè

, òî Z не влияет на взаимосвязь между случайны-

ми величинами X è Y;

— åñëè

, òî Z ослабляет взаимосвязь между случайны-

ми величинами X è Y.

Следует отметить, что коэффициент корреляции не определяет причинно-следственную связь между случайными величинами.

Условным математическим ожиданием дискретной случайной величины Y ïðè X = x, ãäå x — определенное возможное значение X, называется произведение возможных значений Y на их условные вероятности:

.

Условное математическое ожидание M(Y¦x) есть функция от x:

156

M(Y¦x) = f(x),

которую называют функцией регрессии Y íà X.

Если мы будем рассматривать случайную выборку и заменим условное математическое на условное выборочное среднее (среднее арифметическое наблюдавшихся значений Y, соответствующих X = x), то получим выборочное уравнение регрессии:

ãäå

 

 

,

 

 

 

— выборочная функция регрессии.

 

 

Описание модели корреляционно-регрессионного анализа

 

Будем обозначать значение независимой переменной X â i-том опыте

xi, yi — соответствующее значение зависимой переменной

.

 

Рассмотрим самую простую регрессионную модель — линейную.

 

Пусть наблюдаемые величины связаны зависимостью вида:

 

 

,

(4.2)

ãäå B1, B0 — неизвестные константы, — ошибка наблюдения. Задача состоит в том, чтобы по наблюдениям (x1, y1), (x2, y2), …, (xn,

yn) построить зависимость (4.2), то есть оценить константы B1, B0 íàè-

лучшим образом.

Математическое решение задачи корреляционнорегрессионного анализа

Задача наилучшего оценивания параметров B1, B0 в регрессионной модели (4.2) решается методом наименьших квадратов, который состоит в том, чтобы провести на плоскости (X, Y) прямую, проходящую как можно ближе к точкам (x1, y1), (x2, y2), …, (xn, yn) (ðèñ. 4.4).

Ðèñ. 4.4. Прямая, подобранная по методу наименьших квадратов

157

1.Отмечаем на плоскости (X, Y) точки (x1, y1), (x2, y2), …, (xn, yn) и проводим прямую, наиболее близкую к ним всем.

2.Назовем разность Yi – yi отклонением и построим функцию F параметров B1, B0 как сумму квадратов отклонений:

.

3.Для отыскания минимума функции F(B1, B0) приравняем к нулю

ååчастные производные:

.

(4.3)

4. Решим систему уравнений (4.3) относительно переменных B1, B0:

;

.

Выполняя элементарные преобразования, получаем:

;

.

Решив эту систему, найдем искомые параметры:

;

.

158

Оценка адекватности построенной модели

После решения задачи регрессионного анализа необходимо оценить адекватность построенной модели, то есть пригодность ее к построению прогноза. Рассмотрим рис. 4.5.

Ðèñ. 4.5. Оценка адекватности регрессионной модели

Этот рисунок повторяет рис. 4.4, но на нем дополнительно отме- чена точка — среднее значение Y.

Рассмотрим расстояния между точками è , è , è . Эти расстояния равны соответственно ,

, . Мы можем записать:

.

Возведя обе части равенства в квадрат, получим:

.

Просуммируем по всем i îò 1 äî n:

.

159

Значения в скобках могут быть как положительными, так и отрицательными. Так как мы имеем дело со случайными величинами, положительные и отрицательные значения будут компенсировать друг друга. Поэтому можно считать, что вторая сумма в правой части равна нулю:

.

Сумма в левой части называется суммой квадратов отклонений Y от среднего (SS).

Сумма

 

называется суммой квадратов отклонений

 

предсказанных Y от среднего (SSPr).

Сумма

 

называется суммой квадратов остатков

 

(SSRes).

Отношение

 

называется коэффициентом детерми-

 

нации. Он и характеризует адекватность построенной регрессионной модели. Для пригодной к прогнозированию модели этот коэффициент должен быть близок к 1.

В заключении перечислим основные этапы анализа зависимостей случайных величин:

1.Исходя из условия задачи делается вывод о том, какая переменная является независимой, а какая изменяется при изменении первой.

2.Оценивается теснота линейной зависимости при помощи коэффициента линейной корреляции.

3.Точки (xi, yi) наносятся на диаграмму рассеяния. Удаляются точки выбросов.

4.Если связь предполагается линейной, записывается уравнение регрессии в виде Y = AX + B .

5.Коэффициенты уравнения регрессии вычисляются с помощью метода наименьших квадратов.

6.С помощью коэффициента детерминации оценивается адекватность модели.

160