- •Министерство образования и науки россии
- •Цели и постановка задач
- •Глава 1. Описание предметной области. Обзор математических моделей.
- •Описание предметной области
- •Обзор математических моделей банка
- •2.2. Модели управления портфелем активов
- •Глава 2. Идентификация закона распределения
- •Определение закона распределения и его характеристик
- •Проверка гипотезы об экспоненциальном распределении
- •3. Оценка по критерию согласия χ2
- •Функциональные характеристики стационарных систем обслуживания
- •Глава 3. Анализ статистических данных о поступлении заявок на получение кредита по дням недели и в течение дня по часам.
- •Глава 4. Построение имитационной модели
- •Описание модели
- •Алгоритм
- •Расчет характеристик смо
- •Заключение
- •Список литературы
3. Оценка по критерию согласия χ2
Критерий согласия χ2 (критерий Пиросона) применяют для проверки гипотезы о соответствии эмпирического распределения предполагаемому теоретическому распределению F(x) при большом объеме выборки (n ≥ 100). Критерий применим для любых видов функции F(x), даже при неизвестных значениях их параметров, что обычно имеет место при анализе результатов механических испытаний. В этом заключается его универсальность.
Использование критерия χ2 предусматривает разбиение размаха варьирования выборки на интервалы и определения числа наблюдений (частоты) nj для каждого из e интервалов. Для удобства оценок параметров распределения интервалы выбирают одинаковой длины.
Интервалы, содержащие менее пяти наблюдений, объединяют с соседними. Однако, если число таких интервалов составляет менее 20 % от их общего количества, допускаются интервалы с частотой nj ≥ 2.
Статистикой критерия Пирсона служит величина
(6) где pj - вероятность попадания изучаемой случайной величины в j-и интервал, вычисляемая в соответствии с гипотетическим законом распределением F(x). При вычислении вероятности pj нужно иметь в виду, что левая граница первого интервала и правая последнего должны совпадать с границами области возможных значений случайной величины. Например, при нормальном распределении первый интервал простирается до -∞, а последний - до +∞.
Нулевую гипотезу о соответствии выборочного распределения теоретическому закону F(x) проверяют путем сравнения вычисленной по формуле (1) и величины с критическим значением χ2α, Если выполняется неравенство , то нулевую гипотезу не отвергают. При несоблюдении указанного неравенства принимают альтернативную гипотезу о принадлежности выборки неизвестному распределению.
Недостатком критерия согласия Пирсона является потеря части первоначальной информации, связанная с необходимостью группировки результатов наблюдений в интервалы и объединения отдельных интервалов с малым числом наблюдений. В связи с этим рекомендуется дополнять проверку соответствия распределений по критерию χ2 другими критериями. Особенно это необходимо при сравнительно малом объеме выборки (n ≈ 100).
Функциональные характеристики стационарных систем обслуживания
Основными функциональными характеристиками СМО являются следующие.
-среднее число находящихся в системе клиентов,
-среднее число клиентов в очереди,
-средняя продолжительность пребывания клиента в системе,
-средняя продолжительность пребывания клиента в очереди,
-среднее количество занятых средств обслуживания (сервисов).
(7)
(8)
(9)
(10)
(11)
(12)
Глава 3. Анализ статистических данных о поступлении заявок на получение кредита по дням недели и в течение дня по часам.
Проверим при уровне значимости 0,95 гипотезу о том, что время поступления заявок в систему распределено экспоненциально на примере одного дня.
На основе начальных данных (время поступления заявок) посчитаем время между приходом заявок.
№ п/п |
Дата поступления заявки |
Время поступления заявки (час) |
Время между заявками |
1 |
22.05.2014 |
10:08 |
0:06 |
2 |
22.05.2014 |
10:14 |
0:14 |
3 |
22.05.2014 |
10:28 |
0:03 |
4 |
22.05.2014 |
10:31 |
0:02 |
5 |
22.05.2014 |
10:33 |
0:03 |
6 |
22.05.2014 |
10:36 |
0:10 |
7 |
22.05.2014 |
10:46 |
0:03 |
8 |
22.05.2014 |
10:49 |
0:02 |
9 |
22.05.2014 |
10:51 |
0:05 |
10 |
22.05.2014 |
10:56 |
0:10 |
11 |
22.05.2014 |
11:06 |
0:04 |
12 |
22.05.2014 |
11:10 |
0:31 |
13 |
22.05.2014 |
11:41 |
0:00 |
14 |
22.05.2014 |
11:41 |
0:09 |
15 |
22.05.2014 |
11:50 |
0:03 |
16 |
22.05.2014 |
11:53 |
0:12 |
17 |
22.05.2014 |
12:05 |
0:04 |
18 |
22.05.2014 |
12:09 |
0:15 |
19 |
22.05.2014 |
12:24 |
0:09 |
20 |
22.05.2014 |
12:33 |
0:01 |
21 |
22.05.2014 |
12:34 |
0:00 |
22 |
22.05.2014 |
12:34 |
0:24 |
23 |
22.05.2014 |
12:58 |
0:08 |
24 |
22.05.2014 |
13:06 |
0:00 |
25 |
22.05.2014 |
13:06 |
0:20 |
26 |
22.05.2014 |
13:26 |
0:07 |
27 |
22.05.2014 |
13:33 |
0:03 |
28 |
22.05.2014 |
13:36 |
0:11 |
29 |
22.05.2014 |
13:47 |
0:03 |
30 |
22.05.2014 |
13:50 |
0:05 |
31 |
22.05.2014 |
13:55 |
0:01 |
32 |
22.05.2014 |
13:56 |
0:06 |
33 |
22.05.2014 |
14:02 |
0:09 |
34 |
22.05.2014 |
14:11 |
0:37 |
35 |
22.05.2014 |
14:48 |
0:03 |
36 |
22.05.2014 |
14:51 |
0:13 |
37 |
22.05.2014 |
15:04 |
0:17 |
38 |
22.05.2014 |
15:21 |
0:17 |
39 |
22.05.2014 |
15:38 |
0:36 |
40 |
22.05.2014 |
16:14 |
0:15 |
41 |
22.05.2014 |
16:29 |
0:01 |
42 |
22.05.2014 |
16:30 |
0:02 |
43 |
22.05.2014 |
16:32 |
|
Таблица 1
Найдем шаг h для деления времени между поступлениями на частичные интервалы, который находится по формуле Стерджесса
(13)
Где - максимальное и- минимальное время между поступлениями, аN – число заявок поступивших за день.
Максимум = 37 |
|
Минимум = 0 |
|
h = 2,75779 |
|
N = 42 |
|
Разделим отрезок [0,37] на частичные интервалы с шагом h и прочитаем частоту попадания времени между приходами заявок в частичные интервалы. Так же мы построим гистограмму.
|
Гистограмма 1 |
Таблица 2
По гистограмме видно, что скорее всего это экспоненциальное распределение. Мы знаем, что для экспоненциального распределения параметр равен:
или (15)
Далее посчитаем выборочное среднее и выборочную дисперсию и с помощью критерия Пирсона проверим гипотезу об экспоненциальном распределении.
F(i) |
M(i) |
M(i)*F(i) |
M(i)^2*F(i) |
Частоты |
Середины интервалов |
Параметры распределения |
|
9 |
1,378895163 |
12,41005646 |
17,11217 |
10 |
4,136685488 |
41,36685488 |
171,1217 |
5 |
6,894475814 |
34,47237907 |
237,669 |
7 |
9,652266139 |
67,56586298 |
652,1637 |
1 |
12,41005646 |
12,41005646 |
154,0095 |
3 |
15,16784679 |
45,50354037 |
690,1907 |
2 |
17,92563712 |
35,85127423 |
642,6569 |
1 |
20,68342744 |
20,68342744 |
427,8042 |
1 |
23,44121777 |
23,44121777 |
549,4907 |
0 |
26,19900809 |
0 |
0 |
0 |
28,95679842 |
0 |
0 |
1 |
31,71458874 |
31,71458874 |
1005,815 |
0 |
34,47237907 |
0 |
0 |
2 |
37,23016939 |
74,46033879 |
2772,171 |
Таблица 3
= 9,520942791
= 85,682291
= 9,256472924
Так как среднее выборочное и корень из выборочной дисперсии не равны, но довольно близки, то
(16)
= 0,106510929
Посчитаем теоретические частоты с использованием экспоненциального распределения с параметром .
Вероятность попадания |
Число попаданий |
| |
0,254525843 |
10,690085 |
11 |
0,363636 |
0,189742438 |
7,9691824 |
8 |
0,5 |
0,141448084 |
5,9408195 |
6 |
0,166667 |
0,105445891 |
4,4287274 |
4 |
0,142857 |
0,078607187 |
3,3015019 |
3 |
0,5 |
0,058599626 |
2,4611843 |
2 |
|
0,043684507 |
1,8347493 |
2 |
|
0,032565671 |
1,3677582 |
1 |
|
0,024276866 |
1,0196284 |
1 |
|
0,018097776 |
0,7601066 |
1 |
|
0,013491425 |
0,5666398 |
1 |
|
0,010057508 |
0,4224154 |
0 |
|
0,007497613 |
0,3148997 |
0 |
|
0,005589276 |
0,2347496 |
0 |
|
0,016370287 |
0,6875521 |
|
|
Значение критерия Пирсона: |
1,67316 |
Таблица 4
Сравним с критическим значением с уровнем доверия 0,95 и 3-мя степенями свободы.
следовательно мы принимаем гипотезу о том, что распределение носит экспоненциальный характер с параметром =0,106510929.
Рассмотрим по часам среднюю частоту прихода посетителей за неделю и построим гистограмму.
|
Гистограмма 2 |
| ||||||||||||||||||||||||||
Таблица 5 |
|
Из гистограммы явно видно, что по частоте прихода день делится на три части:
С 9 до 13 – пик активности;
С 13 до 14 – спад;
С 14 до 20 – второй пик.