Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kursovaya_rabota_Ganzeev_M112.docx
Скачиваний:
9
Добавлен:
20.04.2015
Размер:
196.96 Кб
Скачать

3. Оценка по критерию согласия χ2

Критерий согласия χ2 (критерий Пиросона) применяют для проверки гипотезы о соответствии эмпирического распределения предполагаемому теоретическому распределению F(x) при большом объеме выборки (n ≥ 100). Критерий применим для любых видов функции F(x), даже при неизвестных значениях их параметров, что обычно имеет место при анализе результатов механических испытаний. В этом заключается его универсальность.

Использование критерия χ2 предусматривает разбиение размаха варьирования выборки на интервалы и определения числа наблюдений (частоты) nj для каждого из e интервалов. Для удобства оценок параметров распределения интервалы выбирают одинаковой длины.

Интервалы, содержащие менее пяти наблюдений, объединяют с соседними. Однако, если число таких интервалов составляет менее 20 % от их общего количества, допускаются интервалы с частотой nj ≥ 2.

Статистикой критерия Пирсона служит величина

(6)   где pj - вероятность попадания изучаемой случайной величины в j-и интервал, вычисляемая в соответствии с гипотетическим законом распределением F(x). При вычислении вероятности pj нужно иметь в виду, что левая граница первого интервала и правая последнего должны совпадать с границами области возможных значений случайной величины. Например, при нормальном распределении первый интервал простирается до -∞, а последний - до +∞.

Нулевую гипотезу о соответствии выборочного распределения теоретическому закону F(x) проверяют путем сравнения вычисленной по формуле (1) и величины с критическим значением χ2α, Если выполняется неравенство , то нулевую гипотезу не отвергают. При несоблюдении указанного неравенства принимают альтернативную гипотезу о принадлежности выборки неизвестному распределению.

Недостатком критерия согласия Пирсона является потеря части первоначальной информации, связанная с необходимостью группировки результатов наблюдений в интервалы и объединения отдельных интервалов с малым числом наблюдений. В связи с этим рекомендуется дополнять проверку соответствия распределений по критерию χ2 другими критериями. Особенно это необходимо при сравнительно малом объеме выборки (n ≈ 100).

  1. Функциональные характеристики стационарных систем обслуживания

Основными функциональными характеристиками СМО являются следующие.

-среднее число находящихся в системе клиентов,

-среднее число клиентов в очереди,

-средняя продолжительность пребывания клиента в системе,

-средняя продолжительность пребывания клиента в очереди,

-среднее количество занятых средств обслуживания (сервисов).

(7)

(8)

(9)

(10)

(11)

(12)

Глава 3. Анализ статистических данных о поступлении заявок на получение кредита по дням недели и в течение дня по часам.

Проверим при уровне значимости 0,95 гипотезу о том, что время поступления заявок в систему распределено экспоненциально на примере одного дня.

На основе начальных данных (время поступления заявок) посчитаем время между приходом заявок.

№ п/п

Дата поступления заявки

Время поступления заявки (час)

Время между заявками

1

22.05.2014

10:08

0:06

2

22.05.2014

10:14

0:14

3

22.05.2014

10:28

0:03

4

22.05.2014

10:31

0:02

5

22.05.2014

10:33

0:03

6

22.05.2014

10:36

0:10

7

22.05.2014

10:46

0:03

8

22.05.2014

10:49

0:02

9

22.05.2014

10:51

0:05

10

22.05.2014

10:56

0:10

11

22.05.2014

11:06

0:04

12

22.05.2014

11:10

0:31

13

22.05.2014

11:41

0:00

14

22.05.2014

11:41

0:09

15

22.05.2014

11:50

0:03

16

22.05.2014

11:53

0:12

17

22.05.2014

12:05

0:04

18

22.05.2014

12:09

0:15

19

22.05.2014

12:24

0:09

20

22.05.2014

12:33

0:01

21

22.05.2014

12:34

0:00

22

22.05.2014

12:34

0:24

23

22.05.2014

12:58

0:08

24

22.05.2014

13:06

0:00

25

22.05.2014

13:06

0:20

26

22.05.2014

13:26

0:07

27

22.05.2014

13:33

0:03

28

22.05.2014

13:36

0:11

29

22.05.2014

13:47

0:03

30

22.05.2014

13:50

0:05

31

22.05.2014

13:55

0:01

32

22.05.2014

13:56

0:06

33

22.05.2014

14:02

0:09

34

22.05.2014

14:11

0:37

35

22.05.2014

14:48

0:03

36

22.05.2014

14:51

0:13

37

22.05.2014

15:04

0:17

38

22.05.2014

15:21

0:17

39

22.05.2014

15:38

0:36

40

22.05.2014

16:14

0:15

41

22.05.2014

16:29

0:01

42

22.05.2014

16:30

0:02

43

22.05.2014

16:32

Таблица 1

Найдем шаг h для деления времени между поступлениями на частичные интервалы, который находится по формуле Стерджесса

(13)

Где - максимальное и- минимальное время между поступлениями, аN – число заявок поступивших за день.

Максимум = 37

Минимум = 0

h = 2,75779

N = 42

Разделим отрезок [0,37] на частичные интервалы с шагом h и прочитаем частоту попадания времени между приходами заявок в частичные интервалы. Так же мы построим гистограмму.

Интервалы

Частоты

0

9

2,7577903

10

5,5155807

5

8,273371

7

11,031161

1

13,788952

3

16,546742

2

19,304532

1

22,062323

1

24,820113

0

27,577903

0

30,335694

1

33,093484

0

35,851274

2

38,609065

 

Гистограмма 1

Таблица 2

По гистограмме видно, что скорее всего это экспоненциальное распределение. Мы знаем, что для экспоненциального распределения параметр равен:

или (15)

Далее посчитаем выборочное среднее и выборочную дисперсию и с помощью критерия Пирсона проверим гипотезу об экспоненциальном распределении.

F(i)

M(i)

M(i)*F(i)

M(i)^2*F(i)

Частоты

Середины интервалов

Параметры распределения

 

9

1,378895163

12,41005646

17,11217

10

4,136685488

41,36685488

171,1217

5

6,894475814

34,47237907

237,669

7

9,652266139

67,56586298

652,1637

1

12,41005646

12,41005646

154,0095

3

15,16784679

45,50354037

690,1907

2

17,92563712

35,85127423

642,6569

1

20,68342744

20,68342744

427,8042

1

23,44121777

23,44121777

549,4907

0

26,19900809

0

0

0

28,95679842

0

0

1

31,71458874

31,71458874

1005,815

0

34,47237907

0

0

2

37,23016939

74,46033879

2772,171

Таблица 3

= 9,520942791

= 85,682291

= 9,256472924

Так как среднее выборочное и корень из выборочной дисперсии не равны, но довольно близки, то

(16)

= 0,106510929

Посчитаем теоретические частоты с использованием экспоненциального распределения с параметром .

Вероятность попадания

Число попаданий

 

0,254525843

10,690085

11

0,363636

0,189742438

7,9691824

8

0,5

0,141448084

5,9408195

6

0,166667

0,105445891

4,4287274

4

0,142857

0,078607187

3,3015019

3

0,5

0,058599626

2,4611843

2

 

0,043684507

1,8347493

2

 

0,032565671

1,3677582

1

 

0,024276866

1,0196284

1

 

0,018097776

0,7601066

1

 

0,013491425

0,5666398

1

 

0,010057508

0,4224154

0

 

0,007497613

0,3148997

0

 

0,005589276

0,2347496

0

 

0,016370287

0,6875521

 

 

Значение критерия Пирсона:

1,67316

Таблица 4

Сравним с критическим значением с уровнем доверия 0,95 и 3-мя степенями свободы.

следовательно мы принимаем гипотезу о том, что распределение носит экспоненциальный характер с параметром =0,106510929.

Рассмотрим по часам среднюю частоту прихода посетителей за неделю и построим гистограмму.

Промежутки

Кол-во человек

9:00

1,571429

10:00

17,28571

11:00

20,28571

12:00

18,57143

13:00

9,571429

14:00

17,14286

15:00

14,42857

16:00

12

17:00

8,285714

18:00

3

19:00

0,285714

20:00

 

Гистограмма 2

Таблица 5

Из гистограммы явно видно, что по частоте прихода день делится на три части:

  1. С 9 до 13 – пик активности;

  2. С 13 до 14 – спад;

  3. С 14 до 20 – второй пик.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]