Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
SHepelenko_O.V._SHCHetinina_E.Orlova_L.Ekon-mat....doc
Скачиваний:
51
Добавлен:
17.04.2019
Размер:
9.51 Mб
Скачать

Квантили распределения Стьюдента

n

0.80

0.60

0.50

0.40

0.20

0.10

0.05

0.02

0.01

1

0.325

0.727

1.000

1.376

3.078

6.314

12.706

31.821

63.657

2

0.289

0.617

0.816

1.061

1.886

2.920

4.303

6.965

9.925

3

0.277

0.584

0.765

0.978

1.638

2.353

3.182

4.541

5.841

4

0.271

0.569

0.741

0.941

1.533

2.132

2.776

3.747

4.604

5

0.267

0.559

0.727

0.920

1.476

2.015

2.571

3.365

4.032

6

0.265

0.553

0.718

0.906

1.440

1.943

2.447

3.143

3.707

7

0.263

0.549

0.711

0.896

1.415

1.895

2.365

2.998

3.499

8

0.262

0.546

0.706

0.889

1.397

1.860

2.306

2.896

3.355

9

0.261

0.543

0.703

0.883

1.383

1.833

2.262

2.821

3.250

10

0.260

0.542

0.700

0.879

1.372

1.812

2.228

2.764

3.169

11

0.260

0.540

0.697

0.876

1.363

1.796

2.201

2.718

3.306

12

0.259

0.539

0.695

0.873

1.356

1.782

2.179

2.681

3.055

13

0.259

0.538

0.694

0.870

1.350

1.771

2.160

2.650

3.012

14

0.258

0.537

0.692

0.868

1.345

1.761

2.145

2.624

2.977

15

0.258

0.536

0.691

0.866

1.341

1.753

2.131

2.602

2.947

16

0.258

0.535

0.690

0.865

1.337

1.746

2.120

2.583

2.921

17

0.257

0.534

0.689

0.863

1.333

1.740

2.110

2.567

2.898

18

0.257

0.534

0.688

0.862

1.330

1.734

2.101

2.552

2.878

19

0.257

0.533

0.688

0.861

1.328

1.729

2.093

2.539

2.861

20

0.257

0.533

0.687

0.860

1.325

1.725

2.086

2.528

2.845

21

0.257

0.532

0.686

0.859

1.323

1.721

2.080

2.518

2.831

22

0.256

0.532

0.686

0.858

1.321

1.717

2.074

2.508

2.819

23

0.256

0.532

0.685

0.858

1.319

1.714

2.069

2.500

2.807

24

0.256

0.531

0.685

0.857

1.318

1.711

2.064

2.492

2.797

25

0.256

0.531

0.684

0.856

1.316

1.708

2.060

2.485

2.787

26

0.256

0.531

0.684

0.856

1.315

1.706

2.056

2.479

2.779

27

0.256

0.531

0.684

0.855

1.314

1.703

2.052

2.473

2.771

28

0.256

0.530

0.683

0.855

1.313

1.701

2.048

2.467

2.763

29

0.256

0.530

0.683

0.854

1.311

1.699

2.045

2.462

2.756

30

0.256

0.530

0.683

0.854

1.310

1.697

2.042

2.457

2.750

40

0.255

0.529

0.681

0.851

1.303

1.684

2.021

2.423

2.704

60

0.254

0.527

0.679

0.848

1.296

1.671

2.000

2.390

2.660

100

0.254

0.526

0.677

0.845

1.290

1.660

1.984

2.364

2.626

200

0.254

0.525

0.676

0.843

1.286

1.652

1.972

2.345

2.601

0.253

0.524

0.675

0.842

1.282

1.645

1.960

2.326

2.576

ПРИЛОЖЕНИЕ 6

ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Статистические оценки параметров

Уравнения, моделирующие экономические процессы, зависят от параметров, значения которых заранее неизвестны. Поэтому возникает задача оценки этих параметров по результатам наблюдений. Оценить параметр – это значит наиболее точно рассчитать его значение. Для этого в математической статистике используется выборочный метод.

Пусть имеется совокупность N наблюдений случайной величины X, которая называется генеральной совокупностью. Выборочной совокупностью (или выборкой) называется совокупность случайно отобранных значений случайной величины X.

Обозначим через статистическую оценку некоторого теоретического параметра распределения генеральной совокупности признака X. Если сделать выборку объемом , то рассматривая как независимые случайные величины, можно рассчитать по выборке оценку параметра . Если для оценки параметра взять несколько выборок одного и того же объема , то получим числа , которые, в общем случае, отличаются между собой. Оценки являются случайными величинами, поэтому их распределение можно охарактеризовать числовыми характеристиками – математическим ожиданием и дисперсией .

Для того, чтобы статистические оценки давали хорошие приближения для оцениваемых параметров, они должны быть несмещенными, состоятельными и эффективными.

Определение. Оценка истинного значения параметра называется

несмещенной, если ее математическое ожидание равно оцениваемому

параметру, т.е.

= . (1)

В противном случае оценка называется смещенной, а величина

смещения определяется формулой .

В общем случае каждая отдельная оценка отличается от соответствующей характеристики генеральной совокупности, но среднее значение оценок по всем выборкам одинакового объема должно совпадать с ее истинным значением. Требование несмещенности гарантирует отсутствие систематических ошибок при оценивании.

Несмещенная оценка не всегда дает хорошее приближение, поскольку отдельные выборочные оценки могут сильно отличаться от истинного значения параметра, т.е. несмещенная оценка может иметь большую дисперсию относительно математического ожидания. Поэтому к статистической оценке предъявляют требование эффективности.

Определение. Несмещенная оценка параметра называется

эффективной, если она имеет наименьшую дисперсию среди всех

возможных несмещенных оценок параметра , вычисленных по

выборкам одного и того же объема.

В практических исследованиях это означает возможность перехода от точечного оценивания к интервальному.

Степень реалистичности параметров обеспечивается, если оценки будут не только несмещенными и эффективными, но и состоятельными. Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки.

Определение. Оценка параметра называется состоятельной,

если она удовлетворяет закону больших чисел, т.е. при увеличении

объема выборки оценка стремится по вероятности к оцениваемому

параметру

(2)

Достаточным условием состоятельности оценки является

(3)

Найдем оценки основных числовых характеристик распределения по генеральной совокупности – математического ожидания

(4)

и дисперсии

(5)

где - объем генеральной совокупности; - различные значения исследуемого параметра; - их частоты ( ).

На практике числовые характеристики генеральной совокупности изучают по выборкам объема . Для этого вычисляют оценки генеральных параметров (4) и (5) – выборочное среднее и выборочную дисперсию .

Выборочным средним называется среднее арифметическое значений признака X выборочной совокупности

(6)

где - объем выборки; - различные значения признака в выборке; - их частоты ( . Выборочное среднее изменяется от выборки к выборке и поэтому является случайной величиной, имеющей свои числовые характеристики.

Для характеристики рассеяния выборочных значений признака относительно его выборочного среднего вводится понятие выборочной дисперсии.

Выборочной дисперсией называется среднее арифметическое квадратов отклонений значений признака выборочной совокупности от его среднего значения

(7)

Справедливы следующие теоремы:

  • Выборочное среднее есть несмещенная оценка генерального среднего, т.е.

(8)

  • Из всех линейных несмещенных оценок генерального среднего выборочное среднее имеет минимальную дисперсию, т.е. является эффективной оценкой.

  • При увеличении объема выборки выборочное среднее стремится по вероятности к генеральному среднему . Это означает, что выборочное среднее - состоятельная оценка генерального среднего .

Таким образом, выборочное среднее является несмещенной, эффективной и состоятельной оценкой генерального среднего .

Рассмотрим оценку для генеральной дисперсии . Можно показать, что

(9)

Из формул (9) следует, что выборочная дисперсия является эффективной, но смещенной оценкой генеральной дисперсии, т.е. математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии . Поэтому в качестве оценки берут выборочную дисперсию

, (10)

которая является несмещенной и состоятельной оценкой генеральной дисперсии :

. (11)

Выборочная дисперсия менее состоятельна, чем , поскольку .

Теорема. Из всех квадратичных оценок дисперсии только

выборочная дисперсия является несмещенной оценкой. В этом

классе оценок является и эффективной оценкой .

Тот факт, что для получения несмещенной оценки (10) знаменатель выборочной дисперсии пришлось заменить на непосредственно связан с тем, что величина выборочного среднего , относительно которой вычисляются отклонения, сама зависит от элементов выборки.

Если случайные величины связаны какими-либо линейными соотношениями (например, одним из них может быть ), то эти соотношения называются уравнениями связи.

Знаменатель выборочной дисперсии всегда равен разности объема выборки и числа уравнений связи , наложенных на эту выборку.

Число называется числом степеней свободы.

Например, для парной регрессии имеем:

1) выражение имеет одну степень свободы, поскольку для составления этой суммы квадратов необходимо иметь независимую переменную , где одна из этих переменных является линейной комбинацией остальных в силу выполнения равенства

2) выражение имеет степень свободы, поскольку для составления этой суммы квадратов необходимо иметь только один параметр, а именно, , что следует из соотношения ;

3) выражение имеет степени свободы, поскольку для составления этой суммы квадратов необходимо иметь два параметра и .

Замечание. При различие между и практически незначимо, так как при .

Проверка статистических гипотез

При построении интервальных оценок генеральных параметров используют принцип практической уверенности – если вероятность некоторого события в данном опыте весьма мала, то можно быть практически уверенным, что при однократном повторении опыта событие не произойдет. Таким образом, практически невозможное событие можно считать неслучайным. Его называют значимым. Использование принципа практической уверенности для доказательства неслучайного появления события с малой вероятностью называется принципом значимости. Наибольшее значение вероятности, при котором событие считается неслучайным (значимым), называется уровнем значимости. Чем выше уровень значимости, тем более он "жесткий", так как тем большее число событий нельзя считать случайными. Уровень значимости и уровень достоверности в сумме дают единицу, , так как являются вероятностями противоположных событий.

Принцип значимости лежит в основе проверок статистических гипотез.

Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Различают нулевые и конкурирующие статистические гипотезы. Если одна из гипотез верна, то другая – неверна.

Нулевой называют гипотезу , которую выдвигают для проверки. Например, пусть в качестве нулевой гипотезы выдвигается гипотеза о равенстве генерального параметра некоторому определенному значению :

:

Конкурирующей называют гипотезу , которая противоречит нулевой. В данном примере конкурирующей (или альтернативной) гипотезой может быть одна из гипотез:

; 2) ; 3) .

Выдвинутая гипотеза подвергается проверке статистическими методами, т.е. выясняется согласуются или нет экспериментальные данные с гипотезой. Если экспериментальные данные согласуются с гипотезой, то она принимается, в противном случае – отвергается и принимается конкурирующая гипотеза. В результате статистической проверки гипотезы может быть принято правильное или неправильное решение, т.е. допущена ошибка. Это связано с тем, что статистические методы проверки гипотез основаны на ограниченности выборки. Единственный способ уменьшить вероятности ошибок состоит в увеличении объема выборки. Различают ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута правильная нулевая гипотеза. Вероятность совершить ошибку первого рода равна уровню значимости :

Р(отклонить в случае, когда верна ) = .

Ошибка второго рода состоит в том, что будет принята нулевая гипотеза , в то время как в действительности верна конкурирующая гипотеза :

Р(принять в случае, когда верна ) = .

Правильное решение может быть также двух типов:

Р(принять в случае, когда верна ) = 1- ;

Р(принять в случае, когда верна ) = 1 - .

Вероятность не совершить ошибку второго рода (1- ) называют мощностью критерия.

В общем случае ошибки первого и второго рода неравнозначны, они приводят к разным результатам. Например, если нулевая гипотеза : поставки товара не срываются, то ошибка первого рода приведет к тому, что будут потрачены средства на поиск новых поставщиков. Допустив ошибку второго рода, мы теряем клиентов и несем убытки. Очевидно, что последствия ошибки второго рода более ощутимы для финансового благополучия предприятия.

Для проверки нулевой гипотезы используют специально подобранные случайные величины (статистики, критерии), распределение которых точно или приближенно известно. Каждый такой способ проверки называется критерием значимости. Со всех возможных критериев выбирается тот, который при заданном уровне значимости имеет наименьшую вероятность ошибки второго рода.

Статистическим критерием называется случайная величина К , которая служит для проверки нулевой гипотезы. Наиболее часто используются критерии Стьюдента, Пирсона и Фишера, которые используют t-статистику, F- статистику и - статистику.

Наблюдаемым значением критерия называется значение критерия, вычисленное по выборкам.

После выбора определенного критерия множество всех его возможных значений разбиваем на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается.

Критической областью называется совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия нулевой гипотезы называют совокупность значений критерия, при которых гипотезу принимают.

Если наблюдаемое значение критерия принадлежит критической области, то гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы, то гипотезу принимают.

Точки, отделяющие критическую область от области принятия гипотезы, называют критическими.

В зависимости от вида рассматриваемых интервалов различают следующие виды гипотез:

1) односторонняя гипотеза проверяет левостороннюю или правостороннюю критические области ( ). Правосторонняя критическая область используется в случае, когда конкурирующая гипотеза имеет вид , а левосторонняя – когда .

2) двусторонняя гипотеза проверяет двустороннюю критическую область , , . Она используется в случае, когда конкурирующая гипотеза имеет вид . Если , то двустороннюю критическую область записывают в виде и называют двусторонней симметричной критической областью.

Для определения критической области задают достаточно малую вероятность – уровень значимости – и находят критическую точку из требования, чтобы при справедливости нулевой гипотезы вероятность того, что критерий К примет значение больше была равна принятому уровню значимости:

  • для правосторонней критической области Р( )= ;

  • для левосторонней критической области Р( )= ;

  • для двусторонней симметричной критической области Р( )= .

Для каждого критерия К соответствующих распределений имеются таблицы, по которым и находят критические точки для различных уровней значимости.

Для правосторонней критической области , где lчисло степеней свободы, для левосторонней критической области , а для двусторонней критической области и . После того, как найдена критическая точка , по данным выборки вычисляют наблюдаемое значение критерия . Если < , то нет оснований отвергать нулевую гипотезу, поэтому с вероятностью (1 – α) нулевая гипотеза принимается; если › , то нулевую гипотезу отвергают в пользу гипотезы .

Замечание. F- критерий рассчитан на проверку только двусторонних гипотез, в то время как t - критерий рассчитан на проверку как односторонних, так и двусторонних гипотез.

Алгоритм проверки статистических гипотез:

1. Формулируется нулевая гипотеза и определяется конкурирующая гипотеза.

2. Выбирается уровень значимости для проверки гипотез.

3. Выбирается случайная величина К – критерий проверки нулевой гипотезы. Случайная величина К распределена по какому-то закону (например, по закону , распределения Фишера-Снедекора или Стьюдента).

4. По выборке из генеральной совокупности, в предположении правильности нулевой гипотезы, рассчитывается .

5. По таблицам критических точек распределения критерия К находится и определяются критические области – области, в которых нулевая гипотеза отвергается и принимается конкурирующая гипотеза.

6. Сравниваются и . Если не попадает в критическую область, то нулевая гипотеза принимается – она статистически значима и не противоречит опытным данным. Если попадает в критическую область, то нулевая гипотеза отклоняется. Она статистически незначима.

108