Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пример РГР для 010500.doc
Скачиваний:
8
Добавлен:
03.12.2018
Размер:
644.1 Кб
Скачать

Министерство образования и науки Российской Федерации

ГОУ ВПО

КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ

УНИВЕРСИТЕТ им. А.Н. ТУПОЛЕВА

(Казанский авиационный институт)

КАФЕДРА ПРИКЛАДНОЙ МАТЕМАТИКИ И ИНФОРМАТИКИ им. Ю. В. Кожевникова

Пояснительная записка

к расчетно-графической работе

по дисциплине

"Теория вероятностей и математическая статистика"

Выполнил:

студент гр. 4312 Иванов А.А.

Руководитель: _______________

(должность, Ф.И.О.)

Подпись: _______________

Дата сдачи: _____________

Казань 2010

Расчетно-графическая работа

по дисциплине

«Теория вероятностей и математическая статистика»

Тема

Проверка статистических гипотез. Критерий Пирсона и критерий Колмогорова.

Введение

Расчетно-графическая работа по дисциплине «Теория вероятностей и математическая статистика» выполняется по теме дисциплины «Проверка статистических гипотез». Пояснительная записка содержит следующие разделы:

  1. содержание

  2. задание на расчетно-графическую работу;

  3. постановка задачи и математическое моделирование объектов задания расчетно-графической работы, описание методов исследования;

  4. анализ и решение задачи с помощью специализированной математической системы Statistica, оформление решения и полученных результатов в виде формул, таблиц и графиков в MS Word;

  5. выводы;

  6. список литературы;

  7. приложение.

Содержание

Задание на расчетно-графическую работу 5

Постановка задачи и математическое моделирование объектов задания расчетно-графической работы. Описание методов исследования 6

Теоретическое обоснование работы 6

Определение типа распределения с помощью критерия Пирсона ("хи-квадрат") 9

Критерий согласия Колмогорова 12

Практическая постановка задачи 16

Выполнение задания РГР 16

Список литературы 21

Приложение 1 22

Задание на расчетно-графическую работу

  1. Выполнить теоретическое обоснование работы в соответствии с индивидуальным заданием

  2. Задать выборочные данные и уровень значимости  проведения расчетов по следующему правилу: для каждого четного порядкового номера студента в списке группы  = 0,01; для каждого нечетного –  = 0,05.

  3. Провести расчеты с помощью средств MS Excel, специализированных систем «Statistica» и «MathLab», оформить полученные результаты.

  4. Сделать выводы о полученных результатах исследования.

Постановка задачи и математическое моделирование объектов задания расчетно-графической работы. Описание методов исследования Теоретическое обоснование работы

Проверка гипотезы осуществляется на основе выявления согласованности эмпирических данных с гипотетическими (теоретическими). Если расхождение между сравниваемыми величинами не выходит за пределы случайных ошибок, гипотезу принимают. При этом не делается никаких заключений о правильности самой гипотезы, речь идет лишь о согласованности сравниваемых данных. Основой проверки статистических гипотез являются данные случайных выборок. При этом безразлично, оцениваются ли гипотезы в отношении реальной или гипотетической генеральной совокупности. Последнее открывает путь применения этого метода за пределами собственно выборки: при анализе результатов эксперимента, данных сплошного наблюдения, но малой численности. В этом случае рекомендуется проверить, не вызвана ли установленная закономерность стечением случайных обстоятельств, насколько она характерна для того комплекса условий, в которых находится изучаемая совокупность. Особенно часто процедура проверки статистических гипотез проводится для оценки существенности расхождений сводных характеристик отдельных совокупностей (групп): средних, относительных величин. Такого рода задачи, как правило, возникают в социальной статистике. Применяя процедуру проверки статистических гипотез, следует помнить, что она может гарантировать результаты с определенной вероятностью лишь на основе объективных данных.

Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Гипотеза обозначается буквой H.

Гипотеза о том, что две совокупности, сравниваемые по одному или нескольким признакам, не отличаются, называется нулевой гипотезой. Она обозначается . При этом предполагается, что действительное различие сравниваемых величин равно нулю, а выявленное по данным отличие от нуля носит случайный характер.

Нулевая гипотеза отвергается тогда, когда по выборке получается результат, который при истинности выдвинутой нулевой гипотезы маловероятен. Границей невозможного или маловероятного обычно считают α = 0.05, т.е. 5%, или 0.01, 0.001. Если ориентироваться на правило «трех сигм», то вероятность ошибки α должна быть равна 0.0027. Однако для этого уровня вероятности ошибки значения критериев редко табулируются: как правило, значения критериев в статистико-математических таблицах рассчитаны для вероятностей ошибки 0.05; 0.01; 0.001.

Статистическим критерием называют определенное правило, устанавливающее условия, при которых проверяемую нулевую гипотезу следует либо отклонить, либо не отклонить. Критерий проверки статистической гипотезы определяет, противоречит ли выдвинутая гипотеза фактическим данным или нет.

Так как отклонение R одной выборочной характеристики от другой является случайной величиной, то оно имеет вполне определенное распределение (оно либо известно, либо им задаются). По этому распределению определяют предельные значения отклонений . Если мера отклонения исследуемых характеристик, определенная по результатам наблюдений (эксперимента), не превышает это критическое значение, то считают, что характеристики одинаковы. Критерий проверки обычно выбирают таким, чтобы вероятность P = ε отвергнуть гипотезу была малой, когда гипотеза верна, т.е.

Такую вероятность ε называют уровнем значимости (или когда ее выражают в процентах, – процентным уровнем значимости). Отвечающую ей область больших отклонений называют критической областью, а само правило проверки – критерием значимости.

Проверка гипотезы осуществляется следующим образом.

1.Задаются уровнем значимости, отвечающим событиям, которые при действии реального комплекса условий исследований считаются

(с некоторым риском) практически невозможными.

2. Определяется критическое отклонение по соответствующему распределению с вероятностью, равной ε.

3. Если значение меры отклонения R, вычисленное по данным наблюдений, окажется больше критического значения , то мы бракуем гипотезу , так как это событие практически невозможно. В том случае, если оно меньше, то можно утверждать, что принимаемая гипотеза не противоречит результатам наблюдений (эксперимента).

Следует отметить, что статистическая проверка гипотезы относительно некоторой совокупности экспериментальных данных сама по себе не дает доказательств, правильна или ложна эта гипотеза. Подобная проверка указывает лишь на степень согласия гипотезы с результатами эксперимента. Мы можем признавать допустимость гипотезы по крайней мере до тех пор, пока более обстоятельные исследования (например, по большему материалу или с помощью других критериев) не приведут нас к противоположному заключению.

Поскольку выборка результатов наблюдений состоит из конечного, зачастую даже из малого количества наблюдений, по которым мы судим о процессе в целом, то существует риск допустить ошибку, т.е. риск ложного суждения. Такой риск уменьшается с возрастанием числа наблюдений, но существует всегда. Оценить же вероятность того, что гипотеза будет принята, если она не верна, вообще говоря, невозможно, так как для этого необходимо рассмотреть все прочие (альтернативные) гипотезы, число которых может быть бесконечным. Поэтому, если ε достаточно мало, то мы вправе на практике (на основе принципа практической уверенности) исключить возможности редких событий.

Обычно в качестве практически невозможных событий принимают такие события, вероятность которых не превышает ε = 0,05 – 0,01. Дозволенная степень риска, связанная с пренебрежением событий с малой вероятностью, обусловливается практической важностью последствий, вытекающих из наступления таких событий, и диктуется конкретными требованиями к задачам оценки характеристик процессов и систем. Если в одних случаях считается возможным пренебречь событиями, имеющими вероятность появления меньше 0,05, то в других, например, когда идет речь об успешной посадке пассажирского самолета, нельзя пренебрегать обстоятельствами, которые могут появиться с вероятностью равной.

Следует отметить, что чем меньше выбирается уровень значимости ε, тем меньше возможность забраковать гипотезу, когда она верна, или, как говорят, совершить ошибку первого рода. В то же время с уменьшением уровня значимости (с расширением области допустимых значений) увеличивается вероятность принятия проверяемой гипотезы, когда она не верна, т.е. увеличивается вероятность ошибки второго рода.

Ранее при проверке различных статистических гипотез неоднократно делалось предположение о типе распределения исследуемых величин (случайной величины Х). Поэтому возникает задача проверки типа распределения. Задача нахождения типа распределения имеет большое значение при решении задач теории надежности, массового обслуживания и других, где требуется прогнозирование появления тех или иных событий.

Проверка гипотезы о предполагаемом законе распределения проводится так же, как и проверка гипотезы параметров распределения по критерию согласия. Имеется несколько критериев согласия для проверки гипотезы закона распределения: критерий Пирсона, Колмогорова, Смирнова и другие.