Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kurs_Theor.doc
Скачиваний:
8
Добавлен:
22.12.2018
Размер:
1.86 Mб
Скачать

Задание 14. Проверить независимость двух характеристик по критерию сопряженности хи-квадрат

Постановка задачи.

По выборке из двумерного распределения (не обязательно нормального) проверить гипотезу независимости компонентов наблюдаемого случайного вектора .

Теоретические основы.

При отсутствии нормальности распределения вектора для проверки независимости его компонентов применяется критерий сопряженности хи-квадрат. Для построения этого критерия необходимо

  1. область значений признака X разбить на r интервалов , а область зна­чений признака Y на s интервалов .

  2. Для каждого сочетания (i,j) подсчитать количество выборочных данных, для которых, одновременно, признак X попадает в i-ый интервал , а признак Y – в m-ый интервал . Результаты подсчета свести в таблицу сопряженности признаков

Y

X

1-й

s

Всего

1-й

r

Всего

где, как обычно, точка на месте одного из индексов означает сумму всех чисел по этому индексу с фиксированным значением второго индекса. Проще говоря, нужно просуммировать значения по всем столбцам и строкам таблицы (столбец и строка “Всего”). Число в правой крайней нижней ячейке должно равняться общему объему выборки n.

  1. Вычислить статистику критерия сопряженности хи-квадрат

.

При справедливости гипотезы независимости распределение статистики может быть аппроксимировано распределением хи-ква­д­рат с степенями свободы:

.

Следовательно, если гипотеза независимости отвергается при больших значениях статистики , то при

  1. критический уровень значимости .

  2. Признаки следует признать независимыми если .

Идея критерия сопряженности основана на том, что по закону больших чисел относительная частота

– есть состоятельная оценка вероятности ,

а частоты

, – состоятельные оценки вероятностей , .

Поэтому можно ожидать, что для независимых признаков

и поэтому значение статистики будет “не слишком” большим.

Замечание 1. Как всегда, в критериях хи-квадрат число интервалов разбиения и границы разбиения должны выбираться заранее, до проведения статистического эксперимента. В целях упрощения мы выберем по обоим признакам по 4 интервала

.

Значение первой границы и шаг разбиения будут даны в задании.

Замечание 2. Критерий “безразличен” к способу получения таблицы сопряженности. Очень часто данные сразу имеют вид такой таблицы. Например, в пособии “Курсовой проект …” [2] рассматривается задача проверки гипотезы независимости уровня образования от количества детей в семье. Данные получены путем обследования некоторой совокупности семей, сгруппированной по двум признакам: уровень образования (две градации, r = 2) и число детей (четыре градации, s = 4).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]