- •1. Статистический вывод. Проверка гипотез
- •2. Общая схема проверки статистической гипотезы
- •5 Сравнение средних значений ранжированных признаков двух независимых выборок
- •7. Сравнение дисперсий двух независимых выборок
- •8. Сравнение дисперсий двух зависимых (связанных) выборок
- •9,10 Анализ взаимосвязей количественных признаков. Коэффициент корреляции пирсона
- •11. Значимость коэффициента корреляции
- •13Алгоритм вычисления крк Спирмена.
- •14Значимость крк Спирмена.
- •15. Коэффициент ранговой корреляции кендалла
- •16Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •17. Бисериальный коэффициент корреляции (бкк)
- •18. Ранговый бисериальный коэффициент корреляции
8. Сравнение дисперсий двух зависимых (связанных) выборок
Когда в качестве исходных данных рассматриваются две связанные выборки х1, х2, …, хn и у1, у2, …, уn (т.е. одинакового объема). Например, для данных типа «до-после» мы также можем рассматривать задачу сравнения дисперсий двух ГС. Для решения воспользуемся общей схемой проверки статистической гипотезы.
1. Выдвигаются две статистические гипотезы: Н0: о том, что дисперсии двух рассматриваемых ГС статистики одинаковы. Н1: о том, что эти дисперсии статистики различны.
2 2
Н0 = х = у
2 2
Н1 = х = у
2. Выбираем уровень значимости .
3. Вычисляем наблюдаемое значение статистики критерия. Для этого
2 2
сначала вычисляем по исходным выборкам дисперсии Sx и Sy, а также коэффициент корреляции rху.
n n 2 n 2
Rxy = ( (xi – x) (yi – y) : (xi – x) (yi – y)
i=1 i=1 i=1
Наблюдаемое значение вычисляется по формуле:
2 2 2 2 2
tнабл. = (Sx - Sy) : ((4 Sx Sy ) :n – 2 ) (1 – rxy)
4. Находим критическое значение статистики критерия. В нашем случае статистика критерия имеет t-распространение Стьюдента с числом степеней свободы = n – 2. Поэтому для нахождения критического значения tкр необходимо воспользоваться статистической таблицей распределения Стьюдента.
5. Делаем вывод о правильности той или иной гипотезы по следующему правилу: 1) если – tкр < tнабл. < tкр, то принимается Н0, т.е. делаем вывод, что дисперсии двух рассматриваемых ГС статистики одинаковые на уровне значимости . 2) tнабл. < - tкр tнабл. > tкр, то принимается Н1, т.е. вывод: эти дисперсии статистики различны на уровне значимости .
Пример: 95 учащихся 7 класса и эти же 95 учащихся в 8 классе были подвергнуты тестированию по Стентфордскому тесту. Экспериментатор хотел выяснить, будут ли характеристики учащихся (успеваемость) более постоянными (менее изменчивыми) в 7 или 8 классе. Так как в данном случае рассматриваются одни и те же учащиеся, то наши две исходные выборки х1, х2, …, х95 и у1, у2, …, у95 являются связанными выборками. Так как мы хотим выяснить изменчивость характеристик, то надо проверять гипотезу о равенстве дисперсии. Выбираем = 0,1. По исходным выборкам было вычислено, что 2 2
Sx = 134,56; Sy = 201,64; rxy = 0,876 . Вычисляем tнабл. =
2
(134,56 – 201,64) : (4 134,56 201,64) : (95 – 2) (1 – 0,876) = - 4,07
/2 = 0.1/2 = 0,05 (столбец); = 95 – 2 = 93 (строчка). По таблице находим tкр = 1,66
Так как tнабл < - tкр, то принимается Н1, т.е. дисперсии статистики
2 2
различны на уровне значимости 0,1 или, другими словами, т.к.Sx <Sy, успеваемость у восьмиклассников обладает большей изменчивостью, чем у семиклассников. Если мы хотим сравнить два исследуемых показателя (или один и тот же, но для двух различных групп лиц по их уровню), то необходимо проверять гипотезу о равенстве средних значений. Если хотим сравнить изменчивость (разброс показателя), то необходимо проверять гипотезу о равенстве дисперсий.