- •Статистика в Excel
- •Глава 3. Основные статистические распределения
- •§3.1. Случайные величины. Функция и плотность распределения
- •§3.2. Нормальное распределение
- •§3.3. Биномиальное распределение
- •§3.4. Распределение Пуассона
- •§3.5. Распределение Пирсона
- •§3.6. Распределение Стьюдента
- •§3.7. Распределение Фишера
- •§3.8. Гипергеометрическое распределение
- •§3.9. Другие статистический распределения
- •Практические задания
- •3.1. Графики функции нормального распределения
- •3.2. Графики биномиального распределения
- •3.3. Графики распределения Пуассона
- •3.4. Графики распределения Стьюдента
- •Задания для самостоятельного выполнения
- •Контрольные вопросы
§3.6. Распределение Стьюдента
Если Х – нормированная случайная величина, распределенная по нормальному закону, случайная величина (3.12), имеющая распределение Пирсона с k степенями свободы, то случайная величина
(3.14)
имеет распределение, называемое распределением Стьюдента (псевдоним Вильяма Госсета) или t-распределением с k степенями свободы. Обычно число степеней свободы k=n1, где n – объем выборки.
Плотность распределения Стьюдента:
, (3.15)
где – нормировочный множитель, Г(z) – гамма-функция Эйлера. Интегральная функция распределения Стьюдента вычисляется по стандартной формуле (3.4) с плотностью (3.15). Ее значения могут быть найдены в специальных таблицах или вычислены на компьютере (например, в Excel).
Основное свойство распределения Стьюдента: при большом числе степеней свободы k справедливы асимптотические формулы:
и , поэтому
.
Это означает, что при очень большом объеме выборки kn, и плотность распределения Стьюдента (3.15) стремится к плотности стандартного нормального распределения (3.6). На практике при n>30 распределение Стьюдента заменяется нормальным.
Закон Стьюдента (3.15) характеризует распределение выборочных средних в зависимости от объема выборки n в генеральной совокупности, имеющей нормальное распределение. С увеличением числа наблюдений n распределение Стьюдента быстро приближается к нормальному (3.6), уже при n>30 практически не отличается от него и перестает зависеть от n. Однако при n<30 распределение Стьюдента сильно зависит от объема выборки и существенно отличается от нормального. Поэтому замена распределения Стьюдента нормальным n<30 приводит к грубым ошибкам оценки результатов наблюдений, например, к неоправданному повышению точности оценки.
В Excel имеется функция СТЬЮДРАСП, которая вычисляет вероятность того, что случайная величина (3.14) примет значение, большее переменной х, т.е. . Аргументы у этой функции следующие: СТЬЮДРАСП(х; k; вид), где х – переменная, k – число степеней свободы распределения Стьюдента, вид – параметр, определяющий, вычислять одностороннее или двухстороннее распределение: если он равен 1, то вычисляется одностороннее, а если 2 – то двухстороннее.
Рассуждая аналогично § 3.5, можно заключить, что интегральная функция распределения Стьюдента вычисляется в Excel по формуле: =1–СТЬЮДРАСП(х;k;1) (обязательно оно должно быть односторонним, поэтому в качестве параметра вид указана 1).
Критические точки двухсторонней критической области распределения Стьюдента (см. гл. 5) для заданного уровня значимости и числа степеней свободы k можно вычислить с помощью функции СТЬЮДРАСПОБР(;k). Нахождение критических точек необходимо для проверки статистических гипотез при использовании критерия Стьюдента, которые подробно будут рассмотрены в гл. 5.
Критические точки односторонней критической области распределения Стьюдента могут быть получены заменой аргумента на 2 в функции СТЬЮДРАСПОБР. Например, если двухсторонняя критическая точка для =0,05 и k=10 вычисляется СТЬЮДРАСПОБР(0,05; 10) и равна 2,28139, то односторонняя критическая точка для того же уровня значимости 0,05 и числа степеней свободы вычисляется формулой СТЬЮДРАСПОБР(2*0,05; 10) и равна 1,812462.