Скачиваний:
83
Добавлен:
15.03.2015
Размер:
313.86 Кб
Скачать

24. Теорема Фишера для нормальных выборок В этом параграфе мы приводим теорему, впервые доказанную Р.А. Фишером в 1925 г. Она существенно облегчает статистический анализ независимых выборок из нормального распределения. Теорема Фишера. Пусть независимая выборка из распределенияТогда 1. выборочное среднееи выборочная дисперсия независимы;

2.имеет-распределение сстепенью свободы.

25. Задачи математической статистики Математическая статистика, раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками. Предмет и метод математической статистики. Статистическое описание совокупности объектов занимает промежуточное положение между индивидуальным описанием каждого из объектов совокупности, с одной стороны, и описанием совокупности по её общим свойствам, совсем не требующим её расчленения на отдельные объекты, — с другой. По сравнению с первым способом статистические данные всегда в большей или меньшей степени обезличены и имеют лишь ограниченную ценность в случаях, когда существенны именно индивидуальные данные (например, учитель, знакомясь с классом, получит лишь весьма предварительную ориентировку о положении дела из одной статистики числа выставленных его предшественником отличных, хороших, удовлетворительных и неудовлетворительных оценок). С другой стороны, по сравнению с данными о наблюдаемых извне суммарных свойствах совокупности статистические данные позволяют глубже проникнуть в существо дела. Метод исследования, опирающийся на рассмотрение статистических данных о тех или иных совокупностях объектов, называется статистическим. Статистический метод применяется в самых различных областях знания.

26. Выборочный метод Общее понятие о выборочном методе. Множество всех единиц совокупности, обладающих определенным признаком и подлежащих изучению, носит в статистике название генеральной совокупности. На практике по тем или иным причинам не всегда возможно или же нецелесообразно рассматривать всю генеральную совокупность. Тогда ограничиваются изучением лишь некоторой части ее, конечной целью которого является распространение полученных результатов на всю генеральную совокупность, т. е. применяют выборочный метод. Для этого из генеральной совокупности особым образом отбирается часть элементов, так называемая выборка, и результаты обработки выборочных данных (например, средние арифметические значения) обобщаются на всю совокупность. Теоретической основой выборочного метода является закон больших чисел. В силу этого закона при ограниченном рассеивании признака в генеральной совокупности и достаточно большой выборке с вероятностью, близкой к полной достоверности, выборочная средняя может быть сколь угодно близка к генеральной средней. Закон этот, включающий в себя группу теорем, доказан строго математически. Таким образом, средняя арифметическая, рассчитанная по выборке, может с достаточным основанием рассматриваться как показатель, характеризующий генеральную совокупность в целом. Разумеется, не всякая выборка может быть основой для характеристики всей совокупности, к которой она принадлежит. Таким свойством обладают лишь репрезентативные (представительные) выборки, т. е. выборки, которые правильно отражают свойства генеральной совокупности. Существуют способы, позволяющие гарантировать достаточную репрезентативность выборки. Как доказано в ряде теорем математической статистики, таким способом при условии достаточно большой выборки является метод случайного отбора элементов генеральной совокупности, такого отбора, когда каждый элемент генеральной совокупности имеет равный с другими элементами шанс попасть в выборку. Выборки, полученные таким способом, называются случайными выборками. Случайность выборки является, таким образом, существенным условием применения выборочного метода.

27. Точечные оценки параметров генеральной совокупности Оценка параметра — определенная числовая характеристика, полученная из выборки. Точечной называют статистическую оценку, которая определяется одним числом. В качестве точечных оценок параметров генеральной совокупности используются соответствующие выборочные характеристики. Теоретическое обоснование возможности использования этих выборочных оценок для суждений о характеристиках и свойствах генеральной совокупности дают закон больших чисел и центральная предельная теорема Ляпунова. Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки. Смещенной называют точечную оценку, математическое ожидание которой не равно оцениваемому параметру. Выборочная средняя является точечной оценкой генеральной средней, т. е. Несмещенной оценкой генеральной средней (математического ожидания)служит выборочная средняя. Генеральная дисперсия имеет две точечные оценки: — выборочная дисперсия, которая исчисляется при н30; S^2 — исправленная выборочная дисперсия, которая исчисляется при n < 30. Причем в математической статистике доказывается, что При больших объемах выборки и S^2практически совпадают. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия. Генеральное среднее квадратическое отклонение также имеет две точечные оценки: — выборочное среднее квадратическое отклонение и S — исправленное выборочное среднее квадратическое отклонение. используется для оценивания при п 30, a S для оценивания при п < 30; пpи этом

28. Интервальные оценки параметров генеральной совокупности Интервальной оценкой называют оценку, которая определяется двумя числами — концами интервала, который с определенной вероятностью накрывает неизвестный параметр генеральной совокупности. Интервал, содержащий оцениваемый параметр генеральной совокупности, называют доверительным интервалом. Для его определения вычисляется предельная ошибка выборки , позволяющая установить предельные границы, в которых с заданной вероятностью (надежностью) должен находиться параметр генеральной совокупности.

Предельная ошибка выборки равна t-кратному числу средних ошибок выборки. Коэффициент t позволяет установить, насколько надежно высказывание о том, что заданный интервал содержит параметр генеральной совокупности. Если выбирается коэффициент таким, что высказывание в 95% случаев окажется правильным и только в 5% — неправильным, то говорится, что: со статистической надежностью в 95% доверительный интервал выборочной статистики содержит параметр генеральной совокупности. Статистической надежности в 95% соответствует доверительная вероятность — 0,95. В 5% случаев утверждение «параметр принадлежит доверительному интервалу» будет неверным, т. е. 5% задает уровень значимости () или 0,05 вероятность ошибки. Обычно в статистике уровень значимости выбирают таким, чтобы он не превысил 5% (α < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания. С помощью доверительного интервала можно оценить не только генеральную среднюю, но и другие неизвестные параметры генеральной совокупности.

29. Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака X по выборочной средней при известном среднем квадратическом отклонении а генеральной совокупности (на практике — при большом объеме выборки, т. е. при п 30) и собственно-случайном повторном отборе формула (5.5) примет вид (6.6) где tопределяется по таблицам функции Лапласа (приложение 2) из соотношения ; — среднее квадратическое отклонение; п — объем выборки (число обследованных единиц).

30 Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака X по выборочной средней при известном среднем квадратическом отклонении генеральной совокупности (при большом объеме выборки, т. е. при п 30) и собственно-случайном бесповторном отборе формула (5.6) примет вид.

(6.7)

Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака Xпо выборочной средней при неизвестном среднем квадратическом отклонении генеральной совокупности (на практике — при малом объеме выборки, т. е. при п < 30) и собственно-случайном повторном отборе формула (6.6) будет иметь вид (6.8) где tопределяется по таблицам Стьюдента (приложение 5), по уровню значимости и числу степеней свободы k = п - 1; — исправленное выборочное среднее квадратическое отклонение; п — объем выборки. Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака X по выборочной средней при неизвестном среднем квадратическом отклонении генеральной совокупности (при малом объеме выборки, т. е. при п < 30) и собственно-случайном бесповторном отборе формула (5.8) примет вид(6.9) Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле w = m/п (при большом объеме выборки, т. е. при п 30) и собственно-случайном повторном отборе формула (6.5) будет иметь видгде tопределяется по таблицам функции Лапласа (приложение 2) из соотношения 2Ф0(t) =; w— выборочная доля; п — объем выборки (число обследованных единиц); Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле w= т/п (при большом объеме выборки, т. е. при п 30) и собственно-случайном бесповторном отборе формула (5.10) примет вид,(6.11) Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле w ~ т/п (при малом объеме выборки, т. е. при п < 30) и собственно-случайном повторном отборе формула (6.10) примет видгде tопределяется по таблицам Стьюдента (приложение 5), по уровню значимости а = 1 - и числу степеней свободы k — п - 1. Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле w= т/п (при малом объеме выборки, т. е. при п < 30) и собственно-случайном бесповторном отборе формула (6.12) будет иметь вид

31. Доверительный интервал для дисперсии По закону c 2 ("хи-квадрат") распределена сумма n квадратов независимых нормально распределенных величин, каждая из которых имеет математическое ожидание, равное 0, и дисперсию, равную 1. Очевидно, у этого закона один параметр n , получивший название - "число степеней свободы". Используя элементарные знания теории вероятностей, легко показать, что математическое ожидание Mc 2n = n , дисперсия Dc 2n = 2n , плотность распределения p(c 2n ) имеет один максимум, который при n = 1 и n = 2 лежит в точке c 2n = 0, а затем с ростом n сдвигается в сторону увеличения c 2n . При очень больших n (n > 30) распределение, как следует из центральной предельной теоремы, практически неотличимо от нормального с соответствующими значениями матeматического ожидания и дисперсии. Можно показать , что комбинация Здесь: n - объем выборки; Sx2 - оценка дисперсии результата измерения х, определенная по формуле (1.2) ; s 2 - "истинная" дисперсия результата измерения, т.е. оцениваемый параметр, который нам не известен; символ " ~ " здесь и в дальнейшем использован для сокращения записи вместо слов "распределено по закону". Рассмотрим на примере, как закон (2.1) можно использовать для построения доверительного интервала для дисперсии. Допустим, что мы создали новую установку для измерения длины волны l в оптическом спектре. Нас интересует оценка случайной погрешности измерений на этой установке, т.е. какова дисперсия значений длин волн, полученных на нашей установке. Осветим установку источником с паспортизованной длиной волны (например,

l 0= 632,8 нм) и выполним 5 измерений. Получим выборку из пяти значений: l 1= 633.1 нм, l 2 = 632.9 нм, l 3 = 633.4 нм, l 4 = 633.3 нм, l 5= 632.5 нм. Вычислим согласно (1.1) и (1.2): = 633.04 нм, Sl 2 = 0.128 нм2 .

32. Проверка статистической гипотезы о мат ожидании нормального распределения при известной дисперсии Применение критерия сравнения двух выборочных средних при известных и равных дисперсиях предусматривает вычисление статистики где , - объем -й выборки, В случае принадлежности наблюдений нормальным законам статистика подчиняется стандартному нормальному закону.

33. Проверка гипотезы о равенстве дисперсии Проверяемая гипотеза о постоянстве дисперсии выборок объема имеет вид: . (1) а конкурирующая с ней гипотеза – (2) где неравенство выполняется, по крайней мере, для одной пары индексов , Статистика для проверки гипотезы имеет вид Степенями свободы для распределения статистики являются число выборок и . В [Закс Л.] приводятся таблицы процентных точек для статистик, заимствованные из [Pearson E.S., Hartley H.O.

34.Проверка статистической значимости. Выборочного коэффициента корреляции Проверкой статистической значимости выборочной оценки  параметра  генеральной совокупности называется проверка статистической гипотезы H0:  =0,при конкурирующей гипотезе H1:   0. Если гипотеза H0 отвергается, то оценка  считается статистически значимой. Пусть имеются две случайные величины  и , определенные на множестве объектов одной и той же генеральной совокупности, причем обе имеют нормальное распределение. Задача заключается в проверке статистической гипо­тезы об отсутствии корреляционной зависимости между случайными величинами  и : H0:  = 0; H1:   0. Здесь  – коэффициент линейной корреляции.Производится выборка объема n и вычисляется выборочный коэффициент корреляции r. За статистический критерий принимается случайная величина , которая распределена по закону Стьюдента с n – 2 степенями свободы. Отметим сначала, что все возможные значения выборочного коэффициента корреляции r лежат в промежутке [–1;1]. Очевидно, что относительно большие отклонения в любую сторону значений t от нуля получаются при относительно больших, то есть близких к 1, значениях модуля r. Близкие к 1 значения модуля r противоречат гипотезе H0, поэтому здесь естественно рассматривать двустороннюю критическую область для критерия t. По уровню значимости  и по числу степеней свободы n – 2 находим из таблицы распределения Стьюдента значение tкр. Если модуль выборочного значения критерия tв превосходит tкр, то гипотеза H0 отвергается и выборочный коэффициент корреляции считается статистически значимым. В противном случае, то есть если tв < tкр и принимается гипотеза H0, выборочный коэффициент корреляции считается статистически незначимым.

Соседние файлы в предмете Теория вероятностей и математическая статистика