Практика 2.Тема 2. Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок.
1.Проверка согласованности данных с нормальным распределением 1
2. Графический анализ. Диаграмма «Короб с усами». 5
3. Доказательная статистика. 8
4. Отношение правдоподобий. 11
5. Планирование эксперимента 12
Анализ качества статистических данных.
Статистический анализ начинается с выбора методов обработки данных. Существуют параметрические и непараметрические методы. Выбор методов зависит от характера распределения исследуемых выборок. В статистическом анализе параметрические методы используются в том случае, если данные подчиняются закону нормального распределения, в противном случае применяются непараметрические методы. По - этому перед началом работы с нашими данными необходимо провести тест на нормальное распределение.
1.Проверка согласованности данных с нормальным распределением
Программ РAST(путь)
Ввод данных:
Выделите необходимые столбцы, скопируйте, перейдите в рабочее меню программы PAST, на вкладкеEditвыберите командуPaste.Также можно использовать стандартные команды обмена данными(Ctrl + C ; Ctrl + V). Для того, чтобы присвоить столбцам имена, отметьте флажокEdit labels. Поля в первой строке станут доступными для изменения. Введите имена столбцов. Снимите флажок.
Ваша форма должна выглядеть так, как показано на рис.1.
Рисунок 1 Ввод данных в программу PAST.
Гистограмма.
На главном меню найдите вкладку Plot(график). Эта вкладка содержит все возможные графики, которые строятся в программеPAST. Выделите нужный столбец, выберитеHistogram. Откроется форма, представленная на рисунке 2. Отметьте флажокFitnormal, для того чтобы отобразилась кривая распределения.
Рисунок 2 Гистограмма для первой выборки
XStartиXEnd– соответственно наименьшее и наибольшее значение в исследуемой выборке.
Bins– количество столбцов. Здесь столбцы обозначают количество наблюдений в определенном интервале.
Проанализируйте получившийся график. Насколько кривая приближается к нормальному распределению?
Закройте окно с диаграммой.
Сравнение значений с нормальным распределением.
Откройте вкладку Plot. КомандаNormal probability plot.
Проанализируйте график: красная линия изображает нормальное (гауссово) распределение. Чем ближе точки к данной линии, тем больше распределение выборки приближается к нормальному. См Рисунок 3.
Рисунок 3 График сравнения значений с нормальным распределением.
Анализ по критериям. Для проверки согласованности закона распределения используются следующие критерии:
Шапиро – Уилкоксона – наиболее мощный критерий;
Жарка – Бера – критерий проверки симметрии распределения:
Монте – Карло
Хи – квадрат – для выборок большого объема.
Выделите столбец с данными. Выберите: Past – Statistics - Normality test.
Таблица 1. Критерии согласованности с нормальным распределением.
N, объем выборки. |
19 |
Shapiro-Wilk W |
0,933 |
p(normal) |
0,1971 |
Jarque-Bera JB |
0,8963 |
p(normal) |
0,6388 |
p(Monte Carlo) |
0,4794 |
Chi^2 |
0,57895 |
p(normal) |
0,44673 |
Chi^2 OK (N>20) |
NO |
Проанализируйте получившиеся p– значения. Если величинаp<0,05, то распределение выборки отлично от нормального. Наиболее показательноp- значение для критерия Шапиро – Уилкоксона, но иp- значения для других критериев стоит учитывать. Для нашего примера критерии представлены в таблице 1 .
Далее определим, насколько отличаются наши выборки, иными словами, можно ли утверждать о принадлежности данных по матерям и детям к разным генеральным совокупностям. Для этого проведем графический анализ с помощью диаграммы «boxplot».