Практика 2. Тема 2. Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок.
1.Проверка согласованности данных с нормальным распределением 1
2. Графический анализ. Диаграмма «Короб с усами». 4
3. Доказательная статистика. 8
4. Отношение правдоподобий. 10
5. Планирование эксперимента 11
Анализ качества статистических данных.
Статистический анализ начинается с выбора методов обработки данных. Существуют параметрические и непараметрические методы. Выбор методов зависит от характера распределения исследуемых выборок. В статистическом анализе параметрические методы используются в том случае, если данные подчиняются закону нормального распределения, в противном случае применяются непараметрические методы. По - этому перед началом работы с нашими данными необходимо провести тест на нормальное распределение.
1.Проверка согласованности данных с нормальным распределением
Программ РAST (путь)
Ввод данных:
Выделите необходимые столбцы, скопируйте, перейдите в рабочее меню программы PAST, на вкладке Edit выберите команду Paste. Также можно использовать стандартные команды обмена данными (Ctrl + C ; Ctrl + V). Для того, чтобы присвоить столбцам имена, отметьте флажок Edit labels. Поля в первой строке станут доступными для изменения. Введите имена столбцов. Снимите флажок.
Ваша форма должна выглядеть так, как показано на рис.1.
Рисунок 1 Ввод данных в программу PAST.
Гистограмма.
На главном меню найдите вкладку Plot(график). Эта вкладка содержит все возможные графики, которые строятся в программе PAST. Выделите нужный столбец, выберите Histogram. Откроется форма, представленная на рисунке 2. Отметьте флажок Fit normal, для того чтобы отобразилась кривая распределения.
Рисунок 2 Гистограмма для первой выборки
X Start и X End – соответственно наименьшее и наибольшее значение в исследуемой выборке.
Bins – количество столбцов. Здесь столбцы обозначают количество наблюдений в определенном интервале.
Проанализируйте получившийся график. Насколько кривая приближается к нормальному распределению?
Закройте окно с диаграммой.
Сравнение значений с нормальным распределением.
Откройте вкладку Plot. Команда Normal probability plot.
Проанализируйте график: красная линия изображает нормальное (гауссово) распределение. Чем ближе точки к данной линии, тем больше распределение выборки приближается к нормальному. См Рисунок 3.
Рисунок 3 График сравнения значений с нормальным распределением.
Анализ по критериям. Для проверки согласованности закона распределения используются следующие критерии:
Шапиро – Уилкоксона – наиболее мощный критерий;
Жарка – Бера – критерий проверки симметрии распределения:
Монте – Карло
Хи – квадрат – для выборок большого объема.
Выделите столбец с данными. Выберите: Past – Statistics - Normality test.
Таблица 1. Критерии согласованности с нормальным распределением.
N, объем выборки. |
19 |
Shapiro-Wilk W |
0,933 |
p(normal) |
0,1971 |
Jarque-Bera JB |
0,8963 |
p(normal) |
0,6388 |
p(Monte Carlo) |
0,4794 |
Chi^2 |
0,57895 |
p(normal) |
0,44673 |
Chi^2 OK (N>20) |
NO |
Проанализируйте получившиеся p – значения. Если величина p <0,05, то распределение выборки отлично от нормального. Наиболее показательно p- значение для критерия Шапиро – Уилкоксона, но и p- значения для других критериев стоит учитывать. Для нашего примера критерии представлены в таблице 1 . Мы видим, что p – значения достаточно велики, что бы утверждать о нормальном распределении выборки.
Далее определим, насколько отличаются наши выборки, иными словами, можно ли утверждать о принадлежности данных по матерям и детям к разным генеральным совокупностям. Для этого проведем графический анализ с помощью диаграммы «boxplot».