- •Математическая статистика.
- •Последовательность обработки данных
- •2. Методы индуктивной статистики
- •Метод Стьюдента
- •3. Корреляционный анализ
- •III. Контрольные задания
- •1 Вариант
- •2 Вариант
- •3 Вариант
- •4 Вариант
- •5 Вариант
- •6 Вариант
- •7 Вариант
- •8 Вариант
- •9 Вариант
- •10 Вариант
- •IV. Рекомендуемая литература
- •Приложение Значения критерия Стьюдента t.
2. Методы индуктивной статистики
Результаты обработки экспериментального материала методами описательной статистики требуют проверки надежности полученных выводов. Пусть в приведенном примере вывод о большей эффективности новой методики обучения делается на основании сравнения средних значений уровня обученности для двух выборок. Разумеется, нет абсолютных гарантий, что, повторив эксперимент на других двух выборках, мы придем к такому же выводу. Всегда имеется вероятность ошибки заключения. Индуктивная статистика пытается дать ответ на вопрос «велика ли такая вероятность».
Для изложения этой методики нам потребуются некоторые вспомогательные понятия.
Доверительный уровень — принятая в данной области науки или техники предельно допустимая вероятность ошибки вывода. В гуманитарных науках принят доверительный уровень 5 % (0,05). В других областях требования к надежности выводов жестче: 3 или даже 1 процент. Абсолютной гарантии статистика не дает.
Степени свободы — независимые переменные или значения в вариационном ряду. Если в ряду n чисел, то независимыми являются только п–1 число, поскольку одно из чисел может быть найдено через остальные числа и среднее значение. Число =п–1 называется количеством степеней свободы для выборки объема п. Для двух независимых выборок (составленных из разных объектов) объемом соответственно п1 и n2 число степеней свободы находится как сумма
=1+2=(п1–1)+(п2–1)= п1+ п2–2.
Параметрические методы основаны на использовании в анализе показателей (параметров) распределения. Параметрические методы пригодны только для выборок с нормальным распределением.
Метод Стьюдента
Вычисляется отношение разницы средних по двум независимым выборкам к их суммарной погрешности
. (6)
Этот показатель Стьюдента сравнивается с табличным значением для заданного доверительного уровня (например, =0,05) и числа степеней свободы (см. приложение). Значение доверительной вероятности в данной таблице надо выбирать по строке для одностороннего распределения.
Пример. Пусть M1=16,0; M2=11,3; n1=n2=15; 1=4,07; 2=4,25; = n1+n2–2=28; /2=0,05.
Расчетное значение ; табличное
Сравнение указывает на достоверность разницы.
3. Корреляционный анализ
Корреляционный анализ — это статистическая методика выявления зависимости между двумя случайными величинами.
Д
а)
б)
в)
Рис. 5.
Статистическая зависимость неоднозначна, потому, что завуалирована множеством неизвестных нам случайных факторов. Примером может служить зависимость между ростом и весом человека. Встречаются люди с одинаковым ростом, но с разным весом, а также люди с разным весом, но с одинаковым ростом. График в таких случаях построить невозможно, поскольку точки располагаются в координатной плоскости в виде беспорядочно облачка. На рисунке 5 показаны точечные диаграммы: а) неполная положительная корреляция — прослеживается тенденция роста величины y с ростом x; б) неполная отрицательная корреляция; в) отсутствие корреляции — облачко круглое. В статистике такую зависимость называют корреляцией.
В частном случае, когда корреляция полная, мы приходим к динамической зависимости.
Корреляция устанавливается аналитически вычислением так называемого коэффициента корреляции по формуле Пирсона
.
Величина коэффициента r находится на отрезке [-1; 1]. Крайние значения отвечают полной корреляции. Корреляция отсутствует, если r=0. При других значениях корреляция неполная. Отрицательному значению r отвечает отрицательная корреляция. Ниже в таблице приводится качественная интерпретация различных интервалов значений модуля коэффициента r.
Значение |r| |
0 |
(0; 0,3] |
(0,3; 0,65] |
(0,65; 0,9] |
(0,9; 1) |
1 |
Интерпретация корреляции |
Нет |
Слабая, практически нет |
Умеренная |
Сильная |
Очень сильная |
Полная |
Следует заметить, что формула коэффициента корреляции довольно сложна и требует большого числа промежуточных расчетов. Покажем методику расчетов по этой формуле.
Предварительно вычисляются средние арифметические значения для обеих случайных величин. Достраиваем таблицу данных и в дополнительных столбцах зафиксируем результаты промежуточных расчетов (Таблица данных выделена жирным шрифтом).
|
Икс |
Игрек |
x-xср |
y-yср |
(x-xср)2 |
(y-yср)2 |
(х-хср,)(y-уср) |
|
3 |
11 |
-6 |
-9 |
36 |
81 |
54 |
|
7 |
9 |
-2 |
-11 |
4 |
121 |
22 |
|
15 |
35 |
6 |
15 |
36 |
225 |
90 |
|
13 |
16 |
4 |
-4 |
16 |
16 |
-16 |
|
12 |
30 |
3 |
10 |
9 |
100 |
30 |
|
6 |
10 |
-3 |
-10 |
9 |
100 |
30 |
|
10 |
42 |
1 |
22 |
1 |
484 |
22 |
|
15 |
27 |
6 |
7 |
36 |
49 |
42 |
|
2 |
9 |
-7 |
-11 |
49 |
121 |
77 |
|
7 |
11 |
-2 |
-9 |
4 |
81 |
18 |
Средние |
9
|
20
|
Суммы по столбцам: |
200
|
1378
|
369
|
Найденные суммы по трем последним столбцам подставляются в формулу:
.