Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция №5.Математическая статистика.doc
Скачиваний:
8
Добавлен:
19.11.2018
Размер:
563.71 Кб
Скачать

2. Методы индуктивной статистики

Результаты обработки экспериментального материала методами описательной статистики требуют проверки надежности полученных выводов. Пусть в приведенном примере вывод о большей эффективности новой методики обучения делается на основании сравнения средних значений уровня обученности для двух выборок. Разумеется, нет абсолютных гарантий, что, повторив эксперимент на других двух выборках, мы придем к такому же выводу. Всегда имеется вероятность ошибки заключения. Индуктивная статистика пытается дать ответ на вопрос «велика ли такая вероятность».

Для изложения этой методики нам потребуются некоторые вспомогательные понятия.

Доверительный уровень принятая в данной области науки или техники предельно допустимая вероятность  ошибки вывода. В гуманитарных науках принят доверительный уровень 5 % (0,05). В других областях требования к надежности выводов жестче: 3 или даже 1 процент. Абсолютной гарантии статистика не дает.

Степени свободы независимые переменные или значения в вариационном ряду. Если в ряду n чисел, то независимыми являются только п–1 число, поскольку одно из чисел может быть найдено через остальные числа и среднее значение. Число =п–1 называется количеством степеней свободы для выборки объема п. Для двух независимых выборок (составленных из разных объектов) объемом соответственно п1 и n2 число степеней свободы находится как сумма

=1+2=(п1–1)+(п21)= п1+ п22.

Параметрические методы основаны на использовании в анализе показателей (параметров) распределения. Параметрические методы пригодны только для выборок с нормальным распределением.

Метод Стьюдента

Вычисляется отношение разницы средних по двум независимым выборкам к их суммарной погрешности

. (6)

Этот показатель Стьюдента сравнивается с табличным значением для заданного доверительного уровня (например, =0,05) и числа степеней свободы  (см. приложение). Значение доверительной вероятности в данной таблице надо выбирать по строке для одностороннего распределения.

Пример. Пусть M1=16,0; M2=11,3; n1=n2=15; 1=4,07; 2=4,25; = n1+n2–2=28; /2=0,05.

Расчетное значение ; табличное

Сравнение указывает на достоверность разницы.

3. Корреляционный анализ

Корреляционный анализ — это статистическая методика выявления зависимости между двумя случайными величинами.

Д

а) б) в)

Рис. 5.

инамическая зависимость
однозначная. Так, зная закон движения грузовика (s=vt), можно вполне однозначно вычислить пройденный к любому моменту времени путь. График зависимости можно построить, рассчитав координаты нескольких точек. Для равномерного движения графиком будет наклонная прямая.

Статистическая зависимость неоднозначна, потому, что завуалирована множеством неизвестных нам случайных факторов. Примером может служить зависимость между ростом и весом человека. Встречаются люди с одинаковым ростом, но с разным весом, а также люди с разным весом, но с одинаковым ростом. График в таких случаях построить невозможно, поскольку точки располагаются в координатной плоскости в виде беспорядочно облачка. На рисунке 5 показаны точечные диаграммы: а) неполная положительная корреляция — прослеживается тенденция роста величины y с ростом x; б) неполная отрицательная корреляция; в) отсутствие корреляции — облачко круглое. В статистике такую зависимость называют корреляцией.

В частном случае, когда корреляция полная, мы приходим к динамической зависимости.

Корреляция устанавливается аналитически вычислением так называемого коэффициента корреляции по формуле Пирсона

.

Величина коэффициента r находится на отрезке [-1; 1]. Крайние значения отвечают полной корреляции. Корреляция отсутствует, если r=0. При других значениях корреляция неполная. Отрицательному значению r отвечает отрицательная корреляция. Ниже в таблице приводится качественная интерпретация различных интервалов значений модуля коэффициента r.

Значение |r|

0

(0; 0,3]

(0,3; 0,65]

(0,65; 0,9]

(0,9; 1)

1

Интерпретация корреляции

Нет

Слабая, практически нет

Умеренная

Сильная

Очень сильная

Полная

Следует заметить, что формула коэффициента корреляции довольно сложна и требует большого числа промежуточных расчетов. Покажем методику расчетов по этой формуле.

Предварительно вычисляются средние арифметические значения для обеих случайных величин. Достраиваем таблицу данных и в дополнительных столбцах зафиксируем результаты промежуточных расчетов (Таблица данных выделена жирным шрифтом).

Икс

Игрек

x-xср

y-yср

(x-xср)2

(y-yср)2

(х-хср,)(yср)

3

11

-6

-9

36

81

54

7

9

-2

-11

4

121

22

15

35

6

15

36

225

90

13

16

4

-4

16

16

-16

12

30

3

10

9

100

30

6

10

-3

-10

9

100

30

10

42

1

22

1

484

22

15

27

6

7

36

49

42

2

9

-7

-11

49

121

77

7

11

-2

-9

4

81

18

Средние

9

20

Суммы по столбцам:

200

1378

369

Найденные суммы по трем последним столбцам подставляются в формулу:

.