Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Belyaeva_O_A__Khakhalkina_U_V_Metodichka_Met_mat_statist_v_psikh-ped_naukakh_vesna_2015.doc
Скачиваний:
298
Добавлен:
10.03.2016
Размер:
4.32 Mб
Скачать

Тема 2. Меры измерения

Цель: Научиться вычислять основные меры измерения, используемые в психолого-педагогических исследованиях.

Задачи:

1. Познакомиться с основными мерами центральной тенденции и усвоить правила их нахождения.

2. Познакомиться с основными мерами изменчивости и усвоить правила их нахождения.

3. Выработать умение распределять данные на уровни относительно среднего арифметического и среднего квадратического отклонения выборки.

4. Познакомиться с понятием «нормальное распределение» и возможностями проверки распределения на нормальность.

Теория по каждому вопросу

1. К мерам центральной тенденции относятся: мода, медиана и среднее арифметическое значение.

Мода – это такое значение в множестве наблюдений, которое встречается наиболее часто. Обозначается Мо

Совокупность значений может иметь одну моду (унимодальная выборка).

Примеры:

1) Совокупность значений

5, 6, 6, 8, 9, 11, 11, 11, 11, 12, 15, 15, 16 имеет Мо=11;

2) В случае, когда два соседних значения имеют одинаковую наибольшую частоту, то мода есть среднее арифметическое этих значений. Так совокупность значений 2, 2, 4, 5, 6, 6, 6, 8, 8, 8, 10, 11 имеет Мо=(6+8)/2=7.

Совокупность значений может иметь две моды (бимодальная выборка), в случае, когда два несмежных значения в выборке имеют наибольшую одинаковую частоту. Например, совокупность значений 3, 4, 4, 4, 5, 8, 9, 9, 9, 11 имеет Мо1=4 и Мо2=9.

Совокупность значений может и не иметь моды, в случае, когда все значения в группе встречаются одинаково часто (или достаточно большое количество значений имеют наибольшую одинаковую частоту).

Медиана – представляет собой 50-й процентиль в группе данных. Это значение, которое делит упорядоченное множество пополам. Обозначается Мd.

Вычисление лучше выполнять не на сгруппированных данных. Если данные определены с точностью до десятой доли (сотой и так далее), то значения лучше умножить на 10 (100 и так далее), а результат потом поделить на 10 (100 и так далее). Вычисление выполняется по тем же правилам, что и вычисление любой другой процентили (см. стр.9-10).

Среднее арифметическое значение – это сумма всех значений выборки, поделенная на количество этих значений.

Обозначается Х и вычисляется по формуле:

хi- i-е значение выборки;

i – порядковый номер значения в выборке;

n – объем выборки.

Например, найдем среднее арифметическое значение для данных, представленных в таблице 1. Выпишем их в упорядоченном виде:

6, 7, 7, 7, 8, 8, 9, 9, 9, 10, 10, 10, 10, 10, 11, 11, 12, 12, 12, 14

Можно формулу преобразовать для случая, когда значения повторяются.

yi – i-я варианта выборки,

fi – частота i-й варианты,

k – количество вариант.

Так, для нашего случая мы получаем:

2. К мерам изменчивости относятся размах, дисперсия, среднее квадратическое отклонение, асимметрия, эксцесс.

Размах – это расстояние на числовой шкале, в пределах которого изменяются оценки. Обозначается R и вычисляется по формуле:

max – максимальное значение; min – минимальное значение;

прибавляется 1 или 0.1, или 0.01 и так далее в зависимости от того, с какой точностью определено значение.

Например, в совокупности значений

7, 9, 3, 6, 6, 2, 5 – R=9-2+1=8;

в совокупности значений

4.3, 2, 5.1, 6.2, 8.1, 5, 3.8 – R=8.1-2+0.1=6.2

Дисперсия – мера разброса данных вокруг среднего арифметического значения. Обозначается S2x и вычисляется по формуле:

или .

Первая формула удобна, когда вычислено среднее арифметическое значение, а вторая - когда нет необходимости вычислять это значение.

Среднее квадратическое отклонение (стандартное отклонение) – данная мера тесно связана с дисперсией, так как является квадратным корнем из нее. Обозначается s и вычисляется по формуле:

или

Вторая формула используется в тех случаях, когда многие значения повторяются.

Распределение на уровни. На основании вычисления среднего арифметического значения и среднего квадратического отклонения можно значения выборки распределить на уровни: высокий (В), выше среднего (ВС), средний (С), ниже среднего (НС) и низкий (Н). Так, к высокому уровню относятся все значения, которые больше или равны Х+s т.е.

В: xi³X+s;

ВС: X+0,5s<xi<X+s;

C: X-0,5s£xi£X+0,5s;

НС: X-s<xi<X-0,5s;

Н: xi£X-s.

Так, например, для данных

2, 4, 8, 3, 5, 6, 2, 5, 5, 7, 5, 3, 1, 4, 3, 3, 4, 3, 5, 1, 6, 4, 2, 5

X=4, s=1,8 (n=24), тогда

В: xi³5,8 это xi равные 6, 7, 8 (nв=4 – 16,7%);

ВС: 4,9<xi<5,8 это xi равные 5 (nвс=6 – 25%);

C: 3,1£xi£4,9 это xi равные 4 (nс=4 – 16,7%);

НС: 2,2<xi<3,1 это xi равные 3 (nнс=5 – 20,8%);

Н: xi£2,2 это xi равные 1, 2 (nн=5 – 20,8%).

Рис. 7. Симметричный и асимметричные распределения.

Асимметрия – мера, показывающая степень и направление асимметричности графика. Обозначается А и находится по формуле:

.

Для симметричных распределений А=0 (рис.7 а); при левосторонней асимметрии А<0 (рис.7 б) – в распределении чаще встречаются более низкие значения признака; при правосторонней асимметрии А>0 (рис.7 в) – более высокие.

Эксцесс – греческое слово, обозначающее свойство остроконечности кривой. Обозначается Е и находится по формуле:

.

В тех случаях, когда какие-либо причины способствуют преимущественному проявлению средних или близких к средним значений, образуется распределение с Е>0 (рис.8 а). Если же в распределение преобладают крайние значения, причем одновременно и более низкие и более высокие, то такое распределение характеризуется Е<0 (рис 8 б). В распределениях с нормальной выпуклостью Е=0 (рис. 8, а и б, серая линия).

Рис. 8. Распределения с разным эксцессом.

3. Нормальное распределение – это график уравнения:

u – высота кривой прямо над всяким заданным значением Х на графике распределения частот;

m - среднее арифметическое значение;

s - среднее квадратическое отклонение.

График данного уравнения является симметричным и средневершинным.

Приведем пример графика с m=0 и s=1 (рис. 9).

Нормальная кривая – это изобретение математики, довольно хорошо описывающая полигон частот измерений нескольких различных переменных. В практике же получение такое кривой нереально. Чаще всего в ходе исследования мы получаем лишь приближенное к нормальному распределение. Существуют способы проверки распределения на нормальность. Приведем один из них.

Рис. 9. График нормального распределения.

Для этого необходимо подсчитать асимметрию и эксцесс, а также их ошибки репрезентативности (ma me) по формулам:

и .

Если отношение асимметрии и эксцесса к своим ошибкам репрезентативности меньше трех, то данное распределение не отличается от нормального, т.е. должны выполняться одновременно следующие условия:

и .

Задачи:

2.1. Найти моду, медиану и среднее арифметическое значение следующего множества:

1.2, 1.5, 1.6, 2.1, 2.4, 2.4, 2.7, 2.8, 3.0, 3.0, 3.0, 3.1, 3.1, 3.1, 3.4.

2.2. Найти размах, среднее квадратическое отклонение, асимметрию и эксцесс для следующего множества значений:

8, 5, 14, 8, 9, 11, 10, 15, 16, 9, 7, 13, 17, 13, 10.

2.3. Найти моду и медиану для следующего множества:

15, 18, 18, 19, 16, 17, 14, 18, 12, 15, 16, 15, 19, 13, 18, 15.

2.4. Найти дисперсию, используя обе формулы ее вычисления для следующего множества значений:

6, 9, 4, 6, 5, 2, 8, 3, 7, 8, 10, 4, 8, 4, 8.

2.5. Проверить распределение на нормальность:

2, 5, 9, 9, 8, 10, 6, 8, 4, 6, 7, 5, 4, 5, 6.

2.6. Распределить в задаче 1.1. (табл.9) данные на уровни высокий, выше среднего, средний, ниже среднего и низкий.