Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
lection.DOC
Скачиваний:
22
Добавлен:
23.08.2019
Размер:
2.5 Mб
Скачать

5. Меры рассеивания

В отличии от мер центральной тенденции меры рассеивания показывают насколько данные неоднородны, изменчивы или различны. По этой причине меры рассеивания иногда называют мерами изменчивости и вместе с мерами центральной тенденции их называют параметрами распределения. Они являются не только параметрами описания распределения случайной величины, но и входят как составляющие во многие другие статистические меры.

5.1. Размах. Самой простой из таких мер является размах (d)– разность между минимальным и максимальным значением случайной величины в данном распределении. Совершенно очевидно, что два распределения, имеющие одинаковые средние арифметические, медиану и моду могут различаться по размаху, т.к. меры центральной тенденции не показывают насколько данные разбросаны на числовой оси.

Размах показывает насколько широк диапазон значений случайной величины, но в ряде случаев важно знать где находится основная часть наблюдений, и тогда можно воспользоваться другой мерой рассеивания – полумеждуквартильным размахом (полуинтерквартильное отклонение). Полумеждуквартильный размах – это половина разности между первым и третьим квартилем, который показывает, в каких пределах находится около 50% наблюдений.

Недостатком этих мер является то, что при их подсчете не учитываются все значения случайной величины, поэтому распределения, имеющие равные меры центральной тенденции и размах не обязательно будут одинаковы. Более показательны при описании неоднородности данных другие меры рассеивания: среднее отклонение (MD), дисперсия( ), стандартное (среднеквадратическое) отклонение( ),. В расчетах этих мер используется центральное отклонение – разность каждого значения случайной величины со средним арифметическим данного распределения.

5.2. Среднее отклонение. Представляет собой отношение суммы модулей центральных отклонений к числу наблюдений и вычисляется по формуле:

Очевидно, что для двух разных распределений, характеризующихся одинаковыми ранее описанными параметрами, среднее отклонение будет больше в том случае, если в распределении чаще встречаются удаленные от среднего значения.

5.3. Дисперсия. Среднее отклонение является полезной мерой рассеивания, однако используется реже, чем дисперсия – отношение суммы квадратов центральных отклонений к числу наблюдений. (''Байесовский'' метод для вычисления дисперсии генеральной совокупности). В том случае, если исследователь имеет дело не с генеральной совокупностью, а с выборкой, формула дисперсии будет немного иная – отношение суммы квадратов центральных отклонений не к n, а к n–1 (т.н. ''несмещенная'' оценка дисперсии):

Дисперсия входит как параметр распределения в ряд важных статистических критериев, но для описания данных психологических экспериментов используется значительно реже, чем стандартное отклонение.

5.4. Стандартное отклонение. Стандартное отклонение представляет собой корень из дисперсии:

Стандартное отклонение, пожалуй, одна из наиболее часто используемых мер рассеивания, благодаря тем свойствам, которые оно имеет для нормального распределения. В описании психологических переменных, стандартное отклонение часто используется как показатель границ большинства значений или условной нормы, что является особенно важным в психологии личности, исследованиях интеллекта и т.д. В настоящее время практически все важные стандартизированные психодиагностические шкалы (шкала Т-баллов, шкала стенов, шкала IQ и т.д.) созданы с учетом стандартного отклонения.

5.5. Стандартная оценка или нормированное отклонение. В отличии от физики и других естественных наук психологические переменные часто не имеют собственных единиц измерения. Если время реакции испытуемого можно измерить в секундах, и сравнить результаты исследования двух человек между собой, а также с известными из научной литературы данными, то показатель в 28 баллов по вновь созданному тесту тревожности, вряд ли кому-либо будет о чем-либо говорить. Можно будет сказать, что этот результат на 14 баллов меньше, чем 42 балла, полученных другим испытуемым, но и в этом случае невозможно сравнить эти данные с результатами этих же испытуемых по другим тестам тревожности и сказать, насколько велика эта разность.

Для решения этой проблемы существуют т.н. стандартные оценки(z). Стандартная оценка не является мерой рассеивания всего распределения, т.к. существует для оценки отклонения каждого значения от среднего в нормализованной шкале, где среднее арифметическое равно нулю, а стандартное отклонение – единице. Такая шкала может быть получена путем перевода каждого значения случайной величины в значение, представляющее собой отношение разности данного значения со средним (центрального отклонения) к стандартному отклонению распределения:

В таком случае, среднее арифметическое будет равняться нулю, а основная масса значений окажется в пределах от –1 до +1. Стандартные оценки редко бывают больше +2 и меньше –2, поэтому в отношении каждого значения можно сказать – редкое оно в данном распределении или частое, и в какую сторону от среднего находится – в большую, или в меньшую. Если в рассмотренном выше примере окажется, что баллу первого испытуемого соответствует стандартная оценка –0.254, а второму +1.23, то становится ясно, что первый результат в выборке испытуемых более частый, несколько ниже среднего и соответствует границам условной нормы, а второй – встречается реже и достаточно высокий, и кроме того, разность в 14 баллов оказалась больше одного стандартного отклонения.

5.6. Асимметрия. Это мера ''косости'' или ''скошенности'' распределения. Распределения, отличающиеся одинаковыми средними и отклонениями могут быть, тем не менее разными, поскольку ни модуль, ни квадрат разности не показывают, с какой стороны от среднего находилось отдельное значение случайной величины. В тех случаях, когда количество значений больших среднего превышает количество значений меньших, чем среднее, говорят о положительной асимметрии, в противном случае – об отрицательной. Асимметрия вычисляется как отношение среднего кубов центральных отклонений к кубу стандартного отклонения:

В симметричном распределении асимметрия точно равна нулю, но в зависимости от того, как изменяются разности значений со средним, знак асимметрии меняется на положительный или отрицательный (т.к. при возведении в куб знак сохраняется).

5.7. Эксцесс. Эта мера ''выпуклости'' или ''крутости'' распределения. При всех одинаковых других параметрах, два распределения могут различаться тем, что полигон частот будет островершинным или плоским, т.е. мода может оказаться равной, но встречаться с разной частотой. Эксцесс служит для того, чтобы определить крутизну кривой, описывающей распределение, в окрестностях единственной моды, т.к. предназначен только для унимодальных распределений. Эксцесс рассчитывается по формуле:

Особенностью всех мер рассеивания является то, что линейное преобразование значений случайной величины никак не сказывается на значениях этих мер, т.е. если к каждому значению случайной величины прибавляется или отнимается какое-либо число, то все отклонения, дисперсия, асимметрия и эксцесс останутся прежними.

Таблица 5.1. Пример расчета мер центральной тенденции, квартилей и мер рассеивания.

n

X

1

21

-7

7

49

-343

2401

2

23

-5

5

25

-125

625

3

24

-4

4

16

-64

256

4

34

6

6

36

216

1296

5

21

-7

7

49

-343

2401

6

31

3

3

9

27

81

7

33

5

5

25

125

625

8

35

7

7

49

343

2401

9

41

13

13

169

2197

28561

10

10

-18

18

324

-5832

104976

11

39

11

11

121

1331

14641

12

37

9

9

81

729

6561

13

24

-4

4

16

-64

256

14

25

-3

3

9

-27

81

15

36

8

8

64

512

4096

16

21

-7

7

49

-343

2401

17

21

-7

7

49

-343

2401

18

45

17

17

289

4913

83521

19

22

-6

6

36

-216

1296

20

17

-11

11

121

-1331

14641

Суммы

560

0

158

1586

1362

273518

Расчет мер центральной тенденции и квартилей распределения:

Md = 24.5 Mo = 21 Q1 = 21 Q2 = 24.5 Q3 = 35.5

Расчет мер рассеивания:

Относительно данного распределения можно сказать, что:

  1. Распределение унимодальное;

  2. Основная масса значений находится в пределах (одного стандартного отклонения) от 19 до 37, а 50% наблюдений – от 21 до 35.5;

  3. Оно характеризуется положительной асимметрией, что означает, что более выражены отклонения в большую от среднего арифметического сторону;

  4. Распределение “пологое” (отрицательный эксцесс), т.е. значения случайной величины распределены по числовой шкале достаточно равномерно.

Необходимо сказать, что рассчитанные в этом примере меры могут оказаться полезными при сравнении между собой двух распределений одной и той же случайной величины, полученных в разных условиях, и тогда можно будет заключить, в каком из двух распределений большее среднее, где рассеивание значений больше (или меньше), какие значения встречаются чаще и т.д.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]