Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лекция-2

.pdf
Скачиваний:
13
Добавлен:
22.03.2016
Размер:
621.99 Кб
Скачать

11

явлениями. Наиболее распространенной формой группировки экспериментальных данных являются статистические таблицы (простые и сложные).

Обычно в ходе исследования исследователь измеряет признаки у множества испытуемых (объектов). Одни признаки представлены в номинативной шкале и указывают на принадлежность к определенной группе (пол, профессия, экспериментальная или контрольная группы и т.д.), а другие признаки могут быть представлены в порядковой или метрической шкале (вводятся единицы измерения). Результаты измерения для дальнейшего анализа чаще всего представляются в виде

таблицы исходных данных. Каждая строка такой таблицы обычно соответствует одному объекту (испытуемому), а каждый столбец – одному измеренному признаку.

В ходе анализа каждый признак определяется как переменная величина

(переменная), значения которой меняются от объекта к объекту.

Пример. Психолог провел социально-психологический тренинг с целью улучшения социальной сплоченности. Для измерения динамики социальной сплоченности до тренинга и после каждому школьнику был задан вопрос: «Как часто Ваше мнение совпадает с мнением твоих одноклассников?». Для ответа ученикам предлагалось выбрать один из пяти вариантов ответов: 1- никогда; 2 – редко; 3- затрудняюсь ответить; 4 – часто; 5 – всегда. Исходные данные представлены в табл.1.8.

Таблица 1.8

Показатели учеников при проведении социально-психологического

тренинга

 

Фамилия, И.О.

Класс

Пол

Самооценка

 

 

 

 

 

 

До

После

 

1

Первов П.П.

2

0

3

4

 

2

Второв В.В.

1

1

5

5

 

 

 

 

i

 

x3i

x4i

x5i

x6i

 

 

 

60

Шестидесятов Ш.Ш.

1

0

3

4

 

 

 

 

 

 

 

 

 

12

Общая численность испытуемых N=60 человек. Определялись признаки: x3i – класс (номинативный); x4i – пол (номинативный); x5i – самооценка до тренинга

(порядковый); x6i – самооценка после тренинга (порядковый).

К простым относятся таблицы, применяемые при альтернативной группировке, когда показатели одной группы испытуемых сравниваются с другой

(табл.1.9). Простые таблицы следует использовать, когда измерение изучаемых признаков производится в номинативной или ранговой шкале.

Таблица 1.9

Усредненные показатели групп испытуемых по методике «Опросник на

«выгорание» (К.Маслач и С.Джексон)

Группы

Составляющие «выгорания»

 

Эмоциональное

Деперсонализация

Редукция личных

 

истощение

 

достижений

Менеджеры

21,1

10,7

31,5

Врачи-терапевты

15,2

6,0

33

К сложным таблицам относят так называемые многопольные таблицы,

использующиеся при выяснении причинно-следственных отношений между варьирующими признаками. Примером сложной таблицы служит табл. 1.10., в

которой представлены классические данные Ф. Гальтона, иллюстрирующие наличие положительной зависимости между ростом родителей и их детей.

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 1.10

 

 

Зависимость роста детей от роста родителей

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рост родителей

 

 

 

 

Рост детей в см.

 

 

 

Всего

 

 

 

 

154

159

164

 

169

174

179

184

189

 

 

 

 

187

 

 

 

 

 

 

 

 

4

 

 

4

 

 

182

 

 

 

1

 

4

11

17

20

6

 

62

 

 

177

 

1

2

21

 

48

83

66

22

8

 

251

 

 

172

 

1

15

56

 

130

148

69

11

 

 

430

 

 

167

 

1

15

19

 

56

41

11

1

 

 

144

 

 

162

 

2

7

10

 

14

4

 

 

 

 

37

 

 

Всего

 

5

39

107

 

255

387

163

58

14

 

928

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13

Из табл. 1.10 видно, что при низком росте родителей в 167 см. только один из

144 обследованных детей имел рост в 154 см., а 56 детей имели рост 169 см. В то же время высокий рост детей (187 см.) был зафиксирован только в тех семьях, где родители имели рост не ниже 177 см.

Из табл. 1.10 можно выявить зависимость, что у высоких родителей дети имеют высокий рост, а у низкорослых родителей дети невысокого роста.

Таблицы и графики распределения частот. Анализ полученных данных начинается с изучения полученных показателей. В результате анализа определяется,

как часто встречаются признаки (переменные). Для выявления таких переменных строятся таблицы и графики распределения частот.

Если указывается, сколько раз встречается каждое значение признака, то такая таблица называется таблицей абсолютных частот распределения, если указывается доля наблюдений, приходящихся на значение признака (переменную), то говорят об

относительных частотах распределения.

Пример. Исследователь в эксперименте все ответы 60 учеников до тренинга определил и свел их в таблицу, подсчитав частоту встречаемости каждого из ответов

(табл.1.11)

Таблица 1.11

Показатели распределения частот ответов учеников в эксперименте по

изучению социально-психологического климата

Варианты ответов

faj

fоj

fсум

учеников

(абсолютная

(относительная

(накопленная

 

частота)

частота)

частота)

1

3

0,05

0,05

2

12

0,20

0,25

3

21

0,35

0,60

4

15

0,25

0,85

5

9

0,15

1,00

∑ (сумма):

60

1

-

Абсолютная и относительная частоты связаны соотношением:

fo Nfa ,

14

где fa – абсолютная частота некоторого значения признака, fо – относительная частота этого значения признака, N – число наблюдений.

Сумма всех абсолютных частот равна числу наблюдений – N, а сумма всех относительных частот равна 1. Если признак принимает множество различных значений, то частоты могут группироваться по интервалам значений признака

(табл.1.12).

Таблица 1.12

Показатели распределения частот (абсолютная, относительная,

накопленная) ответов учеников в эксперименте по изучению социально-

психологического климата

Интервал

faj

fоj

fсум

времени, с

(абсолютная

(относительная

(накопленная

 

частота)

частота)

частота)

41-50

2

0,2

0,2

51-60

6

0,6

0,8

61-70

2

0,2

1,0

∑ (сумма):

10

1,0

-

Гистограмма распределения частот – столбиковая диаграмма, каждый столбец которой (его высота) определяет конкретное значение признака или разрядный интервал (для сгруппированных частот). На рис. 1.1 изображена гистограмма распределения частот по данным табл.1.12.

Рис.1.1. Гистограмма распределения частот ответов испытуемых по вариантам самооценки (по данным табл.1.12)

15

4. Нормальный закон распределения и его применение

4.1. Меры центральной тенденции

Мера центральной тенденции – число, характеризующее выборку по уровню выраженности признака, к которым относится: мода, медиана, среднее (выборочное среднее, среднее арифметическое.

Мода – числовая характеристика выборки, встречаемая наиболее часто среди вариант. Мода обозначается Мо.

Так, например, в ряду значений (3, 6, 6, 8, 8, 8, 8, 8) модой является число 8,

которое встречается чаще любого другого числа.

Моду находят согласно следующим правилам:

1)Когда все значения в выборке встречаются одинаково часто, принято считать, что этот выборочный ряд не имеет моды. Например: 3, 3, 4, 4, 5, 5 — в этой выборке моды нет.

2)Когда два соседних (смежных) значения имеют одинаковую частоту и их частота больше частот любых других значений, мода вычисляется как среднее

арифметическое этих двух значений.

Например, в выборке 2, 4, 4, 4, 5, 5, 5, 7 частоты рядом расположенных значений 4 и 5 совпадают и равняются 3. Эта частота больше, чем частота других

значений 2 и 7. В данном случае модой ряда (2, 4, 4, 4, 5, 5, 5, 7) будет величина

 

X

=

(4 5)

 

4,5

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

3)

Если два

несмежных (не соседних)

значения в

выборке

имеют

равные

частоты,

которые

больше

частот

любого

другого значения, то выделяют две моды (бимодальная выборка). Например, в ряду

2, 3, 3, 3, 4, 5, 6, 6, 6, 7 модами являются значения 3 и 6.

Могут существовать и мультимодальные распределения, имеющие более двух вершин (мод).

16

4) Если мода оценивается по множеству сгруппированных

данных, то для нахождения моды необходимо определить группу с наибольшей частотой признака. Эта группа называется модальной группой.

Медиана — обозначается Md и определяется как величина, по отношению к которой, по крайней мере, 50% выборочных значений меньше неё и, по крайней мере, 50% — больше, т.е. медиана — это значение, которое делит упорядоченное множество данных пополам. Для лучшего усвоения понятий решим отдельные задачи.

Пример. Найдем медиану выборки: 2, 6, 9, 11, 1, 3, 7.

Решение. Сначала упорядочим выборку по величинам входящих в нее

значений. Получим: 1, 2, 3, 6, 7, 9, 11.

Поскольку в выборке семь элементов, четвертый по порядку элемент будет иметь значение больше чем первые три, и меньшее, чем последние три. Таким

образом, медианой будет четвертый элемент — 6.

Пример. Найдем медиану выборки: 1, 4, 9, 11, 13, 20.

Поскольку здесь имеется четное число элементов, то существует две

«середины» — 9 и 11. В этом случае медиана определяется как среднее арифме-

тическое этих значений.

 

 

 

 

 

 

 

Md =

9 11

 

10 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

Среднее арифметическое

- определяется как сумма всех значений измеренного

признака, деленная на количество суммированных значений.

 

Может обозначаться как

 

 

 

 

или

Mx и

подсчитывается для ряда числовых

 

X

значений X1, X2 , … Xn как:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( X

1 X 2

... X n )

 

1

 

n

 

 

 

 

 

 

 

 

X

=

 

 

 

 

 

 

 

 

 

 

 

X i .

 

 

 

 

 

n

 

n

 

 

 

 

 

 

 

 

 

 

i 1

 

Здесь величины 1, 2...n называются индексами.

Если производится суммирование всех элементов выборки от первого до последнего, то верхний и нижний пределы суммирования могут не указываться,

пишется: X или X i

17

Если же значения признака x1 , x2 ,...xk имеют соответственно частоты n1 , n2 ...nk ,

причем n1 n2 ... nk n , то

X (x1n1 x2 n2n ... xk nk ) = 1 k xi ni . n i 1

Средние величины характеризуют выборку одним (средним) числом.

Информативная значимость средних величин заключается в их способности уравновешивать все индивидуальные отклонения, в результате чего проявляется то наиболее устойчивое и типичное, что характеризует качественное своеобразие варьирующего объекта, позволяя отличить одну выборку от другой.

4.2. Меры изменчивости

Меры изменчивости численно выражают величины межиндивидуальных вариаций признака, к которым относятся: разброс (размах), дисперсия, стандартное отклонение, число степеней свободы, стандартизация или z – преобразование данных, асимметрия, эксцесс.

Разброс (размах) выборки – разность между максимальной и минимальной величинами конкретного вариационного ряда. Обозначается буквой R.

R = Xмах - Xмин

Дисперсия – мера изменчивости для метрических данных, пропорциональная сумме квадратов отклонений измеренных значений от их арифметического среднего:

n Xi X 2 . i 1

Чем больше изменчивость в данных, тем больше отклонения значений от среднего, тем больше величина дисперсии.

Величина дисперсии это среднее арифметическое квадратов отклонений значений переменной от её среднего значения (формула для генеральной,

теоретической дисперсии):

 

 

 

 

n

2

 

 

 

1

X i

X

 

 

Dx =

 

n

 

 

 

i 1

 

 

18

Где: п — объем выборки; i — индекс суммирования;

X — среднее.

Для вычисления выборочной (эмпирической) дисперсии применяется формула, которая от вышеприведенной формулы отличается знаменателем:

N

(xi X )2

D

i 1

 

.

 

 

x

n 1

 

 

Порядок вычисления дисперсии для одной выборки следующий:

1.Вычисляется среднее по выборке.

2.Для каждого элемента выборки вычисляется его отклонение от средней, т.е.

(Xi - X ).

3.Каждый элемент (Xi - X ) возводят в квадрат.

4.Находится сумма этих квадратов.

5.Эта сумма делится на общее количество членов ряда — (n-1), и получается искомая дисперсия.

С использованием дисперсии можно сравнивать выборки, различные по объему. Сама дисперсия, как характеристика отклонения от среднего, часто неудобна для интерпретации, так как ее размерность отличается от размерности признака. Для того чтобы приблизить размерность дисперсии к размерности измеряемого признака применяют операцию извлечения квадратного корня из дисперсии.

Если же значения признака x1 , x2 ,...xk имеют соответственно частоты n1 , n2 ...nk ,

причем n1 n2 ... nk n , то

 

 

1

k

 

1

k

 

Dx

 

(xi x)2 ni =

 

ni xi2 (x)2 .

(7.2)

 

 

 

 

 

n i 1

 

n i 1

 

Стандартное отклонение (сигма,

среднеквадратическое

отклонение) –

положительное значение корня из дисперсии:

19

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

( Xi

X

)2

 

x

 

Dx

 

i 1

 

 

 

(простое стандартное отклонение);

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

x

 

 

(xi

x)2 fi

(взвешенное стандартное отклонение).

fi

Размерность стандартного отклонения и размерность исходного ряда совпадают.

f

0 X1 X 2 X

Рис. 1.2. Графики распределения частот «1» и «2» (c одинаковыми средними

арифметическими ( X1 X 2 ) и разными дисперсиями (D1 < D2)

Стандартизация или z-преобразование данных – это перевод измерений в

стандартную Z - шкалу со средним X z 0 и Dz = σx = 1.

Для осуществления такого перевода данных, измеренных на выборке,

 

 

 

 

 

 

 

предварительно вычисляется среднее

 

X x , стандартное отклонение σx. Затем

значения переменных xi пересчитываются в стандартную Z – шкалу по формуле:

 

 

xi

 

x

.

zi

X

 

 

 

 

 

 

x

Полученные z-значения непосредственно выражаются в единицах стандартного отклонения от среднего, позволяют сравнивать разные признаки,

полученные по различным тестам у испытуемого. Для устранения отрицательных и дробных z-значений разработаны шкалы:

20

Характеристика шкалы

 

 

 

Показатель шкалы

- IQ (среднее 100, сигма 15);

IQ = s zi

 

 

 

s 15 * zi 100

X

 

 

 

 

 

 

 

- Т – оценка (среднее 50, сигма 10);

T = s

zi

 

 

 

 

s

10zi 50

X

 

 

 

 

 

 

- стены (10-балльная шкала) (среднее 5,5,

 

s

zi

 

 

 

 

s

2 * zi 5,5

St =

X

сигма 2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Перевод в новую шкалу осуществляется путем умножения каждого

z-

значения на заданную сигму и прибавления среднего:

 

 

 

Si s zi

X

s .

 

Асимметрия – степень отклонения графика распределения частот от симметричного вида относительно среднего значения. Если исходные переменные переведены в z – значения, показатель асимметрии определяется по формуле:

zi3

A i .

s

N

 

Если распределение симметрично, то показатель асимметрии равен 0. Когда чаще встречаются значения меньше среднего, то говорят о левосторонней

(положительной) асимметрии (As > 0). Если чаще встречаются значения больше среднего, то асимметрия – правосторонняя (отрицательная) (As < 0). Чем больше показатель асимметрии отличается от нуля, тем больше асимметрия.

Если показатель «асимметрия» определяет симметричность (скошенность)

кривой распределения, то показатель «эксцесс» определяет ее островершинность.

Эксцесс – мера плосковершинности или остроконечности графика распределения измеренного признака. Если исходные данные переведены в z-

значения, то показатель эксцесса определяется формулой:

 

zi

4

 

Ex

i

 

3 .

N