Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lupandin_V_I_Matematicheskie_metody_v_psikhologi.doc
Скачиваний:
457
Добавлен:
12.03.2016
Размер:
2.97 Mб
Скачать

Раздел 3. Подготовка данных к математической обработке

Прежде чем приступать к математической обработке результатов психологического исследования, экспериментальный материал необходимо соответствующим образом подготовить. При этом психологу следует соблюдать два непременных условия. Во-первых, данные должны быть представлены в наиболее компактной, удобной для обработки форме. Во-вторых, при упорядочении данных должен быть сохранен максимум содержащейся в них информации.

Подготовка данных к математической обработке включает в себя ряд последовательных этапов: протоколирование, табулирование данных, создание таблиц сгруппированных частот, построение диаграмм или полигона распределения частот и т. д. Рассмотрим все этапы более подробно.

3. 1. Протоколирование данных

Если психолог имеет под рукой персональный компьютер, задача протоколирования значительно упрощается. Любой программист может составить соответствующую базу данных, и все необходимые сведения о каждом испытуемом можно заносить в компьютер. Несомненное удобство компьютерного варианта состоит в том, что в любой момент можно извлекать информацию об интересующем нас контингенте испытуемых – по полу, возрасту, социальной принадлежности и др. При отсутствии такой возможности на каждого испытуемого составляется отдельный протокол.

В протоколе необходимо отмечать фамилию и инициалы испытуемого, пол и возраст (за исключением случаев анонимного обследования, когда указываются только инициалы, пол и возраст). Несоблюдение этих требований делает невозможным дальнейший анализ результатов (в тех случаях, когда нас интересует связь исследуемой переменной с возрастом и полом испытуемых).

Весьма желательно указывать в протоколе дату исследования. Это особенно важно в тех случаях, когда исследование одной и той же выборки проводится повторно (период времени между повторными исследованиями, например, две недели или полгода) имеет большое значение, особенно когда речь идет о детях.

В некоторых случаях необходимо указывать время суток, когда проводилось исследование. Так, некоторые психологические и психофизиологические переменные (время сенсомоторной реакции, концентрация и переключаемость внимания, объем оперативной памяти и др.) в значительной мере зависят от уровня активности субъекта, степени его утомления, которые далеко не одинаковы в разное время суток.

При необходимости в протоколе следует отмечать условия опыта (проводилось ли исследование индивидуально или в группе, наличие внешних помех и т. д.). Все другие данные о каждом или отдельных испытуемых исследователь отмечает по своему усмотрению, т. е. фиксируется то, что психолог считает наиболее важным.

3. 2. Составление сводных таблиц (табулирование данных)

Использование индивидуальных протоколов для математической обработки результатов не очень удобно. Для того, чтобы представить материал в более компактном виде, данные сводятся в итоговую таблицу следующего вида:

№№

п/п.

Фамилия, имя, отчество

Другие данные

(если необходимо)

Исследуемый

показатель

1

2

3

n

В ряде случаев перед составлением сводной таблицы проводится ранжирование данных. Оно, в частности, необходимо при определении квантилей (см. подраздел 3.3). Для этого данные выстраиваются в общий ряд по исследуемому признаку в порядке его возрастания (или убывания) следующим образом: х1 х2 х3 ... хn (или наоборот), где n – общее число значений признака (объем выборки). Знак «меньше или равно» предполагает, что у разных испытуемых могут встречаться одинаковые значения переменной.

Иногда даже итоговые таблицы могут оказаться довольно громоздкими и не вполне удобными для дальнейшей обработки. В этом случае материал можно сделать еще более компактным, составляя частотные таблицы (таблицы распределения частот исследуемого признака):

№№ пп.

1

2

3

4

...

n – 1

n

xi

fi

В первой строке дается номер значения переменной в ранжированном ряду, во второй – конкретное значение (величина признака) и в третьей – частота встречаемости признака (число одинаковых значений признака в выборке).

Для того чтобы полученные данные представить в еще более компактном виде, используются таблицы распределения сгруппированных частот. Для составления такой таблицы необходимо:

1) общий диапазон изменения признака разделить на ряд поддиапазонов (классов) при условии, что ширина всех классов должна быть одинакова;

2) определить границы классов и их число в общем диапазоне;

3) подсчитать частоты встречаемости признака в каждом классе.

Обычно для построения распределения сгруппированных частот используется 7 – 15 классов. Для наиболее точного разбиения диапазона на классы (если в дальнейшем предполагаются математические операции с этими классами) можно использовать формулу Стэрджесса: N = 1 + 3,322 lg n, где n – объем выборки (количество значений признака), а N – количество классов. Так, например, если n = 100, то N = 1 + 3,322 × 2 » 8.

Пример

На выборке испытуемых численностью 100 человек определялся коэффициент интеллекта (IQ). Минимальное значение IQ оказалось равным 72, а максимальное – 134. Для составления таблицы сгруппированных частот используем 8 классов (в соответствии с формулой Стэрджесса). Определяем общий диапазон изменения признака – он будет соответствовать разнице между минимальным и максимальным значениями: 134 – 72 = 62. Следовательно, в каждый класс должно попадать по 8 значений признака (при разбиении на классы можно слегка расширить диапазон с тем расчетом, чтобы в каждом классе оказалось одинаковое число значений и чтобы крайние значения не оказались за пределами диапазона). В соответствии с этим определяем границы классов и составляем таблицу сгруппированных частот:

Номер класса (N)

1

2

3

...

8

Границы класса (xmin ¸ xmax)

72  79

80 87

8895

...

128 135

Среднее значение (х¯ )

75,5

83,5

91,5

...

131,5

Частоты ( fi )

1

7

32

...

2

Накопленные частоты ( Fi )

1

8

40

100

Накопленные частоты, приведенные в 5-й строке, могут быть использованы в некоторых статистических расчетах (например, для вычисления критерия l по Колмогорову). Накопленные частоты вычисляются путем простого суммирования частот от 1-го до N-го класса: F1 = f1; F2 = f1 + f2; F3 = f1 + f2 + f3 и т. д.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]