Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Матметоды в гуманит0 / Занятие 4 / Стандартизируем тест_Статья_Попов_Олег

.doc
Скачиваний:
58
Добавлен:
21.03.2015
Размер:
56.83 Кб
Скачать

Стандартизируем тест: процентили, стэны, станайны, T-баллы, IQ-баллы

Автор статьи: Попов Олег Александрович.

Представьте, что Вы изучаете рост спортсменов на соревнованиях, для чего используете их анкеты. В анкете американца указан рост в дюймах, англичанина в футах, украинца в сантиметрах. Ваши первые действия? Скорее всего, Вы переведёте рост всех спортсменов в сантиметры по следующим формулам:

Рост в см = рост в дюймах * 2,54

Рост в см = рост в футах * 30,48

Заранее отметим, что обе формулы имеют одинаковое математическое происхождение, а именно – отражают линейное (пропорциональное) преобразование по формуле прямой y=kx+b, только коэфициент b в нашем случае равен нулю.

Представьте себе, что вы сравниваете показатели трёх тестов тревожности. В одном тесте 25 вопросов, в другом 10, а третий тест – это физиологический показатель электрического сопротивления кожи (это объективный показатель тревожности, измеряется в Омах). Как сопоставить результаты этих тестов? Скорее всего, Вам придётся перевести эти показатель в единую шкалу измерения.

Методам сведения разнородных показателей к единой шкале и посвящена эта статья.

 

Каждый из нас знает, что для измерения расстояния используется стандартная единица, называемая миллиметром, а для измерения веса – грамм. При этом большинство из тех, кто сталкивался с тестами интеллекта, знают, что показателем интеллекта является IQ, он же – балл, полученный за выполнение набора заданий. IQ – это стандартная единица измерения интеллекта.

Непосредственное количество правильно решенных заданий (для тестов интеллекта) или непосредственно подсчитанных балов (для личностных тестов) называется сырым баллом. В большинстве тестов сырой балл переводится в удобный стандартизированный балл.

К примеру, полученный сырой балл теста интеллекта переводится в IQ либо с помощью таблицы, в которой указаны соответствия сырого балла и IQ, либо с помощью специальной формулы:

 

IQ=15∙(x-m)/σ + 100.

где:

IQ – стандартный балл в тестах интеллекта;

x – полученное в результате тестирования значе;

m – среднее арифметическое в выборке стандартизации;

σ – стандартное отклонение в выборке стандартизации

 

Чтобы вычислить IQ по данной формуле, необходимо знать m (среднее арифметическое) и σ (стандартное отклонение), рассчитанные на большой выборке, называемой ещё выборкой стандартизации. К примеру в тесте прогрессивных матриц Равена, кроме таблиц перевода даётся ещё и два нужных нам значения. Зная формулу, можно не использовать таблицы.

Заметим, что приведённая формула очень напоминает уравнение для построения прямой, знакомое нам по школьному курсу: y = k∙x + b. В этом уравнении k задаёт наклон линии, а b начало её построения. В действительности, формула перевода в стандартные IQ баллы является формулой линейного (пропорционального) изменения исходных параметров и построена на основе формулы прямой.

Учитывая, что существуют не только стандартные IQ баллы, мы можем указать общую формулу для перевода любых сырых баллов в стандартные:

 

Станд.балл = σнов. ∙ (x-m)/σ + m нов.

 

Для расчетов по этой формуле нам необходимо:

1. Иметь среднее арифметическое теста, рассчитанное на большой выборке (m).

2. Иметь стандартное отклонение, рассчитанное на большой выборке (σ).

3. Иметь единичный результат (x).

4. Иметь представление о том стандартном балле, в который мы переводим сырое значение, т.е. знать σнов. и mнов.

Существуют несколько стандартных шкал. С одной мы уже знакомы - это IQ, в которомm= 100 и σ = 15. Другой очень распространённой шкалой являются T-баллы, для которых m= 50 и σ = 10. В основе формулы перевода баллов лежит уравнение перевода в z-шкалуz = (x-m)/σ, при этом предполагается, что mнов. = 0 и σнов. = 1. IQ и Т-баллы являются традиционными шкалами, но на самом деле мы можем произвольно выбирать новые m и σ. Главное сообщать конечному пользователю параметры нашей стандартизации.

Другим, не менее распространённым методом стандартизации, является преобразование в станайны (standart nine – стандартная девятка). В этом случае формула может не использоваться. Как и в предыдущих случаях, для тандартизации сырых баллов теста необходимо иметь выборку стандартизации. Полученные значения упорядочиваются от меньшего к большему, затем выборка разбивается на неравномерные интервалы с числом случаев, пропорциональным частотам в нормальном распределении. Эти интервалы даны ниже:

Процент выборки

4

7

12

17

20

17

12

7

4

Накопленный процент

4

11

23

40

60

77

89

96

100

Станайн

1

2

3

4

5

6

7

8

9

Допустим, мы узнали, что первые 4% выборки имеют баллы от 0 до 7. Тогда в таблицу перевода сырых баллов в стены записываем 0-7 баллов - 1 станайн.

Как видим, процедура достаточно формальна и требует лишь механических действий по упорядочиванию выборки и нахождению конкретного процента людей от всей выборки. Впрочем, мы можем обойтись и без таблицы, используя для расчетов формулу стандартизации с m=5 σ=2.

Другой распространённой шкалой являются стэны, для которых m= 5,5 и σ = 2 (стен – от англ. sten, сокр. standart ten – стандартная десятка). Для перевода в стэны можно использовать формулу стандартизации, но чаще всего используют более формальную процедуру: находят среднее (m), стандартное отклонение (σ), от среднего в обе стороны отсчитывают по пять интервалов по σ/2 (половине σ). Получившиеся 10 интервалов и являются стэнами.

Выбор типа шкалы зависит от исходных данных. Если сырой балл принимает значения от 0 до 100 и мы стандартизируем его в стэны или станайны, то явно теряем слишком много информации, т.к. внутри одного стандартного интервала может находиться достаточно много сырых баллов. Это неприемлемо. Поэтому, при большом диапазоне сырых баллов используются Т-баллы. В тестах интеллекта традиционно используется IQ, если интервал значенний сырых баллов невелик, то можно использовать стены или станайны.

Стандартизация может происходить и без участия стандартных и известных всем шкал, а основываться на любых произвольных среднем и стандартном отклонении, хотя большинство авторов, пошедших путём реобразования результатов теста, используют Т-баллы, стены либо станайны.

Многие тесты познавательных способностей, а так же некоторые личностные опросники используют нелинейное преобразование при стандартизации полученных сырых значений. Достоинство нелинейного преобразования в том, что нам не нужно задумываться как распределены баллы теста – нормально или нет.

Типичной нелинейной шкалой являются процентили, получившие очень широкое распространение в психодиагностике за счет своей наглядности и простоты восприятия.

Процентиль – это процент значений в выборке, меньших, либо равный конкретно взятому значению.

Для построения таблицы перевода сырых баллов в процентили необходимо выполнить следующий алгоритм:

1.                 Упорядочить выборку по убыванию (для удобства).

2.                 Для каждого человека найти количество людей, набравших меньше, либо столько же баллов.

3.                 Для каждого человека подсчитать, какой процент занимает это количество от всей выборки.

Полученный показатель процентиля интерпретируется так:

если испытуемый набрал Х процентилей, то он обогнал по своим показателям Х процентов всех испытуемых.

Мы рассмотрели самые сложные методы стандартизации, применяемые в наиболее профессиональных психологических тестах. Однако, в большинстве методик, особенно небольших, стандартизация ограничивается банальным выделением 3-5 уровней, обозначаемых как «высокие», «средние», «низкие» баллы.

Методика получения таких «уровневых» норм очень проста и осуществляется на основе уже знакомых нам показателей m и σ и свойствах нормального распределения.

При нормальном распределении, в интервал m±1σ попадает 68,26% всей выборки. Этот интервал и принимается за средние баллы. Все значения до него относятся к низким, а выше него – к высоким. Таким образом получаем три градации баллов. Для подобной стандартизации можно использовать интервал m±⅔σ, тогда в средние попадает 50% выборки и по 25 в низкие и высокие баллы. Каким будет интервал – выбор самого исследователя. Разделение на 4 интервала осуществляется подобным образом, граница между вторым и третьим интервалом проходит по среднему арифметическому.

Разделение на пять уровней применяется при сильном разбросе данных. Тогда добавляется интервал m±2σ.

Недостатком «уровневой» стандартизации является то, что полученные уровни с трудом поддаются последующей статистической обработке и слишком малоинформативны. «Средний» балл может быть как приближен к низкому, так и к высокому, а значит люди всё же будут слишком сильно различаться, несмотря на средний балл.

Зачем нужна стандартизация? Вполне логичный вопрос, тем более, что сейчас можно встретить много тестов (особенно в популярных журналах), в которых подсчитываются сырые баллы, без всякой стандартизации. Точнее в этих тестах можно увидеть рассмотренные выше интервалы баллов, но если присмотреться, то эти интервалы равномерны (к пр. 0-3, 4-6, 7-9 баллов), а значит авторы теста лишь создали видимость стандартизации и не потрудились проверить работоспособность теста.

Стандартизация необходима по нескольким причинам:

1. Когда тест содержит несколько шкал, далеко не всегда эти шкалы включают одинаковое количество заданий, кроме того не все шкалы будут иметь одинаковое среднее арифметическое. Чтобы можно было отобразить эти шкалы на едином графике-профиле, либо просто выяснить их соотношение они должны быть приведены к одной единице измерения, что и производится в процессе стандартизации.

2. Существует множество тестов, измеряющих одно и то же свойство. Для возможности сопоставления результатов этих тестов необходимо перевести результаты их всех в одну и ту же единицу измерения. Это успешно реализовано в разнообразных тестах интеллекта, которые используют IQ как универсальную шкалу. К сожалению, в личностных опросниках такого единогласия фактически нет.

3. Стандартизированные шкалы удобны для анализа. Любой, даже неопытный человек гораздо лучше воспринимает процентиль, чем сырой балл (именно поэтому так популярны процентили), а в профессиональном анализе результатов тестов стандартизация повышает скорость аналитической работы.

4. Тест применяется для сравнения результатов со средним и для определения степени, в которой результаты отклоняются от среднего. Если этих показателей нет, то тест оказывается бессмысленным.

Соседние файлы в папке Занятие 4