Психометрические основы психодиагностики
План:
Понятие о психометрии
Стандартизация
Надежность и валидность
Основные типы данных в психодиагностике
Понятие о психометрии
Психометрия (психометрика) (от греч. — душа и мера) — область психологии, связанная с теорией и практикой измерения психических явлений. Понятие психометрии было введено в 1734 с Христианом Вольфом: он впервые указал на возможность измерения в психологии.
Одними из первых параметров в психологии были измерения времени реакции. В силу этого первоначально психометрия понималась как измерение временных характеристик психических процессов. По мере развития психологического эксперимента к психометрии начинают относить все, что связано с количественным определением психических явлений. При таком понимании, весьма распространенном и сегодня, психометрия включает весь спектр психологических измерений — от психофизических до личностных.
По мере усложнения психологических параметров, подлежащих измерению и совершенствованию специальных математико-статистических процедур, разрабатываемых в рамках тестологии, содержание психометрии начинает отождествляться с тестологией. Именно развитие тестологии в начале 1930 г. способствовало формированию особой области психометрии, которая имеет дело с индивидуальными психологическими различиями.
Эта область психометрии получила название дифференциальной психометрии. Она включает проблемы определения и обоснования требований к оценке индивидуально-психологических различий в психологической диагностике. К основным направлениям дифференциальной психометрии относятся: 1) общая теория измерения психологических феноменов; 2) концептуализация и алгоритмизация процедур конструирования средств измерения; 3) психометрическая адаптация этих средств к новым условиям использования; 4) анализ задач тестирования; 5) обеспечение их валидности, надежности и стандартизации.
1 . Показатели качества психологического измерения
Для оценки качества диагностических (или исследовательских) процедур используется ряд показателей: стандартизация, валидность, достоверность, надежность, репрезентативность. Каждый из них характеризует определенные размерности качества диагностики.
Стандартизация
Диагностическая методика отличается от любой исследовательской тем, что она стандартизована. Стандартизация — это единообразие процедуры проведения и оценки выполнения теста. Рассматривается она в двух планах: как выработка единых требований к процедуре эксперимента и как определение единого критерия оценки результатов диагностических испытаний.
Стандартизация процедуры диагностического эксперимента подразумевает единообразие инструкций, бланков и других материалов испытания и обследования, способов регистрации результатов, условий проведения испытания.
Наиболее важным условием обеспечения единообразия процедуры тестирования является предварительная подготовка. При тестировании не должны возникать непредвиденные обстоятельства. Предварительная подготовка к сеансу тестировании принимает множество форм:
1. При проведении большинства индивидуальных тестов необходимо инструкцию выучить наизусть. Даже в групповом тесте, когда инструкция зачитывается диагностом, предварительное ознакомление его с текстом предупреждает неправильное прочтение, запинание и позволяет вести себя более непринужденно и естественно.
2. Подготовка тестовых материалов. В индивидуальном тестировании, особенно при проведении тестов действия, такая подготовка включает размещение необходимых материалов с тем, чтобы свести к минимуму их поиски или неловкое обращение с ними. Как правило, материалы должны располагаться на столе вблизи места тестирования таким образом, чтобы они были легко доступны проводящему тест, но не отвлекали внимания обследуемого. При проведении группового тестирования все тестовые бланки, листы для ответов, карандаши и другие материалы заранее должны быть тщательно проверены, пересчитаны и разложены на рабочих местах испытуемых.
3. Еще одна важная форма подготовки к тестированию - подробное знакомство с процедурой проведения конкретного теста.
Условия тестирования. Стандартизация затрагивает не только словесные инструкции, время выполнения заданий, материалы и другие аспекты самих тестов, но и обстановку тестирования. Определенное внимание нужно уделить выбору подходящего для тестирования помещения. Оно должно быть изолировано от чрезмерного шума и всего, что отвлекает внимание; в нем необходимо создать подходящее освещение, обеспечить вентиляцию, организовать удобные рабочие места для испытуемых. Следует также принять специальные меры, предотвращающие прерывание тестирования (установка на двери специального предупреждающего знака эффективна лишь тогда, когда все знают, что такой знак запрещает входить в помещение при любых обстоятельствах). При тестировании больших групп можно запереть двери.
Важно четко представлять себе возможную степень влияния условий тестирования на тестовые показатели. Даже кажущиеся незначительными аспекты тестовой ситуации могут заметно влиять на выполнение теста. Например, использование парт или кресел с откидным столиком, повлиял на результаты группового тестирования учащихся средних школ; в группах, сидевших за партами, они оказались выше; тип использованных бланков для ответов может влиять на тестовые показатели (бывают случаи, когда при проведении тестирования вместо бланков, применявшихся в процессе стандартизации теста, используются бланки ответов, приспособленные для машинной обработки). Использование таких бланков не может проходить без эмпирической проверки их эквивалентности.
Еще более существенные различия обнаруживаются при предъявлении одних и тех же тестов в бланковом и компьютерном вариантах..
Множество других, менее очевидных условий тестирования также могут влиять на выполнение тестов способностей и личностных тестов. Результаты могут существенно измениться в зависимости от того, проводит ли тестирование совершенно незнакомый испытуемым человек или кто-то из тех, кого они уже знают. Также обнаружено, что манера поведения экзаменатора влияет на результаты тестирования. В проективном тесте, где от испытуемого требовалось написать истории к предъявляемым картинкам, присутствие психолога-диагноста в комнате часто приводило к снижению эмоциональной окрашенности содержания этих историй.
К числу требований, которые необходимо соблюдать при проведении эксперимента, надлежит отнести, например, такие:
1) инструкции следует сообщать испытуемым одинаковым образом, как правило, письменно; в случае устных указаний они даются в разных группах одними и теми же словами, понятными для всех, в одинаковой манере;
2) ни одному испытуемому не следует давать никаких преимуществ перед другими;
3) в процессе эксперимента не следует давать отдельным испытуемым дополнительные пояснения;
4) эксперимент с разными группами следует проводить по возможности в одно и то же время дня в сходных условиях;
5) временные ограничения в выполнении заданий для всех испытуемых должны быть одинаковыми и т. д.
Обычно авторы методики в руководстве приводят точные и подробные указания по процедуре ее проведения. Формулирование таких указаний составляет основную часть стандартизации новой методики, так как только строгое их соблюдение дает возможность сравнивать между собой показатели, полученные разными испытуемыми.
Можно сделать следующие выводы. Во-первых, необходимо придерживаться стандартизованных процедур даже в мелочах, обязанность создателя теста и издателя — добиться того, чтобы такие процедуры были полно и ясно описаны в руководстве к тесту.
Во-вторых, следует регистрировать любые нестандартные условия тестирования, какими бы второстепенными они ни казались.
В-третьих, при интерпретации результатов теста важно учитывать условия тестирования. При всестороннем обследовании личности в процессе индивидуального тестирования опытный диагност иногда отступает от стандартной процедуры проведения теста, с тем чтобы получить особо интересующую его дополнительную информацию. Поступив таким образом, он теряет право интерпретировать результаты теста на основе сопоставления с тестовыми нормами. В этом случае тестовые задания используются только для качественного исследования, а реакции испытуемого необходимо рассматривать точно так же, как любые другие неформальные наблюдения за поведением или как данные интервью.
Другим наиболее важным этапом в стандартизации методики является выбор критерия, по которому следует проводить сравнение результатов диагностических испытаний, поскольку диагностические методики не имеют заранее определенных стандартов успешности или неудачи в их выполнении.
Например, ребенок шести лет, выполняя тест умственного развития Стенфорд—Бине, получил балл, равный 117. Как это понимать? Хорошо это или плохо? Часто ли такой показатель встречается у детей данного возраста?
Количественный результат, как таковой, ничего не означает. Полученный дошкольником балл нельзя интерпретировать как показатель относительно высокого, среднего или низкого уровня развития, так как это развитие выражено в мерах, присущих данной методике, и, таким образом, абсолютного значения полученные результаты иметь не могут. Поэтому, нужно располагать точкой отсчета и какими-то дозированными мерами, чтобы с их помощью оценивать полученные при диагностировании индивидуальные и групповые данные. Возникает вопрос: что брать за эту точку отсчета? В традиционном тестировании такая точка добывается статистическим путем — это так называемая статистическая норма.
Стандартизация диагностической методики, ориентированной на норму, осуществляется путем ее проведения на большой представительной выборке испытуемых, которая ничем не отличается от той, для которой данная методика предназначена. На этой группе испытуемых, называемой выборкой стандартизации, высчитываются нормы, указывающие не только средний уровень выполнения задания, но и относительную вариативность выше и ниже среднего уровня. В результате можно оценить разные степени успешности или неуспешности в выполнении диагностической пробы. Это позволяет определить положение конкретного испытуемого относительно выборки стандартизации.
Так, статистическая норма для тестов Стенфорд—Бине определялась на выборке, которая состояла из испытуемых в возрасте от 2,5 до 18 лет; в нее входило 4498 человек. В результате большой и трудоемкой работы с применением аппарата математической статистики (вычисления проводились на основе кривой нормального распределения) были определены границы возрастных норм умственного развития. Они находятся в диапазоне от 84 до 116. Интерпретируется это так: результаты испытуемых, которые не выходят за эти границы, находятся в пределах нормы. Те, чьи результаты менее 84, находятся ниже нормы, а те, чьи результаты более 116, — выше нормы.
Вернемся к результату, полученному ребенком шести лет, о котором упоминалось выше. Его успешность по тесту Стенфорд—Бине равна 117. Этот результат выше нормы, но очень незначительно (верхняя граница нормы 116).
В психодиагностике существует и другой подход к оценке результатов диагностических испытаний. В нашей стране под руководством К. М. Гуревича разрабатываются тесты, в которых в качестве точки отсчета выступает не статистическая норма, а независимый от результатов испытания, объективно заданный социально-психологический норматив. Социально-психологический норматив реализуется в совокупности заданий, составляющих тест. Следовательно, сам тест в полном его объеме и является таким нормативом. Все сопоставления индивидуальных или групповых результатов тестирования проводятся с тем максимумом, который представляется в тесте (а это полный набор знаний). В качестве критерия оценки выступает показатель, отражающий степень близости результатов к нормативу. Имеется разработанная схема представления групповых количественных данных.
Для анализа данных относительно их близости к социально-психологическому нормативу, условно рассматриваемому как 100%-ное выполнение всего теста, все испытуемые подразделяются по результатам тестирования на пять подгрупп:
1) наиболее успешные— 10 % (от 91 до 100 % выполнения теста);
2} близкие к успешным — 20 % (от 71 до 90 %);
3) средние по успешности — 40 % (от 31 до 70 %);
4) малоуспешные — 20 % (от 11 до 30 %);
5) наименее успешные —10 % (от 0 до 10 %).
Для каждой подгруппы подсчитывается средний процент правильно выполненных заданий. Эти данные переносятся на график. Строится система координат, где по оси абсцисс идут номера подгрупп, по оси ординат — средний процент выполненных каждой из подгрупп заданий. После нанесения соответствующих точек вычерчивается график, отражающий приближение каждой из подгрупп к социально-психологическому нормативу. Такая обработка проводится по результатам как теста в целом, так и каждого субтеста в отдельности.