4.3. Этапы и методы анализа данных
Первичный экспериментальный материал, подготовленный педагогом-психологом, нуждается в соответствующей обработке, которая называется анализом данных.
Анализ данных- это совокупность действий, осуществляемых исследователем в процессе изучения какой-либо проблемы исследования с целью формирования определенного представления о характере описываемого явления. Основнаяцельанализа данных - выявление (подтверждение, корректировка) каких-то интересующих исследователя статистических закономерностей, проверка статистических гипотез.
Методы анализа данных (информации)– это совокупность приемов, способов и действий, участвующих в систематизации, обобщении и представлении эмпирических данных.
В процессе подготовки и анализа данных, как правило, присутствуют следующие основные этапы:
1. Сбор первичных данных для анализа.Наблюдая и измеряя характеристики объекта, педагог-исследователь собирает первичный статистический материал. Дальнейшая задача состоит в выдвижении статистической гипотезы на основании темы и цели исследования.
2. Ввод данных в компьютер. Полученные эмпирические данные результатов психолого-педагогических исследований необходимо ввести в компьютер и сохранить. Ввод данных может осуществляться ручным набором чисел с клавиатуры или же экспортом из файла в каком-либо формате.
Отметим возможность использования для ввода и обработки результатов педагогического исследования табличного редактора Microsoft Excel [2, 3, 6, 7]. Книга MS Excel должна носить имя этапа исследования и обрабатываемой выборки (например, контрольная группа на констатирующем этапе). Листы в книге MS Excel рекомендуется называть именем класса, группы, для которой проводится ввод эмпирических данных в табличный редактор.
Введенные в MS Excel результаты обычно отображаются в виде таблицы или матрицы данных, где столбцы представляют различные переменные (например, номер п/п, фамилия и инициалы, количество ошибок в тесте, количество правильно решенных задач), а строки – измерения значений этих переменных у испытуемых.
3. Преобразование данных. На данном этапе проводится группировка данных, то есть распределение их на однородные группы в соответствии с интересующими исследователя признаками. Данные в каждой группе упорядочиваются - классифицируются, сортируются, структурируются, подсчитывается частота событий. Нередко также требуется удаление из введенных данных высокоамплитудных значений, которые могут быть результатом некорректных измерений или замена пропущенных (неизмеренных) значений.
Процесс систематизации результатов эксперимента, объединение их в относительно однородные группы по некоторому признаку называется группировкой. От того, как группируются исходные данные, во многих случаях зависят выводы о свойствах и параметрах изучаемого объекта, явления, признака. Группировка должна быть обдуманной, отвечать требованию поставленной задач и соответствовать содержанию изучаемого явления [4,c. 36].
Группировкапроизводится для того, чтобы построить эмпирическое распределение и сформировать с его помощью предположения о форме распределения изучаемого признака в генеральной совокупности, из которой взята выборка.
Поэтому вопрос о выборе числа и ширины интервалов группировки приходится решать в каждом конкретном случае исходя из целей исследования, объема выборки и степени варьирования признака в выборке.
Однако приблизительно число интервалов k можно оценить исходя только из объема выборки n. Делается это одним из следующих способов:
1) по формуле Стержеса: k = 1 + 3,32 lg n;
2) с помощью таблицы:
-
Объем выборки, n
Число интервалов, k
25–40
40–60
60–100
100–200
Больше 200
5–6
6–8
7–10
8–12
10–15
Если число интервалов выбрано, то ширина каждого из них определяется по следующей формуле:
,
где h – ширина интервалов, k – число интервалов; xmaxи xmin– максимальное и минимальное значение выборки.
Числа, показывающие, сколько раз варианты, относящиеся к каждому интервалу группировки, встречаются в выборке, называются частотами интервалов.
Также на данном этапе можно построить дискретный вариационный ряд – ранжированный в порядке возрастания (или убывания) ряд дискретных значений признака с соответствующими им частотами.Рядв статистике – это числовые данные, показывающие изменения показателей во времени или в пространстве и дающие возможность производить статистическое сравнение показателей.
Накопленная частота интервала – это число, полученное последовательным суммированием частот в направлении от первого интервала к последнему, до того интервала включительно, для которого определяется накопленная частота.
Частостью (относительной частотой) называется отношение частоты интервала к объему выборки. Сумма всех частостей всегда равна 1.
Накопленной частостью называется отношение накопленной частоты к объему выборки. Графически полученные распределения можно представить в виде гистограммы или полигона частот.
4. Визуализация данных – наглядное представление данных. Для этого можно использовать как табличное представление, так и различные формы графического изображения. Методы наглядного представления данных будут рассмотрены в разделе 4.4.
5.Статистический анализ– это научный метод мысленного или реального разделения изучаемого предмета, явления, процесса на составные элементы, признаки, свойства, отношения, которые затем исследуются путем анализа количественных и качественных характеристик каждого из них в отдельности и во взаимосвязи с целым для получения нового знания или систематизации уже имеющихся знаний.
Предметстатистического анализа – совокупность качественных и количественных характеристик (показателей, параметров) в их единстве и развитии.Статистическая обработкаполученных количественных данных заключается в вычислении некоторых статистических характеристик и оценок, позволяющих проверить гипотезу исследования.
6. Интерпретация и представление результатов. В работе исследователя, занимающегося проблемами психологии и педагогики, самой сложной считается задача интерпретации полученного и обработанного фактического материала. К сожалению, педагоги-исследователи нередко избегают этап обсуждения фактов и переходят сразу к выводам.
Конечно, хорошо обработанные материалы, упорядоченные и оформленные в таблицы, статистические и математические расчеты могут служить базой для выводов. Однако без всестороннего обсуждения, с ходом которого должен быть ознакомлен читатель, выводы будут мало или вовсе необоснованными и неубедительными, да и сам исследователь многое теряет. Из поля его зрения выпадают ценные характеристики фактического материала, которые невидимы, то есть визуально не просматриваются, но существенно влияют на выводы.
Основная цель интерпретации— выявление и фиксирование комплекса характеристик обработанного материала, на основе которых открывается возможность обнаружить и объяснить основные тенденции и сформулировать выводы.