Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
42_43_44.docx
Скачиваний:
74
Добавлен:
25.03.2015
Размер:
80.82 Кб
Скачать

43 Методы первичной статистической обработки данных в психологии

Понятие и цели первичной статистической обработки данных в психологии. Упорядочивание, ранжирование, группировка, представление в табличном виде. Вычисление мер центральной тенденции, мер изменчивости.

Все методы количественной обработки принято подразделять на первичные и вторичные.

Первичная статистическая обработка нацелена на упорядочивание информации об объекте и предмете изучения. На этой стадии «сырые» сведения группируются по тем или иным критериям, заносятся в сводные таблицы. Первично обработанные данные, представленные в удобной форме, дают исследователю в первом приближении понятие о характере всей совокупности данных в целом: об их однородности – неоднородности, компактности – разбросанности, четкости – размытости и т. д. Эта информация хорошо считывается с наглядных форм представления данных и дает сведения об их распределении.

Упорядочивание - придавать надлежащий порядок, удобный для дальнейшей обработки.

Ранжирование – приписывание числа объекту измерения

Группировка – распределение множества единиц исследуемой совокупности по группам в соответствии с существенным для данной группы признаком.

Метод группировки позволяет обеспечивать первичное обобщение данных, представление их в более упорядоченном виде. Благодаря группировке можно соотнести сводные показатели по совокупности в целом со сводными показателями по группам. Появляется возможность сравнивать, анализировать причины различий между группами, изучать взаимосвязи между признаками. Группировка позволяет делать вывод о структуре совокупности и о роли отдельных групп этой совокупности. Именно группировка формирует основу для последующей сводки и анализа данных

Представление в табличном виде для удобства восприятия и последующей обработки данных. содержат информацию о результатах измерения различных признаков у всех испытуемых

В ходе применения первичных методов статистической обработки получаются показатели, непосредственно связанные с производимыми в исследовании измерениями.

К основным методам первичной статистической обработки относятся: вычисление мер центральной тенденции и мер разброса (изменчивости) данных.

Первичный статистический анализ всей совокупности полученных в исследовании данных дает возможность охарактеризовать ее в предельно сжатом виде и ответить на два главных вопроса: 1) какое значение наиболее характерно для выборки; 2) велик ли разброс данных относительно этого характерного значения, т. е. какова «размытость» данных. Для решения первого вопроса вычисляются меры центральной тенденции, для решения второго – меры изменчивости (или разброса). Эти статистические показатели используются в отношении количественных данных, представленных в порядковой, интервальной или пропорциональной шкале.

Меры центральной тенденции – это величины, вокруг которых группируются остальные данные. Данные величины являются как бы обобщающими всю выборку показателями, что, во-первых, позволяет судить по ним обо всей выборке, а во-вторых, дает возможность сравнивать разные выборки, разные серии между собой. К мерам центральной тенденции в обработке результатов психологических исследований относятся: выборочное среднее, медиана, мода.

Выборочное среднее (М) – это результат деления суммы всех значений (X) на их количество (N).

Медиана (Me) – это значение, выше и ниже которого количество отличающихся значений одинаково, т. е. это центральное значение в последовательном ряду данных. Медиана не обязательно должна совпадать с конкретным значением. Совпадение происходит в случае нечетного числа значений (ответов), несовпадение – при четном их числе. В последнем случае медиана вычисляется как среднее арифметическое двух центральных значений в упорядоченном ряду.

Мода (Мо) – это значение, наиболее часто встречающееся в выборке, т. е. значение с наибольшей частотой. Если все значения в группе встречаются одинаково часто, то считается, что моды нет. Если два соседних значения имеют одинаковую частоту и больше частоты любого другого значения, мода есть среднее этих двух значений. Если то же самое относится к двум несмежным значениям, то существует две моды, а группа оценок является бимодальной.

Обычно выборочное среднее применяется при стремлении к наибольшей точности в определении центральной тенденции. Медиана вычисляется в том случае, когда в серии есть «нетипичные» данные, резко влияющие на среднее. Мода используется в ситуациях, когда не нужна высокая точность, но важна быстрота определения меры центральной тенденции.

Вычисление всех трех показателей производится также для оценки распределения данных. При нормальном распределении значения выборочного среднего, медианы и моды одинаковы или очень близки.

Меры разброса (изменчивости) – это статистические показатели, характеризующие различия между отдельными значениями выборки. Они позволяют судить о степени однородности полученного множества, его компактности, а косвенно и о надежности полученных данных и вытекающих из них результатов. Наиболее используемые в психологических исследованиях показатели: среднее отклонение, дисперсия, стандартное отклонение.

Размах (Р) – это интервал между максимальным и минимальным значениями признака. Определяется легко и быстро, но чувствителен к случайностям, особенно при малом числе данных.

Среднее отклонение (МД) – это среднеарифметическое разницы (по абсолютной величине) между каждым значением в выборке и ее средним.

где d = |Х – М |, М – среднее выборки, X – конкретное значение, N – число значений.

Множество всех конкретных отклонений от среднего характеризует изменчивость данных, но если не взять их по абсолютной величине, то их сумма будет равна нулю и мы не получим информации об их изменчивости. Среднее отклонение показывает степень скученности данных вокруг выборочного среднего. Кстати, иногда при определении этой характеристики выборки вместо среднего (М) берут иные меры центральной тенденции – моду или медиану.

Дисперсия (D) характеризует отклонения от средней величины в данной выборке. Вычисление дисперсии позляет избежать нулевой суммы конкретных разниц (d = Х – М)не через их абсолютные величины, а через их возведение в квадрат:

где d = |Х – М|, М – среднее выборки, X – конкретное значение, N – число значений.

Стандартное отклонение (б). Из-за возведения в квадрат отдельных отклонений d при вычислении дисперсии полученная величина оказывается далекой от первоначальных отклонений и потому не дает о них наглядного представления. Чтобы этого избежать и получить характеристику, сопоставимую со средним отклонением, проделывают обратную математическую операцию – из дисперсии извлекают квадратный корень. Его положительное значение и принимается за меру изменчивости, именуемую среднеквадратическим, или стандартным, отклонением:

где d = |Х– М|, М – среднее выборки, X– конкретное значение, N – число значений.

МД, D и ? применимы для интервальных и пропорционных данных.

Наглядное представление данных исследования. Основные формы наглядного представления данных (таблицы, схемы, диаграммы, графики). Основные виды диаграмм: гистограмма, линейчатая, круговая (секторная), совмещенная диаграммы. Общие правила построения диаграмм и графиков.

Схема -изложение, изображение, представление данных в самых общих чертах, упрощённо.

Таблица — способ передачи содержания, заключающийся в организации структуры данных, в которой отдельные элементы помещены в ячейки, каждой из которых сопоставлена пара значений — номер строки и номер колонки. Таким образом, устанавливается смысловая связь между элементами, принадлежащими одному столбцу или одной строке

-табл.исходных данных – содержат информацию о результатах измерения различных признаков у всех испытуемых.

-табл.распределенния частот – проанализированная и сокращенная исходных данных путем подсчета частоты встречаемости различных значений признака.

График - это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Представление данных таблицы в виде графика производит более сильное впечатление, чем цифры, позволяет лучше осмыслить результаты статистического наблюдения, правильно их истолковать, значительно облегчает понимание статистического материала, делает его наглядным и доступным. Это, однако, вовсе не означает, что графики имеют лишь иллюстративное значение. Они дают новое знание о предмете исследования, являясь методом обобщения исходной информации.

При построении графического изображения следует соблюдать ряд требований. Прежде всего график должен быть достаточно наглядным, так как весь смысл графического изображения как метода анализа в том и состоит, чтобы наглядно изобразить статистические показатели. Кроме того, график должен быть выразительным, доходчивым и понятным.

График состоит из графического образа и вспомогательных элементов. Графический образ - это совокупность линий, фигур, точек, которыми изображены статистические данные. Диаметрические знаки, рисунки или образы, применяемые в статистических графиках, многообразны. Это точки, отрезки прямых линий, знаки в виде фигур различной формы, штриховки или окраски (круги, квадраты, прямоугольники и др.). Эти знаки применяются для сравнения статистических величин, изображающих абсолютные и относительные размеры сравниваемых совокупностей. Сравнение на графике производится по некоторым измерениям: площади или длине одной из сторон фигуры, местонахождению точек, их густоте, густоте штриховке, интенсивности или цвету окраски.

Вспомогательные элементы включают общий заголовок, условные обозначения, оси координат, шкалы с масштабами и числовую сетку.

Словесные пояснения (экспликация графика) помещенных на графике геометрических образов , различных по их конфигурации, штриховке или цвету, позволяют мысленно перейти от геометрических образов к явлениям и процессам, изображенным на графике.

В статистических графиках чаще всего применяется система прямоугольных координат, но есть и графики, построенные по принципу полярных координат (круговые графики).

Когда график строится в прямоугольных координатах, на горизонтальной оси абсцисс и вертикальной оси ординат в определенном порядке располагаются характеристики статистических признаков изображаемых явлений или процессов, а в поле графика размещаются геометрические знаки, составляющие сам график. Поле графика - это пространство, в котором располагаются геометрические знаки, образующие график.

Признаки, располагаемые на осях координат, могут быть качественными и количественными.

Одна из важных задач статистического графика - это его композиция: отбор статистического материала, выбор способа изображения, т.е. формата графика. Размер графика должен соответствовать его назначению. Для статистических графиков удобные форматы с соотношением сторон поля Но во многих случаях удобна квадратная форма графика.

В заголовке (названий) графика определяется задача, которая решается при помощи графика, дается характеристика места и времени, к которому относится график.

Надписи вдоль масштабных шкал указывают, в каких единицах измеряются признаки. Цифры значений каждого параметра проставляются у пограничных отметок масштабных шкал.

Диаграммы-линии или графики (полигон частот)— это тип диаграмм, на которых полученные данные изображаются в виде точек, соединённых прямыми линиями; графическое изображение частотного распределения, ломаная линия, которая соединяет крайние точки точечной диаграммы. Также могут изображаться точки без линий (точечные диаграммы). Для построения диаграмм-линий применяют прямоугольную систему координат.

Диаграммы-линии целесообразно применять тогда, когда число размеров (уровней) в ряду велико. Кроме того, такие диаграммы удобно использовать, если требуется изобразить характер или общую тенденцию развития явления или явлений. Линии удобны и при изображении нескольких динамических рядов для их сравнения, когда требуется сравнение темпов роста. На одной диаграмме такого типа не рекомендуется помещать более трёх-четырёх кривых. Их большое количество может усложнить чертёж, и линейная диаграмма может потерять наглядность.

Основной недостаток диаграмм-линий — равномерная шкала, позволяющая измерить и сравнить только абсолютные приросты или уменьшения показателей в течение периода исследований. Относительные изменения показателей искажаются при изображении их с равномерной вертикальной шкалой. Также в такой диаграмме может быть невозможным изображение рядов динамики с резкими скачками уровней, которые требуют уменьшения масштаба диаграммы, и показатели в ней динамики более «спокойного» объекта теряют свою точность. Вероятность присутствия в этих типах диаграмм резких изменений показателей возрастает с увеличением длительности периода времён на графике.

Диаграммы - графическое представление данных, позволяющее быстро оценить соотношение нескольких величин; наиболее распространенный способ графических изображений. Это графики количественных отношений. Виды и способы их построения разнообразны. Диаграммы применяются для наглядного сопоставления в различных аспектах (пространственном, временном и др.) независимых друг от друга величин. При этом сравнение исследуемых совокупностей производится по какому-либо существенному варьирующему признаку.

При построении точечных диаграмм в качестве графических образов применяются совокупности точек; при построении линейных - линии. Основной принцип построения всех плоскостных диаграмм сводится к тому, что статистические величины изображаются в виде геометрических фигур и, в свою очередь, подразделяются на столбиковые, полосовые, круговые, квадратные и фигурные.

Точечная диаграмма – результат каждого испытуемого это точка.

Гистограммамы – столбчатая диаграмма, каждый столбец к-рой опирается на разрядный интервал или соответствует некоторому значению признака; высота столбца пропорциональна частоте встречаемости значений в данном интервале. Столбчатые диаграммы в основном используются для наглядного сравнения полученных статистических данных или для анализа их изменения за определённый промежуток времени. Построение столбчатой диаграммы заключается в изображении статистических данных в виде вертикальных прямоугольников или трёхмерных прямоугольных столбиков. Каждый столбик изображает величину уровня данного статистического ряда. Все сравниваемые показатели выражены одной единицей измерения, поэтому удаётся сравнить статистические показатели данного процесса.

Разновидностями столбчатых диаграмм являются линейные (полосовые) диаграммы. Они отличаются горизонтальным расположением столбиков. Столбчатые и линейные диаграммы взаимозаменяемы, рассматриваемые в них статистические показатели могут быть представлены как вертикальными, так и горизонтальными столбиками. В обоих случаях для изображения величины явления используется одно измерение каждого прямоугольника — высота или длина столбика. Поэтому и сфера применения этих двух диаграмм в основном одинакова

Столбчатые диаграммы могут изображаться и группами (одновременно расположенными на одной горизонтальной оси с разной размерностью варьирующих признаков). Образующие поверхности столбчатых и линейных диаграмм могут представлять собой не только прямоугольники, но также квадраты, треугольники,трапеции и т. д

Круговая (секторная) диаграмма идея целого очень наглядно выражается кругом, который представляет всю совокупность. Относительная величина каждого значения изображается в виде сектора круга, площадь которого соответствует вкладу этого значения в сумму значений. Этот вид графиков удобно использовать, когда нужно показать долю каждой величины в общем объёме. Сектора могут изображаться как в общем круге, так и отдельно, расположенными на небольшом удалении друг от друга.

Круговая диаграмма сохраняет наглядность только в том случае, если количество частей совокупности диаграммы небольшое. Если частей диаграммы слишком много, её применение неэффективно по причине несущественного различия сравниваемых структур. Недостаток круговых диаграмм — малая ёмкость, невозможность отразить более широкий объём полезной информации. Используются в случаях относительных частот.

Совмещенная диаграмма, включающая гистограмму и график

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]