Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ответы Подшибякина часть 2.rtf
Скачиваний:
119
Добавлен:
13.02.2015
Размер:
2.09 Mб
Скачать

42. Анализ одномерных распределений.

Это анализ свойств распределения значений одной переменной. Наиболее важные операции: вычисление средней величины с определением степени разброса данных вокруг нее и определение формы распределения значений переменной.

На номинальном уровне:

Средняя величина является в большинстве случаев весьма информативной мерой «центрального положения» наблюдаемой переменной. Она позволяет оценивать и сравнивать свойства не отдельных объектов, но групп объектов в целом. Для превращения данных в осмысленную статистическую картину, необходимо прежде всего рассчитать частотное распределение – показатель того, сколько раз встречается каждое из значений переменной, а затем можно легко вычислить процентное соотношение. Наиболее часто встречающееся значение именуется модой (модальным значением), где значение моды = 1 – унимодальное распределение, а когда их несколько – мультимодальным.

Показатель типичности средней для числового ряда в статистике – коэффициент вариации, который показывает, насколько существенен разброс значений вокруг средней.

На порядковом уровне, где присутствует упорядочивание категорий с точки зрения возрастания/убывания интенсивности признака, открываются новые статистические возможности. Основная средняя величина для порядковых переменных – медиана (середина ранжированного числового ряда: выше и ниже медианы должно быть равное число элементов).

Распространенный способ измерить разброс значений вокруг средней на этом уровне - это вычисление квартилей – четвертей ранжированного ряда. Значение нижнего квартиля показывает середину части числового ряда от его начала до медианы, верхнего – середину части от медианы до конца ряда. Второй квартиль совпадает с медианой. Чем больше интервал между нижним и верхним квартилем, тем больше разброс значений вокруг средней и тем в меньшей степени средняя является репрезентативной для числового ряда. Разность между верхним и нижним квартилем – квартильный ранг – мера вариации для порядковых переменных.

На интервальном уровне измерения: упорядочение категорий по признаку «больше/меньше» и установление фиксированного интервала измерения.

Наиболее распространенная средняя величина для интервальных вычислений – среднее арифметическое. Традиционная мера разброса значений вокруг средней – стандартное отклонение. Также используются показатели: минимум, максимум и размах.

Форма распределения значений переменной:

Форма распределения переменной для политического аналитика представляет интерес, т. к. форма распределения значений может отражать содержательнее характеристики изучаемого явления, но если реальное распределение значений переменной не отвечает требованиям, то результаты анализа могут быть поставлены под сомнение. Нормальное распределение значений переменной – большая часть значений формируется около некоторого среднего значения, по обе стороны которого частота наблюдений равномерно снижается. Такое распределение описывается колоколообразной кривой (колокол Гаусса) либо применяется визуальный анализ - диаграммы распределения (наиболее удобная форма – столбчатая гистограмма).