Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика Астахов.doc
Скачиваний:
20
Добавлен:
05.02.2016
Размер:
3.44 Mб
Скачать

3 А д а н и е

Приведите близкий Вам пример корреляционной связи атрибутивных признаков и рассчитайте предложенные коэффициенты ассоциации, контингенции и сопряженности

Тема 27.Методы факторного анализа и многомерной классификации

В этой теме вы сможете ознакомиться с менее распространенными, но часто очень важными для статистика, менеджера и экономиста методами статистического анализа. Естественно мы не можем дать подробное и развернутое представление об этих методах – это достаточно специальная область знаний, но представлять, что это такое на наш взгляд необходимо.

Итак, Вы узнаете, что такое

  1. Дисперсионный анализ

  2. Факторный анализ

  3. Кластерный анализ

  4. Дискриминантный анализ

Дисперсионный анализ это статистический метод, позволяющий оценить влияние одного или нескольких факторов на результирующий признак.

Чаще всего встречается ситуация когда можно указать один фактор влияющий на результат и этот фактор принимает конечное число значений. Нужно определить влияние этого фактора. Тогда говорят об однофакторном дисперсионном анализе.

Методика заключается в следующем: проводится комбинированная группировка по результативному и факторным признакам. Она обеспечивает разложение общей дисперсии на межгрупповую и остаточную. Межгрупповая дисперсия отражает вариацию признака, которая возникает под воздействием признака – фактора положенного в основу группировки.

Sf = Σ(Xj – X) , Df = Sf/m,

Xj – среднее значение в группе; X – общая средняя; M – количество групп.

Остаточная дисперсия характеризует случайную вариацию в каждой отдельной группе. Эта вариация возникает под влиянием других факторов и не зависит от факторного признака, положенного в основу группировки.

Общая дисперсия характеризует вариацию признака, обусловленную влиянием всех факторов.

Отношение Fp = Df /Do используется для оценки существенности влияния фактора.

Если влияние факторного признака статистически существенно то F расчетное больше или равно F табличному.

F табличное зависит от трех параметров:

1. определяет достоверность выводов (называется уровнем значимости). Для социологических и экономических задач Ft = 0,05 –определяет вероятность отвергнуть правильную гипотезу в 5 случаях из 100.

2. определяется количеством значений факторного признака (m-1).

3. определяется объемом выборки уменьшенным на количество значений факторного признака (N - M).

Ft определяется по таблице критических значений критерия Фишера (см. приложение).

Если влияние факторного признака существенно, то следует определить коэффициент детерминации, как отношение факторной дисперсии Df к общей дисперсии Dy и это будет доля вариации, обусловленная влиянием факторного признака (η). Например η = 0,68 (68%), то это означает, что вариация результативного признака на 68% обусловлена влиянием факторного признака.

Задание

Придумайте 5 примеров из жизни вашего предприятия или из бытовой жизни, где можно использовать дисперсионный анализ.

Для экономистов и менеджеров важно учитывать массу различных факторов влияющих на результаты деятельности, поэтому часто применяется факторный анализ в качестве рабочего инструмента. В факторном анализе наиболее существенной является проблема интерпретации, относящаяся к вопросу о том, какого характера выводы относительно изучаемых обьектов можно делать на основании результатов факторного анализа. С проблемой интерпретации связан вопрос и о том, какого рода данные можно обрабатывать при помощи факторного анализа. Принято выделять четыре типа шкал и соответствующих им данных:

              1. шкалы наименований

2. порядка (равных) интервалов

    1. равных отношений

    2. абсолютные шкалы

Из них количественными, строго говоря, являются данные полученные при измерениях по абсолютным и интервальным шкалам. Важный вопрос как применять факторный анализ к качественным данным. Содержательная интерпретация результатов факторного анализа – неформальная процедура. Основную роль здесь играет опыт и интуиция исследователя. Вычислительная сторона факторного анализа хорошо описана в целом ряде изданий, а математическом обеспечении прикладных программ есть реализация алгоритмов факторного анализа.

Признаки, измеряемые в абсолютной или интервальной шкале называется параметр, а его конкретное значение – наблюдением.

Пусть имеется некоторое количество объектов и некоторое количество параметров. Средние значения и стандартное отклонение каждого параметра вычисляются по известным формулам. Центральное отклонение это разница между любым параметром и средним значением, центральное нормированное отклонение это частное от деления параметра на стандартное отклонение. Центральное нормированное отклонение будем называть стандартной формой задания параметра. Параметр, заданный в стандартной форме, имеет среднее значение, равное 0, а стандартное отклонение и дисперсию, равные 1.

Основное предположение факторного анализа заключается в том, что каждый параметр можно представит в виде суммы некоторых других переменных, умноженных каждая на свой коэффициент. Эти переменные принято называть факторами, а коэффициенты – факторными нагрузками. Значения факторных нагрузок, как, и являются основным результатом вычислительной процедуры факторного анализа, то есть предметом интерпретации. Факторы делят на общие и характерные. Сумму квадратов общих факторов принято называть общностью, а квадрат нагрузки характерного фактора – характерностью. Характерность разбивается на две составляющие. Одна из них связана с природой параметра и называется специфичностью, а вторая – с несовершенством измерительных средств и называется ненадежностью или дисперсией ошибки. Дополнение ненадежности до полной дисперсии называется надежностью параметра.

Задание

Придумайте 4 примера из жизни вашего предприятия или из бытовой жизни, где можно использовать факторный анализ. Особое внимание уделите обоснованию факторов

Задача многомерной классификации сводится к тому, чтобы из n объектов, характеризуемых k признаками, сформировать разбиение на однородные группы (кластеры)

Процесс разбиения n объектов на кластеры носит название кластерного анализа. Однородность объектов определяется по расстоянию ρ(x1,x2)где х1, х2 – вектора, элементы которых – составляющие. Объекты считаются однородными, если ρ(х1, х2 ) < ρпредельное Для объектов, характеризуемых числовыми признаками расстояние определяют

ρ=Σ(XIL - XJL)

Графическое изображение объединения кластеров может быть получено с помощью дерева объединения кластеров – дендрограммы, которая есть графическое изображение древовидных структур.

Очень часто возникает задача определения к какому из уже имеющихся кластеров относится новое наблюдение. В этом случае говорят о дискриминантном анализе. Дискриминантный анализ является следующим этапом многомерной классификации, когда выделенные классы описываются с помощью определяющего правила, т.е. специальных определяющих функций, каждая из которых соответствует определенному кластеру и принимает максимальное значение только для наблюдений данного кластера. Факт принадлежности наблюдения данному кластеру подтверждается тем, что для этого наблюдения определяющая функция имеет максимальное значение

Задание

Придумайте пример из жизни вашего предприятия или из бытовой жизни, где можно использовать кластерный и дискриминантный анализ.