- •Статистический анализ
- •1. Дескриптивный анализ
- •Средние величины
- •Средняя арифметическая
- •Квартили, децили, перцентили
- •2. Выводной анализ
- •Выборка
- •3. Анализ гипотез Введение в теорию гипотез
- •Уровни статистической значимости
- •Правило отклонения нулевой и принятия альтернативной гипотезы
- •Непараметрические критерии
- •4. Анализ связей
- •Применение метода анализа взаимосвязей между признаками в маркетинговых исследованиях
- •Классификация подходов и методов анализа парных взаимосвязей между признаками
- •Вариации качественных, но не альтернативных признаков
- •Вариации количественных и качественных признаков
- •Вариация количественных признаков
- •Взаимосвязь между двумя количественными признаками
- •Корреляционные отношения
- •Множественная многофакторная регрессия
- •Работа с многофакторной моделью
- •Совокупный коэффициент корреляции
- •Частные коэффициенты корреляции
- •Оценка существенности связи и принятие решений на основании уравнения регрессии (проверка адекватности модели)
- •5. Факторный анализ
- •Полная факторная матрица
- •Техники выделения факторов
- •6. Кластерный анализ
- •Методы кластеризации
- •7. Контент-анализ
Корреляционные отношения
Определяются по следующим формулам:
где - межгрупповая дисперсия результативного признака, вызванная влиянием признака-фактора, рассчитываемая по формуле:
где - среднее значение результативного признака в соответствующих группах, выделенных по величине признака-фактора
- общее среднее значение результативного признака для всей совокупности
- общая дисперсия результативного признака, определяемая по формуле:
где - среднее значение результативного признака в соответствующих группах, выделенных по величине признака-фактора
- общее среднее значение результативного признака для всей совокупности
- средняя внутригрупповая дисперсия результативного признака, которую можно рассчитать по следующей формуле:
где - среднее значение результативного признака в соответствующих группах, выделенных по величине признака-фактора
- общее среднее значение результативного признака для всей совокупности
- внутригрупповая дисперсия
Вычисление корреляционного отношения требует достаточно большого объема информации, которая должна быть представлена в форме групповой таблицы, то есть группировка должна быть по признаку-фактору.
Корреляционное отношение изменяется в пределах от 0 до 1. И его, как правило, измеряют для нелинейных связей. При линейной связи используют совокупный коэффициент корреляции.
Если связь между признаками криволинейная и описывается уравнением параболы второго порядка, то система нормальных уравнений приобретает следующий вид:
А система нормальных уравнений для нахождения параметров гиперболы имеет следующий вид:
Множественная многофакторная регрессия
Множественная многофакторная регрессия – это изучение связи между 3 и более связанных между собой признаков.
Построение модели множественной регрессии включает следующие этапы:
Выбор формы связи, то есть уравнения регрессии
Отбор факторных признаков
Обеспечение достаточного объема совокупности для получения несмешанных оценок
В основном используются 5 типов моделей:
1) линейная
2) степенная
3) показательная
4) параболическая
5) гиперболическая
Основное значение имеют линейные модели в силу своей простоты, а также, потому что нелинейные формы зависимости приводятся к линейным путем линеаризации.
Существует проблема отбора признаков для построения модели. Основные требования, предъявляемые к включаемым в модель факторам:
Каждый из факторов должен быть обоснован теоретически
В перечень целесообразно включать только важнейшие факторы, оказывающие существенное воздействие на изучаемые показатели. При этом рекомендуется, чтобы количество включаемых в модель факторов не превышало одной трети от числа наблюдений выборки.
Факторы не должны быть линейно-зависимыми, то есть они могут характеризовать либо одно и то же свойство изучаемого явления, либо являться составными частями одного и того же признака. Включение в модель линейно-взаимозависимых факторов приводит к возникновению явления мультиколлинеарности, которое отрицательно сказывается на качестве модели.
Влияющие на экономический процесс факторы могут быть количественными и качественными. В модель рекомендуется включать только такие факторы, которые могут быть численно измеренными.
В одну модель нельзя включать совокупный фактор и образующие его частные факторы, так как это тоже приводит к явлению мультиколлинеарности.
При отборе факторов используются статистические методы отбора:
Метод исключения – предполагает построение уравнения, включая всю совокупность переменных с последующим пошаговым сокращением числа переменных в модели до тех пор, пока не выполнится некоторое наперед заданное условие.
Метод включения – его суть состоит в последовательном включении переменных в модель до тех пор, пока регрессионная модель не будет отвечать заранее установленному критерию качества. Последовательность включения определяется с помощью частного коэффициента корреляции. Переменные, имеющие относительно исследуемого показателя большое значение частного коэффициента корреляции, первыми включаются в регрессионное уравнение.