Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТВ и МС лаба 2.doc
Скачиваний:
6
Добавлен:
26.11.2019
Размер:
237.06 Кб
Скачать

Тема 3: Изучение корреляционной зависимости двух случайных величин

Целью лабораторной работы является исследование статистической связи двух показателей на основе расчета различных коэффициентов корреляции в статистическом пакете программ STATISTICA.

  • умение работать с модулем Непараметрические статистики;

  • умение вычислять коэффициент корреляции двух случайных величин;

  • умение вычислять коэффициент ранговой корреляции Спирмена и Кендалла;

  • определение статистической значимости коэффициентов ранговой корреляции на основе соответствующих тестов. формирование вывода о статистической связи (о характере и силе связи) двух показателей на основании анализа коэффициентов корреляции.

Описание работы с подмодулем Корреляция модуля Непараметрические статистики.

Модуль Непараметрические статистики позволяет провести анализ статистической связи нескольких переменных на основе расчета соответствующих коэффициентов корреляции.

Для вызова из меню соответствующего подмодуля необходимо в пакете Statistica выбрать меню Statistics, далее Nonparametric Statistic, и в появившемся диалоговом окне выбрать режим Correlations (Spearman, Kendall tau, gamma) (см. рис. 8).

Рис. 8 Основное окно модуля Непараметрические статистики.

Появится функциональное диалоговое окно Nonparametric Correlations, содержащее две вкладки: Quick, позволяющую рассчитать только коэффициент ранговой корреляции Спирмена, и вкладку Advanced (рис. 9), позволяющую рассчитать и другие коэффициенты ранговой корреляции.

Выбор переменных, для которых необходимо вычислить коэффициенты ранговой корреляции, осуществляется после нажатия кнопки Variables в окне Select two variable lists (рис. 10). По кнопке Spearman rank R рассчитывается коэффициент ранговой корреляции Спирмена. Результаты расчета приведены в соответствующей таблице (рис. 11).

Рис. 9. Функциональное диалоговое окно Nonparametric Correlations, вкладка Advanced.

Рис. 10. Окно выбора переменных для проведения корреляционного анализа.

Рис. 11. Таблица результатов расчета коэффициента корреляции Спирмена.

В полученной таблице Spearman Rank Order Correlations (рис.11) в первом столбце Valid N указано общее количество наблюдений, в столбце Spearmen R значение коэффициента ранговой корреляции Спирмена, в столбце t (N-2) соответствующая коэффициенту R t-статистика (расчетное значение), в столбце p-level соответствующий t-статистике уровень значимости.

Для определения значения коэффициента Кендалла во вкладке Advanced нажимают кнопку Kendall Tau (см. рис. 9). Результаты расчета приведены в соответствующей таблице (рис. 12). В полученной таблице Kendall Tau Correlations (рис.12) в первом столбце Valid N указано общее количество наблюдений, в столбце Kendall Tau значение коэффициента ранговой корреляции Кендалла, в столбце Z соответствующая коэффициенту Tau (τ) Z-статистика (расчетное значение), в столбце p-level соответствующий Z-статистике уровень значимости.

Рис. 12. Таблица результатов расчета коэффициента корреляции Кендалла.

Кнопка Scatterplot matrix for all variables диалогового окна Nonparametric Correlations предназначена для построения столбчатых диаграмм- графиков исследуемых переменных и графика их взаимосвязи (на оси OX откладываются значения первой переменной, на оси OY – второй переменной). Результаты построения соответствующих графиков приведены на рис. 13.

Рис. 13. Столбчатые диаграммы исследуемых переменных и график их взаимосвязи (справа внизу).

Для нахождения обычного парного коэффициента корреляции необходимо использовать подмодуль Correlation matrices. Для этого необходимо в пакете Statistica выбрать меню Statistics, далее Basic Statistics and Tables, и в появившемся диалоговом окне выбрать режим Correlation matrices (см. рис. 14).

Рис. 14. Вызов подмодуля Correlation matrices.

В появившемся диалоговом окне Product-Moment and Partial Correlations выбирают вкладку Advanced (рис. 15). Выбор переменных для определения матрицы парных частных коэффициентов корреляции осуществляется в окне Select two variable lists (см. рис. 16), которое появляется после нажатия кнопки Two lists (rect. matrix). Для расчета коэффициентов парной корреляции нажимают кнопку Summary: Correlation Matrix (рис. 15).

Результат расчета парного коэффициента корреляции двух переменных представлен в таблице Correlations, см. рис. 17.

Рис. 15. Функциональное диалоговое окно расчета коэффициентов корреляции.

Рис. 16. Окно выбора переменных для расчета матрицы парных частных коэффициентов корреляции.

Рис.17. Результаты расчета парного коэффициента корреляции.

Задание на лабораторную работу № 2

I часть

  1. Выбрать самостоятельно исходных данные в виде переменной, состоящей из 20 и более наблюдений (данные должны быть реального экономического показателя, например ВВП, объем экспорта, уровень безработицы).

  2. Вычислить основные описательные статистики (среднее, стандартное отклонение, дисперсия, максимальное и минимальное значение, медиана, мода, коэффициенты асимметрии и эксцесса, нижнюю и верхнюю квартили). (Вставить Скриншорт результатов)

  3. Построить гистограмму распределения частот, с наложением кривой нормального распределения, определить показатели статистик Колмогорова-Смирнова и Лилифорса. (Вставить Скриншорт результатов)

  4. На основе выполненных исследований сделать выводы о статистическом распределении показателя (симметричности, «пиковости» и т.п.)

II часть

  1. Выбрать самостоятельно исходных данные в виде переменных, состоящих из 20 и более наблюдений, между которыми предположительно есть связь (данные должны быть реального экономических показателей, например, выявить связь между уровнем безработицы и средней заработной платой в каждом регионе).

  2. Вычислить коэффициенты ранговой корреляции Спирмена и Кендалла, определить частный парный коэффициент корреляции. (Вставить Скриншорт результатов)

  3. Проверить статистическую значимость коэффициентов ранговой корреляции Спирмена и Кендалла при 95% и 99% доверительной вероятности на основе соответствующих тестов. Критические значения t-статистики и z-статистики при 95% и 99% доверительной вероятности определить по вероятностному калькулятору. (Вставить Скриншорт результатов).

  4. Сделать выводы о силе, направлении и характере статистической связи меду исследуемыми показателями.