Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
L'exemple de l'analyse statistique (le modèle e...doc
Скачиваний:
0
Добавлен:
08.09.2019
Размер:
380.93 Кб
Скачать

Корреляционный и регрессионный анализ трехмерной генеральной совокупности Исходные данные

объект

наблюдаемые признаки

X

- средняя продолжительность жизни женщин

Y

- уровень рождаемости

(число родившихся на 1000 жителей)

Z

- уровень смертности

(число умерших на 1000 жителей)

Беларусь

76

13

11

Босния

78

14

6

Болгария

75

13

12

Хорватия

77

11

11

Чехия

77

13

11

Эстония

76

14

12

Грузия

76

16

9

Венгрия

76

12

12

Латвия

75

14

10

Литва

77

15

10

Польша

77

14

10

Румыния

75

14

10

Россия

74

13

11

Украина

75

12

13

I. Корреляционный анализ Постановка задачи

Требуется на основании указанных в приведенной таблице статистических данных для n=14 стран, отобранных случайным образом, исследовать стохастическую зависимость между социальными показателями X, Y, Z, полагая, что их совместное распределение подчинено трехмерному нормальному закону.

К вопросам анализа относятся:

  • оценка тесноты связи между произвольными двумя наблюдаемыми признаками при фиксировании или исключении влияния третьего признака;

  • оценка тесноты связи каждого из рассматриваемых признаков с совокупностью остальных признаков;

  • проверка значимости коэффициентов связи;

  • интервальное оценивание коэффициентов связи.

  • построение модели корреляционной зависимости между признаками.

1. Определение точечных оценок параметров совместного распределения признаков. Формирование выборочной корреляционной матрицы

Признаки X, Y, Z образуют трехмерную нормально распределенную генеральную совокупность, которая определяется девятью параметрами:

• тремя математическими ожиданиями MX, MY, MZ;

• тремя дисперсиями DX, DY, DZ;

• тремя парными коэффициентами корреляции ρxy; ρxz; ρyz.

Выборочные средние

Выборочные средние квадратические отклонения

Выборочные парные коэффициенты корреляции

Матрица выборочных парных коэффициентов корреляции

q3=

1

0,108

-0,531

0,108

1

-0,545

-0,531

-0,545

1

2. Исследование парных коэффициентов корреляции

Парный коэффициент корреляции численно характеризует тесноту связи между произвольными двумя признаками, выбранными из совокупности рассматриваемых показателей, на фоне влияния третьего показателя, введенного в корреляционный анализ.

Проверка значимости парных коэффициентов корреляции

(при уровне значимости применяемого статистического критерия α=0,05)

Проверяемые гипотезы:

H0: ρxy=0

H0: ρxz=0

H0: ρyz=0

Наблюдаемые значения статистики критерия:

Нахождение tкр - граничного значения области отвержения гипотезы

Способы:

  • или из статистической таблицы 2 (Значения функции , где случайная величина Т распределена по закону Стьюдента с числом степеней свободы, равным ν) на основании уравнения:

,

  • или с помощью статистической функции Microsoft Excel СТЬЮДРАСПОБР(вероятность;степени_свободы):

tкр=СТЬЮДРАСПОБР(α;n-2).

В данном случае

tкр=2,1788.

Условие отвержения гипотезы о незначимости коэффициента корреляции

.

Результаты проверки гипотез:

  • гипотеза H0: ρxy=0 не отвергается, парный коэффициент корреляции между X и Y не значим;

  • гипотеза H0: ρxz=0 не отвергается, парный коэффициент корреляции между X и Z не значим;

  • гипотеза H0: ρyz=0 отвергается, парный коэффициент корреляции между Y и Z значим.

Вывод

Между признаками Y, Z существует значимая обратная умеренная корреляционная зависимость.

Интервальные оценки парных коэффициентов корреляции

(с надежностью доверительных интервалов γ=0,95)

Построение доверительных интервалов производится, как правило, для значимых парных коэффициентов корреляции по следующей схеме.

    • Прямое преобразование Фишера - арктангенс гиперболический - выборочных парных коэффициентов корреляции

Способы:

  • или с помощью статистической таблицы 6 (Z-преобразования Фишера),

  • или используя статистическую функцию Microsoft Excel ФИШЕР(x), где x - числовое значение, которое требуется преобразовать.

Для исходной выборки

arcth(rxy)= 0,1084

arcth(rxz)= -0,5919

arcth(ryz)= -0,6109

    • Определение tγ - квантили уровня (1+γ)/2 распределения Ν(0,1)

Способы:

  • или из статистической таблицы 1 (Значения функции Лапласа , где Т имеет стандартное нормальное распределение), исходя из соотношения:

,

  • или с помощью статистической функции Microsoft Excel НОРМСТОБР(вероятность), определяющей по уровню (1+γ)/2 значение соответствующей квантили:

tγ = НОРМСТОБР((1+γ)/2).

Для заданной надежности tγ=1,96.

    • Нахождение границ доверительных интервалов для математических ожиданий arcth(rxy), arcth(rxz), arcth(ryz)

Отправное неравенство: .

Результаты вычислений сведены в таблицу:

rxy

-0,4825

0,6994

rxz

-1,1828

-0,0009

ryz

-1,2019

-0,0200

    • Установление границ доверительных интервалов для парных коэффициентов корреляции ρxy, ρxz, ρyz - обратное преобразование Фишера границ доверительных интервалов для M{arcth(rxy)}, M{arcth(rxz)}, M{arcth(ryz)}

Способы:

  • или с помощью статистической таблицы 6 (Z-преобразования Фишера),

  • или используя статистическую функцию Microsoft Excel ФИШЕРОБР(y), где y - значение, для которого совершается обратное преобразование.

Отправное неравенство: .

Отсюда

th(-0,4825)=-0,448<ρxy<0,604 =th(0,6994);

th(-1,1828)=-0,828< ρxz <-0,001=th(-0,0009);

th(-1,2019)=-0,834< ρyz <-0,020=th(-0,0200).

Вывод

Доверительный интервал для парного коэффициента корреляции ρyz не содержит нуля, что подтверждает значимость данного коэффициента.

3. Исследование частных коэффициентов корреляции

Частный коэффициент корреляции позволяет численно оценить тесноту связи между любыми двумя признаками из числа рассматриваемых показателей, исключая при анализе их зависимости (в случае трехмерной корреляционной модели) влияние на эту зависимость третьего показателя.

Выборочные частные коэффициенты корреляции

;

;

.

Проверка значимости частных коэффициентов корреляции

(при уровне значимости применяемого статистического критерия α=0,05)

Проверяемые гипотезы:

H0: ρxy/z=0

H0: ρxz/y=0

H0: ρyz/x=0

Наблюдаемые значения статистики критерия:

Нахождение tкр - критического значения области отвержения гипотезы

Способы:

  • или из статистической таблицы 2 (Значения функции , где случайная величина T распределена по закону Стьюдента с числом степеней свободы, равным ν) на основании уравнения:

,

  • или с помощью статистической функции Microsoft Excel СТЬЮДРАСПОБР(вероятность;степени_свободы):

tкр=СТЬЮДРАСПОБР(α;n-3).

В данном случае

tкр=2,201.

Условие отвержения гипотезы о незначимости частного коэффициента корреляции

Результаты проверки гипотез:

  • гипотеза H0: ρxy/z =0 не отвергается, частный коэффициент корреляции между X и Y не значим;

  • гипотеза H0: ρxz/y=0 отвергается, частный коэффициент корреляции между X и Z значим;

  • гипотеза H0: ρyz/x=0 отвергается, частный коэффициент корреляции между Y и Z значим.

Интервальные оценки частных коэффициентов корреляции

(с надежностью доверительных интервалов γ=0,95)

    • Прямое преобразование Фишера выборочных частных коэффициентов корреляции

Способы:

  • или с помощью статистической таблицы 6 (Z-преобразования Фишера),

  • или используя встроенную статистическую функцию Microsoft Excel ФИШЕР(x), где x - числовое значение, которое требуется преобразовать.

Для исходной выборки

arcth(rxy/z)= -0,2611

arcth(rxz/y)= -0,6426

arcth(ryz/x)= -0,6605

    • Определение tγ - квантили уровня (1+γ)/2 распределения Ν(0,1)

Способы:

  • или из статистической таблицы 1 (Значения функции Лапласа , где Т имеет стандартное нормальное распределение), исходя из соотношения:

,

  • или с помощью встроенной статистической функции Microsoft Excel НОРМСТОБР(вероятность), определяющей по уровню (1+γ)/2 значение соответствующей квантили:

tγ = НОРМСТОБР((1+γ)/2).

Для заданной надежности tγ=1,96.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]