Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Практикум в STATISTICA

.pdf
Скачиваний:
178
Добавлен:
10.04.2015
Размер:
4.14 Mб
Скачать

Корреляции Спирмена и Кендалла

Шаг 1. Запустим модуль Непараметрическая статистика. Выберем пункт Корреляции Спирмена, тау Кендалла, гамма.

В появившемся диалоге Ранговые корреляции перейдём на вкладку

Дополнительно.

Шаг 2. Зададим переменные.

Шаг 3. Нажмём на кнопку Спирмена R в диалоге Ранговая корреляция.

Теперь вернёмся в окно Ранговая корреляция и нажмём на кнопку Тау Кендалла.

Обратите внимание: коэффициент корреляции Спирмена между переменными Эритроциты и Тромбоциты оказался статистически значимым, в то время как

коэффициент корреляции Кендалла – нет. Это объясняется тем, что коэффициент корреляции Спирмена сильнее реагирует на несогласие ранжировок.

В заключении визуально проанализируем зависимость между переменными. С этой целью построим Матричный график.

Нажмём на кнопку Матричный график в диалоге Ранговые корреляции.

Другой способ построения подобного графика: можно выбрать из меню пункт

Графика/Матричные графики.

Исследование эффективности лечения: введение новой переменной

Введем новую переменную, характеризующую эффективность лечения.

В качестве меры эффективности лечения выберем величину:

,

где - состояние пациента до лечения (девятая переменная в таблице), - состояние пациента после лечения (десятая переменная в таблице).

Эта величина обладает следующими свойствами:

1) Чем ближе значение к 1, тем эффективнее лечение. В крайнем случае, когда пациент поступил в предсмертном состоянии (10), а после лечения оказался абсолютно здоров (100), значение величины равно 0.9.

2)Чем ближе значение к -1, тем менее эффективно лечение. В крайнем случае, когда пациент поступил абсолютно здоровым (100), а после лечения оказался в предсмертном состоянии (10), то значение величины равно -0.9.

3)Значение = 0 означает, что состояние пациента не изменилось.

Добавим в таблицу новую переменную, назовём её Эффективностью, укажем формат отображения, зададим формулу для её вычисления.

В итоге в таблице появится новый столбец.

Цель дальнейшего исследования

Целью исследования, которого мы сейчас проведём, является получение ответов на следующие вопросы:

1)Какой метод лечения более эффективен?

2)Есть ли существенное различие состояний пациентов до и после лечения?

Проверка гипотезы о нормальности для переменной Эффективность

Для ответа на поставленные вопросы можно использовать T-критерий

переменной Эффективность.

Этот критерий требует нормальность распределения переменной, поэтому перед использованием проверим гипотезу о нормальности.

Сначала проверим визуальными методами.

Построим гистограмму по переменной Эффективность. Для этого выберем из меню пункт Графика/Гистограммы.

На вкладке Дополнительно укажем: Распределение = Нормальное, количество категорий – 7 (приблизительное значение двоичного логарифма от 100, то есть от количества наблюдений), выберем переменную – Эффективность.

Гипотеза о нормальности кажется очень неправдоподобной (особенно «плохо» выглядят крайние столбцы).

Тот же вывод следует сделать по нормальному вероятностному графику.

Если наблюдаемые значения (откладываемые по оси X) были бы распределены нормально, то все значения на графике должны были попасть на прямую линию. Однако этого не наблюдается.

Теперь вычислим некоторые описательные статистики для переменной

Эффективность.

На вкладке Дополнительно диалога Описательные статистики поставим галочки в полях Асимметрия, стандартная ошибка асимметрии, Эксцесс, Стандартная ошибка эксцесса.

Нажмём OK.

Судя по значению Асимметрии, распределение переменной Эффективность можно считать нормальным (0 «почти что» содержится в интервале

Ассиметрия ±Стандартная ошибка Асимметрии).

Но судя по значению Эксцесса, гипотезу о нормальности следует отклонить. Как правило, если найдена хотя бы одна существенная «нестыковка», гипотезу смело отклоняют, в то время как соответствие даже всем известным критериям ещё не влечёт справедливость гипотезы.

В заключении обратимся к модулю Подгонка распределения.

Выберем пункт Нормальное в левом столбце, нажмём OK.

В появившемся окне укажем в качестве переменную (Эффективность).

Нажмём OK.

Обратите внимание: значение p = 0,00031, то есть значительно меньше 5%. Это значит, что гипотезу о нормальности следует отклонить.

Итак, окончательный вывод: Распределение переменной Эффективность

существенно отличается от нормального распределения.

Сравнение выборок

И первый, и второй вопросы, поставленные в пункте Цели исследования, относятся к задаче сравнения выборок. Будем отвечать на вопросы в порядке их постановки.

1) Какой метод лечения более эффективен?

С точки зрения прикладной статистики, задача сводится к сравнению значений переменной Эффективность по группам I и II (сравнение независимых выборок).

Как мы уже выяснили, распределение отличается от нормального, поэтому мы воспользуемся методами непараметрической статистики.

Шаг 1. Запустим модуль Непараметрическая статистика.

Выберем пункт Сравнение двух независимых групп.

Шаг 2. Укажем переменные.

Обратите внимание: коды для группирующей переменной (I и II) автоматически появятся в соответствующих окошках.

Шаг 3. Нажмём на кнопку U-критерий Манна – Уитни.