Добавил:
ilirea@mail.ru Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
34
Добавлен:
21.08.2018
Размер:
569.53 Кб
Скачать

Регрессионный анализ

Для того, что бы представить внешний вид предполагаемой зависимости данные эксперимента наносятся на график, после чего определяется вид зависимости (линейная, криволинейная и т.п.) и уравнение, которым можно описать имеющуюся зависимость.

В результате получается кривая и уравнение регрессии.

Пример уравнения регрессии (прямая линия)

Регрессионный анализ предполагает построение кривой регрессии, построенной методом наименьших квадратов и описывающей имеющуюся зависимость уравнением кривой с определенной точностью.

Метод наименьших квадратов. Сумма квадратов расстояний (вычисленных по оси Y) от наблюдаемых точек до прямой является минимальной.

В уравнении регрессии одна из переменных, х, называется независимой переменной, а другая, у, — зависимой. Набор значений у, соответствующих определенному значению х, обозначим у|х. Параметры уравнения регрессии в приведенном примере – a и b.

Нельзя сказать, что одна переменная действительно определяет другую. Просто по значению одного признака мы предсказываем значение второго. В условиях эксперимента мы произвольно меняем независимую переменную и смотрим, как меняется зависимая. При этом речь действительно идет о зависимости, то есть о причинной связи. В прочих же случаях выявление статистической связи двух переменных указывает на возможность причинной связи, но не доказывает ее. Разобраться в причинах и следствиях вообще невозможно чисто статистическими методами. Необходимо, в частности, найти биологический механизм, порождающий выявленную связь.

Например, эпидемиологические данные о связи пассивного курения с заболеваемостью ишемической болезнью сердца еще не доказывают, что пассивное курение способствует развитию ИБС. Может быть, и то и другое — следствие какой-либо неизвестной причины, например нервной обстановки в рабочем коллективе. Однако экспериментальные данные о том, что пассивное курение и отдельные компоненты табачного дыма вызывают поражение сердца у лабораторных животных, говорят в пользу именно причинной связи.

Уравнение регрессии по выборочным данным

В реальной жизни редко удается получить данные обо всей совокупности, и исследователю приходится довольствоваться выборками.

Такой эта выборка представляется исследователю, который не может наблюдать всю совокупность.

Коэффициенты уравнения рассчитываются также методом наименьших квадратов.

Стандартные ошибки коэффициентов регрессии

Подобно тому как выборочное среднее — это оценка истинного среднего (среднего по совокупности), так и выборочные параметры уравнения регрессии a и b — не более чем оценки истинных коэффициентов регрессии α и β. Разные выборки дают разные оценки среднего — точно так же разные выборки будут давать разные оценки коэффициентов регрессии.

Рассмотрим другую выборку из той же совокупности

Если построить все возможные выборки по 10 элементов в каждой, получится совокупность всех значений а и b. Их средние равны α и β, а стандартные отклонения — σα и σβ. Эти стандартные отклонения называются стандартными ошибками коэффициентов регрессии. Стандартные ошибки коэффициентов регрессии, подобно стандартной ошибке среднего, используются при проверке гипотез и вычислении доверительных интервалов. Выборочные оценки для σα и σβ обозначаются соответственно sa и sb и вычисляются по следующим формулам:

Доверительная область для линии регрессии

Обычно мы не знаем истинных величин коэффициентов регрессии α и β. Нам известны только их оценки а и b. Иначе говоря, истинная прямая регрессии может пройти выше или ниже, быть более крутой или пологой, чем построенная по выборочным данным. Мы вычислили доверительные интервалы для коэффициентов регрессии. Можно вычислить доверительную область и для самой линии регрессии.

Сравнение двух линий регрессии

Часто требуется сравнить линии регрессии, рассчитанные по двум выборкам.

Пример.

Мышечная сила при ревматоидном артрите. Причины ограниченной подвижности при ревматоидном артрите разнообразны: болезненность суставов, их тугоподвижность, атрофия мышц. Каков вклад каждого из этих факторов? Пытаясь ответить на этот вопрос, П. С. Хелливелл и С. Джексон. исследовали, в частности, связь между мышечной массой и силой. В исследовании приняли участие 25 больных ревматоидным артритом (1-я группа) и 25 здоровых (2-я группа). Рассчитывали площадь поперечного сечения предплечья и ручным динамометром определяли силу сжатия кисти. Результат показан на рис. Кружки — результаты здоровых, квадратики — больных ревматоидным артритом. Решить данную задачу можно путем сравнения двух линий регрессии, т.е. узнать, есть ли значимое различие между линиями регрессии

Если разброс точек относительно обшей линии, значительно превышает разброс относительно двух отдельных линий, то различия линий следует считать значимыми.

Линии регрессии различаются наклоном, который круче в группе здоровых.

Соседние файлы в папке лаб № 3