Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казанский федеральный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Kurs_Theor.doc

Скачиваний:

Добавлен:

22.12.2018

Размер:

1.86 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 1816 17 18 > Следующая >>>

Доказательство корректности метода II.

Пусть - решение уравнения , и константа

В силу непрерывности слева функции распределения, в точке также выполняется неравенство . С другой стороны, для непрерывной справа функции имеет место обратное неравенство

. (*)

Таким образом, справедлива следующая цепочка соотношений:

Первая эквивалентность здесь справедлива в силу монотонного убывания функции распределения по параметру и по определению , вторая – в силу определения . Соотношение (*) гарантирует теперь, что вероятность первого неравенства , что и требовалось доказать. Аналогично доказывается утверждение для верхней границы.

Исследование зависимости между двумя характеристиками

Очень часто в эксперименте наблюдается не одна, а несколько характеристик одного и того же объекта (например, рост и вес человека, урожайность зерна и количество внесенных удобрений и т.п.). Предполагается, что значения характеристик изменяются от объекта к объекту случайным образом. Требуется

выяснить, имеется ли зависимость между исследуемыми характеристиками;
построить уравнение наилучшего прогноза одной характеристики по значениям другой.

Теоретические основы.

Обозначим через , наблюдаемые в эксперименте случайные величины. Попытаемся сначала спрогнозировать возможное значение характеристики , если известно наблюдённое значение характеристики . Если прогноз осуществляется с помощью некоторой функции , то мерой качества такого прогноза служит среднеквадратическая ошибка . Функцию , для которой достигается минимум среднеквадратической ошибки, называют функцией регрессии на . Теоретический вид этой функции весьма прост:

– условное среднее при фиксированном

значении с.в. .

На практике построение хорошей оценки для неё возможно лишь для дискретных с.в. . Поэтому обычно рассматривают регрессию не среди всех возможных функций, а только среди линейных. Уравнение линейной среднеквадратической регрессии на – линейной функции, минимизирующей среднеквадратическую ошибку, имеет вид

где – среднее значение и дисперсия с.в. ,

– среднее значение и дисперсия с.в. ,

– коэффициент корреляции между и .

Коэффициент корреляции часто называют коэффициентом линейной связности. Такая интерпретация обусловлена следующими свойствами этого коэффициента.

Он принимает значения от -1 до 1 и не зависит от масштаба измерений.
Если , то между с.в. и существует точная линейная связь, причем при эта связь имеет положительную направленность (с ростом одной характеристики, растет и другая), а при – отрицательную.
Если с.в. и независимы, то .
Для нормального случайного вектора равенство нулю коэффициента корреляции эквивалентно независимости с.в. и .
Минимальная среднеквадратическая ошибка линейного прогноза характеристики по значениям характеристики равна .
Если , то наилучший прогноз с.в. – это ее среднее , а линия регрессии на представляет собой прямую, параллельную оси OX.

Свойство 5) применяют при описании степени зависимости между случайными величинами. Считается, что разброс с.в. на обусловлен влиянием на нее с.в. и на внутренними факторами, присущими самой с.в. , или другими неучтенными факторами.

Неизвестные параметры линейной регрессии легко оцениваются своими выборочными аналогами:

– средним значением и дисперсией выборки ,

– выборочным коэффициентом корреляции.

Заметим, что последний коэффициент является состоятельной, но смещенной оценкой истинного коэффициента корреляции .

Таким образом, оценку уравнения регрессии на можно записать в виде

с коэффициентом регрессии . Для этой линии достигается минимум суммы расстояний по оси OY между выборочными точками и графиком линии регрессии, когда минимум ищется среди всех линейных функций:

При построении регрессии X на Y можно просто в уравнении регрессии произвести перестановку переменных :

Для этой линии достигается минимум суммы расстояний по оси OX между выборочными точками и графиком линии регрессии. Последнее уравнение используется при отыскании наилучшего прогноза характеристики по наблюдённому значению . Для построения графика удобнее привести это уравнение к виду

Таким образом, обе линии регрессии проходят через точку с координатами и отличаются лишь коэффициентом наклона. Можно показать, что в привычной системе координат ( – по оси абсцисс, – по оси ординат) регрессия на проходит круче регрессии на . Схему построения регрессий Y на X и X на Y иллюстрирует следующий рисунок.

Если выборочный коэффициент корреляции r близок к нулю, то линии регрессии будут близки к взаимно перпендикулярным прямым, проходящим параллельно осям координат, причем регрессия Y на X будет параллельна оси ОХ. Если r по модулю близок к 1, то угол между линиями регрессии становится близким к нулю, и в пределе (при |r| = 1) обе линии совпадут.

На практике чаще всего свойство 4) коэффициента корреляции переносят на все вероятностные модели и интерпретируют равенство нулю коэффициента корреляции как независимость наблюдаемых характеристик, что не всегда верно. В общем случае независимость случайных величин и означает, что

(*)

для любых событий и из области значений с.в. и . Если известны совместное распределение вектора и частные распределения и его компонентов, то для проверки независимости достаточно проверить выполнение равенства

Если случайный вектор имеет не нормальное распределение, то для проверки гипотезы независимости его характеристик необходимо тем или иным способом проверить выполнение соотношения (*).

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 1816 17 18 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.02.201522.05 Кб13kursovye_2.docx
#
30.08.2019321.02 Кб6Kursovye_po_novomu_GOST4.doc
#
20.11.20191.79 Mб33Kurs_Excel.doc
#
10.02.201529.79 Mб14Kurs_Excel.pdf
#
10.02.2015392.19 Кб10kurs_proekt_5_rafa.doc
#
22.12.20181.86 Mб8Kurs_Theor.doc
#
10.02.20156.05 Mб5Kurs_Theor.pdf
#
10.02.20152.79 Mб20k_5New.pdf
#
10.02.20152.02 Mб9K_r_po_statistike 2.docx
#
18.09.2019137.73 Кб2L2_Evolyutsia_nauki_upravlenia.doc
#
15.11.2018304.13 Кб4lab15.doc

Доказательство корректности метода II.

Исследование зависимости между двумя характеристиками