Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Сб. лаб. раб..doc
Скачиваний:
31
Добавлен:
23.03.2016
Размер:
2 Mб
Скачать

5. Контрольные вопросы

          1. В каком случае нельзя объединять две выборки данных?

          2. Почему закон распределения объединенного массива неравноточных выборок оказывается отличным от нормального?

          3. Какой доверительный интервал для математического ожидания шире – Стьюдента или Чебышева и по какой причине?

          4. Предположим, Вы по объединенному массиву проверили гипотезу о нормальности распределения и не отвергли ее. Каким доверительным интервалом для математического ожидания Вы воспользуетесь?

Лабораторная работа № 6 построение линейной эмпирической зависимости по опытным данным /метод наименьших квадратов/

1. Цель работы

Изучить основные особенности и методы построения линейного прибли­женияэкспериментальных данных.

2. Задание

Методом наименьших квадратов построить линейную эмпирическую зависимость по опытным данным. Выполнить проверку адекватности математической модели опытным данным с помощью статистических критериев. Оценить погрешность эмпирической зависимости совместными доверительными F-интервалами.

3. Краткая теория

Метод наименьших квадратов

Одновременные измерения двух или более разнородных физических величин с целью нахождения зависимости между ними называются совместнымиизмерениями [2]. Обычно выполняетсяизмерений, при которых в заданных или точно измеренных значениях аргументаопределены значения функции. Задача состоит в том, чтобы попарам (,) построить зависимость (эмпирическую), которая была бы несмещенной и эффективной оценкой истинной зависимости, общий вид которой считают известным. Например, известно, что истинная зависимость есть прямая линия, представленная в виде

. (6.1)

Параметры ,неизвестны, их следует оценить по опытным данным. Будем считать ошибки измеренийслучайными с нулевым математическим ожиданием и дисперсиейпри любом, а также некоррелированными для разных. При этих условиях найти несмещенные и эффективные оценки,параметров,(а следовательно и зависимости (6.1) в целом) можно с помощью метода наименьших квадратов (МНК).

Будем определять оценку функциив виде

, (6.2)

а оценки ,искать таким способом, чтобы сумма квадратов отклоненийотпо всем узлам была минимальной (этот подход называют также принципом Лежандра):

. (6.3)

Это эквивалентно условию , что приводит к уравнениям вида:

(6.4)

Учитывая, что ,– некоторые числа, при этом, получаем

(6.5)

Отметим, что если бы мы записали выражение (6.1) в обычном виде , мы вынуждены были бы решать систему уравнений, выражая параметры один через другой и проводя более сложные вычисления. Использование линейной зависимости в виде (6.1) позволило упростить вычисления (что очень важно для более сложных зависимостей) и получить статистически независимые оценкии.

Учитывая это свойство, можно записать:

Переходя к оценкам, получаем:

(6.6)

При любом законе распределения (если удовлетворяются указанные выше условия) несмещенной оценкой (а при нормальном законе распределения и эффективной) является остаточная дисперсия

, (6.7)

где – число коэффициентов регрессии (для прямой линии=2).

Окончательно получаем

, (6.8)

то есть оценка СКО является функцией от. Значениеминимально прии увеличивается к началу и к концу интервала значений аргумента.

Статистическая проверка адекватности модели

Все приведенные выше выражения справедливы при выполнении предположения о том, что истинный вид зависимости заранее известен, причем эта зависимость линейна по искомым параметрам. Если же это не так, что обычно и имеет место, то утверждение о несмещенности оценок,параметров,оценкидисперсиии оценки(эмпирической зависимости) неизвестной истинной зависимостистановится необоснованным, и правильнее исходить из предположения об их смещенности. Для того, чтобы проверить гипотезу о несмещенности модели (говорят обадекватности модели опытным данным), пользуются статистическими критериями.

Известный F-критерий проверки адекватности модели опытным данным использует статистику в виде отношения остаточной дисперсии(6.7) кнезависимой несмещенной оценке дисперсии опытных данных, где– число степеней свободы этой оценки:

. (6.9)

На практике исследователь часто не имеет в своем распоряжении независимой несмещенной оценки дисперсии опытных данных и не может воспользоваться критерием (6.9). В этом случае можно воспользоваться следующим критерием:

. (6.10)

Этот критерий использует статистику в виде отношения двух последовательных по числу параметров модели остаточных дисперсий; здесь, как обычно, число степеней свободы . В нашем конкретном случае, когда модель имеет вид прямой линии, остаточная дисперсия (6.7) соответствует(числитель статистики). Для нахождения знаменателя следует перейти к более сложной модели, содержащей не 2, а 3 параметра (параболе второй степени), и найти для нее остаточную дисперсию. Однако этот вопрос выходит за рамки изучаемого курса, поэтому в данной работе предполагается, что имеется независимая несмещенная оценка дисперсии, либо известна сама дисперсия.

Линейному регрессионному анализу посвящено множество работ разной сложности, из которых отметим [6, 12, 13, 14]. Наиболее доступно он изложен в [5, 6].

Оценивание погрешности эмпирической зависимости

Погрешность – это некий интервал, построенный в обе стороны от результата измерений и включающий в себя ("накрывающий") неизвестное истинное значение измеряемой физической величины с высокой вероятностью (с заданной или оцененной). Имея оценку СКО эмпирической зависимости (6.8), можно при каждом значении аргумента вычислить доверительные границы для истинного значения при данном значении аргумента, т.е. построить доверительныйt-интервал для истинного значения при данном значении аргумента. Такие доверительныеt-интервалы называются индивидуальнымиt-интервалами. Если повторять опыты (каждый раз с новыми опытными данными в тех же узлах) и следить за любым выбранным узлом, то доля индивидуальныхt-интервалов, накрывающих истинное значение в этом узле (любом) будет в точности равна заданной доверительной вероятности. Однако, если мы будем следить за несколькими узлами (например, за всеми), то мы заметим, что доля узлов, в которых накрытие не имеет место в данном опыте, совсем не соответствует этой доверительной вероятности. Доля узлов, в которых накрытие не имеет места, может оказаться весьма значительной. От этого недостатка свободны так называемыесовместные доверительные интервалы, которые обеспечивают одновременное накрытие истинных значений во всех узлах с вероятностью не меньше заданной.

Погрешность эмпирической зависимости будем выражать совместными доверительными интервалами [12, 5], например, F-интервалами Шеффе, которые проще всего вычислить (они имеют и более серьезные преимущества по сравнению с другими совместными интервалами). Интервалы Шеффе имеют вид:

, (6.11)

где – критическое значение статистикиfдля выбранного уровня значимостии с числами степеней свободы(числитель) и(знаменатель).