- •Лабораторная работа № 1 первичная обработка результатов прямых многократных измерений /вычисление основных статистических параметров/
- •1. Цель работы
- •2. Задание
- •3. Краткая теория
- •4. Ход работы
- •5. Контрольные вопросы
- •4. Ход работы
- •5. Контрольные вопросы
- •Лабораторная работа № 3 проверка нормальности закона распределения /тремя различными методами/
- •1. Цель работы
- •2. Задание
- •3. Краткая теория
- •4. Ход работы
- •5. Контрольные вопросы
- •4. Ход работы
- •5. Контрольные вопросы
- •4. Ход работы
- •5. Контрольные вопросы
- •Лабораторная работа № 6 построение линейной эмпирической зависимости по опытным данным /метод наименьших квадратов/
- •1. Цель работы
- •2. Задание
- •3. Краткая теория
- •4. Ход работы
- •5. Контрольные вопросы
- •Лабораторная работа № 7 оценка связи номинальных признаков /таблицы сопряженности/
- •1. Цель работы
- •2. Задание
- •3. Краткая теория
- •4. Ход работы
- •5. Контрольные вопросы
- •Заключение
- •Приложение 1 Установка надстройки "Пакет анализа"
- •Приложение 2 Виды ошибок при задании формул
- •Приложение 3 Кратка теория диаграмм
- •Приложение 4 Статистические таблицы
- •Список литературы
- •Оглавление
5. Контрольные вопросы
В каком случае нельзя объединять две выборки данных?
Почему закон распределения объединенного массива неравноточных выборок оказывается отличным от нормального?
Какой доверительный интервал для математического ожидания шире – Стьюдента или Чебышева и по какой причине?
Предположим, Вы по объединенному массиву проверили гипотезу о нормальности распределения и не отвергли ее. Каким доверительным интервалом для математического ожидания Вы воспользуетесь?
Лабораторная работа № 6 построение линейной эмпирической зависимости по опытным данным /метод наименьших квадратов/
1. Цель работы
Изучить основные особенности и методы построения линейного приближенияэкспериментальных данных.
2. Задание
Методом наименьших квадратов построить линейную эмпирическую зависимость по опытным данным. Выполнить проверку адекватности математической модели опытным данным с помощью статистических критериев. Оценить погрешность эмпирической зависимости совместными доверительными F-интервалами.
3. Краткая теория
Метод наименьших квадратов
Одновременные измерения двух или более разнородных физических величин с целью нахождения зависимости между ними называются совместнымиизмерениями [2]. Обычно выполняетсяизмерений, при которых в заданных или точно измеренных значениях аргументаопределены значения функции. Задача состоит в том, чтобы попарам (,) построить зависимость (эмпирическую), которая была бы несмещенной и эффективной оценкой истинной зависимости, общий вид которой считают известным. Например, известно, что истинная зависимость есть прямая линия, представленная в виде
. (6.1)
Параметры ,неизвестны, их следует оценить по опытным данным. Будем считать ошибки измеренийслучайными с нулевым математическим ожиданием и дисперсиейпри любом, а также некоррелированными для разных. При этих условиях найти несмещенные и эффективные оценки,параметров,(а следовательно и зависимости (6.1) в целом) можно с помощью метода наименьших квадратов (МНК).
Будем определять оценку функциив виде
, (6.2)
а оценки ,искать таким способом, чтобы сумма квадратов отклоненийотпо всем узлам была минимальной (этот подход называют также принципом Лежандра):
. (6.3)
Это эквивалентно условию , что приводит к уравнениям вида:
(6.4)
Учитывая, что ,– некоторые числа, при этом, получаем
(6.5)
Отметим, что если бы мы записали выражение (6.1) в обычном виде , мы вынуждены были бы решать систему уравнений, выражая параметры один через другой и проводя более сложные вычисления. Использование линейной зависимости в виде (6.1) позволило упростить вычисления (что очень важно для более сложных зависимостей) и получить статистически независимые оценкии.
Учитывая это свойство, можно записать:
Переходя к оценкам, получаем:
(6.6)
При любом законе распределения (если удовлетворяются указанные выше условия) несмещенной оценкой (а при нормальном законе распределения и эффективной) является остаточная дисперсия
, (6.7)
где – число коэффициентов регрессии (для прямой линии=2).
Окончательно получаем
, (6.8)
то есть оценка СКО является функцией от. Значениеминимально прии увеличивается к началу и к концу интервала значений аргумента.
Статистическая проверка адекватности модели
Все приведенные выше выражения справедливы при выполнении предположения о том, что истинный вид зависимости заранее известен, причем эта зависимость линейна по искомым параметрам. Если же это не так, что обычно и имеет место, то утверждение о несмещенности оценок,параметров,оценкидисперсиии оценки(эмпирической зависимости) неизвестной истинной зависимостистановится необоснованным, и правильнее исходить из предположения об их смещенности. Для того, чтобы проверить гипотезу о несмещенности модели (говорят обадекватности модели опытным данным), пользуются статистическими критериями.
Известный F-критерий проверки адекватности модели опытным данным использует статистику в виде отношения остаточной дисперсии(6.7) кнезависимой несмещенной оценке дисперсии опытных данных, где– число степеней свободы этой оценки:
. (6.9)
На практике исследователь часто не имеет в своем распоряжении независимой несмещенной оценки дисперсии опытных данных и не может воспользоваться критерием (6.9). В этом случае можно воспользоваться следующим критерием:
. (6.10)
Этот критерий использует статистику в виде отношения двух последовательных по числу параметров модели остаточных дисперсий; здесь, как обычно, число степеней свободы . В нашем конкретном случае, когда модель имеет вид прямой линии, остаточная дисперсия (6.7) соответствует(числитель статистики). Для нахождения знаменателя следует перейти к более сложной модели, содержащей не 2, а 3 параметра (параболе второй степени), и найти для нее остаточную дисперсию. Однако этот вопрос выходит за рамки изучаемого курса, поэтому в данной работе предполагается, что имеется независимая несмещенная оценка дисперсии, либо известна сама дисперсия.
Линейному регрессионному анализу посвящено множество работ разной сложности, из которых отметим [6, 12, 13, 14]. Наиболее доступно он изложен в [5, 6].
Оценивание погрешности эмпирической зависимости
Погрешность – это некий интервал, построенный в обе стороны от результата измерений и включающий в себя ("накрывающий") неизвестное истинное значение измеряемой физической величины с высокой вероятностью (с заданной или оцененной). Имея оценку СКО эмпирической зависимости (6.8), можно при каждом значении аргумента вычислить доверительные границы для истинного значения при данном значении аргумента, т.е. построить доверительныйt-интервал для истинного значения при данном значении аргумента. Такие доверительныеt-интервалы называются индивидуальнымиt-интервалами. Если повторять опыты (каждый раз с новыми опытными данными в тех же узлах) и следить за любым выбранным узлом, то доля индивидуальныхt-интервалов, накрывающих истинное значение в этом узле (любом) будет в точности равна заданной доверительной вероятности. Однако, если мы будем следить за несколькими узлами (например, за всеми), то мы заметим, что доля узлов, в которых накрытие не имеет место в данном опыте, совсем не соответствует этой доверительной вероятности. Доля узлов, в которых накрытие не имеет места, может оказаться весьма значительной. От этого недостатка свободны так называемыесовместные доверительные интервалы, которые обеспечивают одновременное накрытие истинных значений во всех узлах с вероятностью не меньше заданной.
Погрешность эмпирической зависимости будем выражать совместными доверительными интервалами [12, 5], например, F-интервалами Шеффе, которые проще всего вычислить (они имеют и более серьезные преимущества по сравнению с другими совместными интервалами). Интервалы Шеффе имеют вид:
, (6.11)
где – критическое значение статистикиfдля выбранного уровня значимостии с числами степеней свободы(числитель) и(знаменатель).