Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы научных исследований.doc
Скачиваний:
40
Добавлен:
19.11.2019
Размер:
1.52 Mб
Скачать

5.3. Различие средних значений

 

При расчете средних величин измерений двух выборок можно ожидать, что будут получены два разных значения даже тогда, когда обе вы­борки относятся к одной и той же генеральной совокупности.

Если, например, в течение каждого из двух произвольно вы­бранных дней проверять по одной выборке вес разлива дозировочной машины, то средние веса разлива двух дней будут отличаться друг от друга. Возможно, что это различие обусловлено только случайностью выборок. Однако не исключено, что усредненный вес разлива действительно изменяется. В первом случае обе выборки взяты из одной и той же генеральной совокупности, во втором случае — из двух различных генеральных совокуп­ностей.

Если две средних величины измерений получены из одной и той же гене­ральной совокупности, то они представляют собой две оценки одного и того же математического ожидания. В этом случае величина t имеет t - распределение Стьюдента:

где n — объем выборок; - среднее значение выборки; S — рассеяние выборки (индекс соответствует номеру выборки).

Для t - распределения можно рассчитать вероятность того, что величина t выйдет за пределы ± с (рис. 6.2).

 

Проверку статистической достоверности различия средних величин измерений можно осуществить следующим образом:

1. Проводят вычисления:

2. Приравнивая критерий значимости с величине t0, (рис.6.2) определяют соответствующую вероятность Р (так называемый уровень значимости). При этом число степеней свободы

nf = n1+ n2 — 2.

3. Различие средних величин измерений является статистически досто­верным, если уровень значимости достаточно мал (например, Р = 1 %).

В этом случае можно считать, что имеется систематическое различие между средними величинами измерений.

Если проверка осуществляется для того, чтобы убедиться в случайности различий средних величин измерений, то уровень значимости должен быть по возможности наиболее высоким (например, Р ). В неохваченной области вопрос остаётся открытым. Для его решения необходимо повторить проверку с привлечением выборки большего объема.

Если объём обеих выборок одинаков, т.е. n1 = n2 = n, то зависимости для to и nf упрощаются:

В этом случае степень свободы после операции 2 будет равна n – 1.

5.4. Линейная регрессия

В измерительной технике очень часто определяют зависимость одной переменной у от другой . С помощью линейной регрессии исследуют линейную зависимость измеряемых величин. Рассмотрим величину как зависимую, а вели­чину как независимую переменные. Так, например, при поверке величина, воспроизводимая ме­рой, является независимой, а по­казание поверяемого прибора - зависимой.

Наиболее предпочтительна линейная зависи­мость, но измеренные величины , как правило, не лежат на прямой. В данном случае это происходит потому, что имеется случайная погрешность измерений. При ис­следовании статистических про­цессов это обусловлено и тем, что взаимосвязь является не функциональной, а лишь статистической. Так, например, рост сыновей зависит от роста родителей, но только в статистическом смысле.

Возникает вопрос, как провести искомую прямую, называемую прямой регрессии или прямой выравнивания, через точки измерения, нанесённые на - диаграмме, или как её рассчитать.

Исходя из того, что для определённого значения независимой переменной величина нормального распределена относительно её математического ожидания, лежащего на прямой, и что это нормальное распределение не зависит от переменной , можно применить метод наименьших квадратов. При этом рассматривают не расстояние точки измерения от прямой, а разность ординат точки измерения и прямой.

Прямую, соответствующую минимальной сумме квадратов погрешности, с наибольшей вероятностью можно рассматривать как искомую прямую генеральной совокупности и рассчитывать по следующей формуле:

где

Крутизна прямой b называется коэффициентом регрессии и рассчитывается следующим образом:

b =

В результате получают оценку прямой, описывающей линейную зависимость. Здесь снова возникает проблема доверительных границ. Сначала мы рассмотрим доверительные границы для коэффициента регрессии b. Процедура решения этого вопроса состоит в следующем:

1. Выбирают доверительную вероятность Р (%) (например, 95, 99 % или другую).

2. По результатам исследований (рис.6.2) (t – распределение Стьюдента) определяют где число степеней свободы.

3. Вычисляют : , и в:

S S b =

4. Определяют доверительные границы погрешности коэффициента регрессии:

Математическое ожидание коэффициента регрессии b с доверительной вероятностью Р (%) лежит в области

Если, доверительный интервал для коэффициента b включает величину = 0, то с выбранной доверительной вероятностью нет оснований утверждать, что действительный коэффициент регрессии b отличен от нуля. В этом случае считают, что линейная зависимость не установлена с достаточной достоверностью.

Дополнительная недостоверность состоит в том, что средняя величина представляет собой лишь оценку соответствующего математического ожидания. Поэтому недостоверным является и «положение» прямой, построенной с учетом измерений .

Теперь можно для каждого значения прямой линии = b

определить доверительный интервал следующим образом:

1. Выбирают доверительную вероятность Р (например, 95, 99 % или другую).

2. По результатам, представленным на рис.5.2 (t – распределение Стьюдента) определяют c = f (р, nf), где nf = n – 2 число степеней свободы.

3. Проводят вычисления:

S S b =

4. Определяют доверительный интервал погрешности измерений значений для разных значений :

(6.1)

Математическое ожидание величины с выбранной доверительной вероятностью Р лежит в области

Как видно из (6.1), этот интервал зависит от и минимален при что связано с установленной выше недостоверностью коэффициента b.

Если требуется проверить только то, что крутизна b значимо отличается от нуля, т.е. что имеет место существенная и линейная зависимость между и , то поступают следующим образом.

Определяют:

S S b =

Вычисляют

По результатам исследований (рис. 6.2) (t – распределение Стьюдента) определяют Р = f (с, nf ), nf = n – 2.

Вероятность Р (%) представляет уровень значимости отклонения крутизны b исследуемой зависимости от прямой с b = 0.

Если уровень значимости достаточно мал (например, Р 1%), то гипотеза, что = 0, исключается. В этом случае можно предполагать, что зависимость должна быть линейной.