Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Matematika_Praktikum

.pdf
Скачиваний:
2149
Добавлен:
13.02.2015
Размер:
3.4 Mб
Скачать

Для интерпретации доверительного интервала в клинических работах следует помнить, что ширина доверительного интервала зависит от (mx )ошибки выборочной средней, которая в свою очередь зависит от объема выборки (n) и от изменчивости данных (S). Если выборка небольшая, то доверительный интервал более широкий, чем в случае выборки большого объема. Широкий доверительный интервал указывает на неточную оценку, а узкий – на точную оценку.

Верхний и нижние пределы доверительного интервала показывают, будут ли результатыклинически значимы.

Количественный признак х генеральной совокупности распределен нормально. По выборке объема n = 16 найдены выборочная средняя xB = 20,2 и среднее квадратическое отклонение S = 0,8. Определить неизвестное математическое ожидание при помощи доверительного интервала при p 0,95.

Решение:

 

x

B

S

 

t

x

B

S

 

t.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

n

 

 

 

 

Найдем

t из таблицы распределения Стъюдента при уровне

значимости 0,95 и числе степеней свободы f=n-1; f=16-1=15.

t( 0,05,f

15) 2,13

 

 

 

 

Запишем:

 

 

 

 

 

 

 

 

 

 

 

20,2

0,8

 

2,13 20,2

0,8

 

2,13(p 0,95);

 

 

 

 

 

 

16

16

 

 

 

 

 

 

 

 

 

 

 

 

 

19,8 20,6ïðè p 0,95.

Имеется выборка объёма n=11 - это значения систолического давления у мужчин в начальной стадии шока,

х: 127,124,155,129,77,147,65,109,145,141.

С помощью пакета прикладных программ на ЭВМ провести статистическую обработку данных выборки и определить доверительныйинтервалдлягенеральной среднейпри p 0,95.

Решение:

ПустьрасчетнаЭВМдал:выборочноесреднее xB 122,01;mx 8,59

181

По таблице распределения Стьюдента найдем:

t( 0,05, f 11 1 10) 2,23.

 

x

B t;

(p 0,95);

122,01 8,59 2,23

122 19;

(p 0,95).

Из обследованных 430 случайно выбранных колосьев пшеницы 37 оказались пораженными головней. Каковы 95%-ные доверительные границы процента пораженности для данного поля?

Решение:

Выборочный средний процент пораженности составляет:

p 37 0,086 8,6. 430

Теперь по формуле находим:

p

8,6 91,4

1,35%

430

 

.

Тогда для 95%-ного доверительного уровня имеем доверительные границы:

p 1,96 p 8,6 2,6 %,

т. е . 95%-ный доверительный интервал есть (6,0 11,2)%.

При рентгеновском облучении 10 мышей дозой в 550 Р погибло 5 мышей. Каковы 99%-ные доверительные границы для доли мышей, погибающих пол действием данной дозы облучения?

Решение:

Имеем:

p

 

5

0,5;

p

0,5 0,5

0,158;

 

 

10

10

 

 

 

.

поэтому при Р=99% (и up 2,58) доверительные границы будут: 0,5-2,58*=0,5-0,408=0,092=9,2%, 0,5+2,58*0,158=0,5+0,408=0,908=90,8% .

Так как найденный доверительный интервал перекрывает почти весь возможный диапазон расположения истинной доли

182

погибающих мышей (от 0 до 100%), то следует заключить, что опыт вообще не дал почти никакого результата (кроме указания, что при данной дозе облучения выборка из 10 мышей недостаточно велика для нахождения ответа на поставленный вопрос).

При изучении в 10 опытах образования у собаки условного рефлекса под действием ранее индифферентного раздражителя были получены результаты (время между моментом включения условного раздражителя и моментом начала слюноотделения): x 8,47 с, sx 1.19 с. Надо найти 95% -ный доверительный интервал для µ , характеризующий данное животное.

Решение:

Для Р=95% и f=n-1=9(число степеней свободы дисперсии) находим в приложении значение t=2,26. Поэтому границы доверительного интервала будут:

8,47 2,26 1,19 8,47 2,69 5,78,

8,47 2,26 1,19 8,47 2,69 11.16

Результаты обычно записываются в одной из следующих двух форм:

5,78 11,16, или 8,47 2,69.

Из табл. приложений видно, что значения tP зависят особенно резко от f при малых f. Поэтому увеличение малых n приводит к сужению доверительного интервала определяемого величиной

tP sx tPs

n не только за счет уменьшения множителя большей степени за счет уменьшения tP . Так,

1

n , но в еще при P 95%

tP

изменении n с двух опытов до трех уменьшает множитель n с

12,71

 

9,0

4,30

 

2,5

2

до

3

, т.е. доверительный интервал сужается в

9,0 : 2,5 = 3,6 раза; при Р=99% ширина доверительного интервала

уменьшается даже примерно в 8 раз (

63,66

 

45,0; 9,93

 

5,7

2

3

;

45,05,7 7,9). При больших значениях n увеличение n на одну единицу сказывается на ширине доверительного интервала гораздо меньше.

183

Из генеральной совокупности извлечена выборка объема n=10:

вариант xi -2 1 2 3 4 5 частота ni 2 1 2 2 2 1

Оценить с надежностью 0,95 математическое ожидание нормально распределенного признака генеральной совокупности по выборочной средней при помощи доверительного интеграла.

Решение:

Выборочную среднюю и исправленное среднее квадратическое отклонение найдем соответственно по формулам:

 

 

 

ni

xi

 

 

 

 

 

ni (xi

 

x

B )2

 

 

XB

,

 

S

 

 

 

n

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

Подставим в эти формулы данные задачи, получим

 

 

 

B 2, S 2,4.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдем

 

t .

Пользуясь

таблицей, по =0,95 и n=10

находим

t =2,26.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдем искомый доверительный интервал

 

 

 

 

B t

S

 

 

 

B t

S

 

 

 

 

 

 

 

X

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n .

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B 2, t 2,26, S 2,4, n 10,

 

 

Подставляя

 

 

X

получим

искомый

 

 

 

 

 

 

 

 

 

 

 

 

доверительный интервал 0,3< <3,7, покрывающий неизвестное математическое ожидание с надежностью 0,95.

По данным 9 независимых равноточных измерений некоторые физические величины найдены среднее арифметическое

результатов измерений XB 30,1 и исправленное квадратическое отклонение S=6. Оценить истинное значение измеряемой величины с помощью доверительного интервала с надежностью

=0,99.

Решение:

Истинное значение измеряемой величины равно ее математическому ожиданию . Поэтому задача сводится к оценке математического ожидания (при неизвестном ) при помощи

184

xB 220ìë

 

 

B

t

S

 

 

 

B

t

S

 

 

X

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доверительного интервала

 

 

n

 

 

 

n

Здесь все величины, кроме t , известны.

Найдем t . По таблице

=0,95 и n=9 находим t =3,36.

 

 

 

 

 

 

 

 

 

 

 

 

Подставим X =30,1, t =3,36, S=6, n=9, получим искомый интервал

23,38< <36,82

По данным выборки объема n=16 из генеральной совокупности найдено исправленное среднее квадратическое отклонение s=1 нормально распределенного количественного признака. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение с надежностью 0,95.

Решение:

Задача сводится к отысканию доверительного интервала

S(1-q)< <s(1+q),

(если q<1)

(*)

или 0< <s(1+q)

(если q>1).

 

По данным =0,95 и n=16 найдем q=0,44. Так как q<1, то, подставив s=1, q=0,44 в соотношение (*), получим искомый доверительный интервал 0,56< <1,44.

13.7. Варианты заданий

13.1. При исследовании частоты дыхания по выборке объема n = 15 были получены выборочная средняя xB =18,5 и среднее квадратическое отклонениеS = 0,6. Определить интервальную оценку математического ожидания с вероятностью p 0,95.

13.2. Найти доверительный интервал для оценки с уровнем

доверительной вероятности p 0,95неизвестного математического ожидания нормального распределения признака х – диаметра эритроцита – генеральной совокупности, если выборочная средняя

x

B =10,2 мкм; исправленное выборочное

среднее квадратическое

отклонение S = 4 и объем выборки п = 16.

16. При исследовании

эффективностидиуретика былоустановлено, что среднее увеличение диуреза в группе из n=10 человек составило . Найти

185

доверительный интервал (p 0,95)

для среднего изменения

диуреза, если ошибка выборочной средней (mx ) 8,9.

13.3. При исследовании проницаемости сосудов сетчатки для выборки объемом n = 25 были получены следующие данные: выборочная средняя xB = 14, среднее квадратическое отклонение S=5. Считая, что данный признак х распределен нормально, найти доверительный интервал для оценки с надежностью 0,95 неизвестного математического ожидания.

13.4. Определить доверительный интервал для средней

активности препарата с уровнем доверительной вероятности

p 0,95.

х: 905,925,940,961,974, 995.

№ 13.5. С доверительной вероятностью p 0,95 определить для количества крови, протекающего за 1 минуту через почки, если выборочная средняя xB = 1300мл крови, а ошибка выборочной средней (mx )=30 мл. Объем выборки n = 12.

1.8. Контрольные вопросы

1.Перечислить основные понятия математической статистики.

2.Каким образом строится полигон частот и гистограмма.

3.Что называют вариантой, вариационным рядом и относительной частотой.

4.Перечислить формы вариационного ряда.

5.Перечислить статистические оценки параметров распределения.

6.Определение статистической оценки неизвестного параметра.

7.Какая оценка называется точечной?

8.Каким требованиям должны удовлетворять статистические оценки?

9.Сформулировать определения генеральной средней и генеральной дисперсии.

10.Записать выражения для вычисления выборочной средней, выборочной дисперсии и исправленной дисперсии. Какая из этих оценок не является несмещенной?

11.Методики вычисления границ доверительного интервала для оценки математического ожидания нормально

распределенной СВ при известном и неизвестном .

186

12. Методика вычисления границ доверительного интервала для оценки среднего квадратического отклонения нормально распределенной СВ.

Глава 14. Корреляционный и регрессионный анализ

Корреляционный анализ - это статистический метод, изучающий связь между явлениями, если одно из них входит в число причин, определяющих другое, или, если имеются общие причины, воздействующие на эти явления.

Основная задача - выявление связи между случайными переменными.

Регрессионный анализ - это статистический метод, изучающий зависимость между результативным признаком Y и входной переменной X.

Основная задача - установление формы связи между переменными и изучение зависимости между ними.

14.1. Функциональная и корреляционная зависимости

Функциональная зависимость - это зависимость вида у =f(x),

когда каждому возможному значению случайной величины X соответствует одно возможное значение случайной величины Y. Например, площадь круга S однозначно связана с радиусом окружности R: S = πR2 .

Корреляционная зависимость - это статистическая зависимость, проявляющаяся в том, что при изменении одной из величин изменяется среднее значение другой:

y f ( x ).

Например, рост и масса. При одном и том же росте масса различных индивидуумов может быть различна, но между средними значениями этих показателей имеется определенная зависимость.

Установление взаимосвязи между различными признаками и показателями функционирования организма позволяют по изменениям одних судить о состоянии других.

187

Для изучения корреляционной связи данные о статистической зависимости удобно задавать в виде корреляционной таблицы или в виде двумерной выборки.

 

Xi

x1

 

x2

...

 

хп

 

Yi

y1

 

y2

...

 

yn

 

Схема эксперимента

следующая:

пусть имеется выборка

объема п из генеральной совокупности N. На каждом объекте выборки определяют числовые значения признаков, между которыми требуется установить наличие или отсутствие связи. Таким образом, получают 2 ряда числовых значений.

Для наглядности полученного материала каждую пару можно представить в виде точки на координатной плоскости. По оси абсцисс откладывают значения одного вариационного ряда - xi, а по оси ординат - другого - yi.

Такое изображение статистической зависимости называется

полем корреляции, или корреляционным полем точек. Оно создает общую картину корреляции.

а

б

Рис. 14.1. Поле корреляции

Если точки группируются вдоль некоторого направления (рис. 14.1а), то это говорит о наличии линейной корреляционной связи между признаками.

Если точки распределены равномерно (рис. 14.1б), то линейная корреляционная связь отсутствует.

На рисунке 13.2 приведены примеры зависимостей Y от X и отдельно даны значения коэффициента корреляции r. Найти

188

соответствие между значениями коэффициента корреляции и графиками зависимостей.

Значения r:

1)

1;

2) 0,8;

3) 0;

4)

-1.

 

 

Эталон ответа: 1...;

2...;

3...;

4....

 

 

Примеры зависимостей:

 

 

Рис. 14.2. Корреляционные поля точек

Ответ: 14.2а; 14.2в; 14.2г; 14.4б.

14.2. Коэффициент линейной корреляции и его свойства

На практике исследователя часто может интересовать не сама зависимость одной переменной от другой, а именно характеристика тесноты связи между ними, которую можно было бы выразить одним числом. Эта характеристика называется

выборочным коэффициентом линейной корреляции r.

Требования к корреляционному анализу: корреляционный анализ - это метод, используемый, когда данные можно считать случайными и выбранными из совокупностей, распределенных по нормальному закону.

Выборочный коэффициент линейной корреляции r характеризует тесноту линейной связи между количественными признаками в выборке:

189

n

( xi x )( yi y )

r

 

i 1

 

 

.

 

 

 

 

 

 

 

 

 

n

 

n

 

 

( xi

 

)2 ( yi

 

)2

 

 

 

 

x

y

 

 

i 1

 

i 1

Если r > 0, то корреляционная связь между переменными прямая, при r < 0 - связь обратная.

Свойства коэффициента корреляции r.

Они проявляются при достаточно большом объеме выборки

п.

1. Коэффициент корреляции принимает значения на отрезке -1 ≤ r ≤ 1. В зависимости от того, насколько |r| приближается к 1, различают связи:

r < 0,3 - слабая связь;

r = 0,3-0,5 - умеренная связь;

r = 0,5-0,7 - заметная (значительная); r = 0,7-0,8 - достаточно тесная;

r = 0,8-0,9 - тесная (сильная);

r > 0,9 - очень сильная, то есть чем ближе |r| к 1, тем теснее связь. При r = 1 - функциональная зависимость у = f(x).

Чем ближе |r| к 0, тем слабее связь.

При r = 0 линейная корреляционная связь отсутствует.

5.r= rух - случайные переменные симметричные; х и у могут взаимозаменяться, не влияя на величину r.

6.Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, то величина коэффициента корреляции не изменится.

7.Коэффициент корреляции величина безразмерная.

Построить корреляционное поле точек и вычислить коэффициент корреляции между ростом (X) и массой (Y) некоторых животных. Исходные данные приведены в выборке

объема п = 10.

 

 

 

 

 

 

 

 

xi

31

32

33

34

35

35

40

41

42

46

yi

7,8

8,3

7,6

9,1

9,6

9,8

11,8

12,1

14,7

13,0

190

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]