Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Биофизика / Методичка по математике

.pdf
Скачиваний:
216
Добавлен:
06.03.2016
Размер:
518.16 Кб
Скачать

II. Решение задачи о вычислении точечных и интервальных оценок измеряемой величины по выборочным данным с помощью персонального компьютера.

Выборка (получена из массива данных приложения (табл.1)

10,59

 

10,65

 

10,4

 

10,45

 

10,56

 

 

10,52

 

10,68

 

10,35

10,29

 

10,68

 

 

10,54

 

10,68

 

10,38

10,52

 

10,59

 

 

10,35

 

10,53

 

10,4

 

10,5

 

10,59

 

 

10,73

 

10,9

 

 

10,52

10,51

 

10,68

 

 

10,3

 

10,68

 

10,42

10,35

 

10,68

 

 

 

Характеристики выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Объем выборки, n

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

15

30

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

Выборочное среднее

 

 

 

 

 

xi

 

 

 

 

 

10,53

10,53

10,53

 

 

 

xB

 

=

i=1

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

Исправленная выборочная

 

 

 

 

(xi

 

 

B )2

 

 

 

 

 

 

 

 

 

 

 

x

0,01

 

0,02

0,02

 

дисперсия

 

 

S 2

=

i=1

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Исправленное среднее

 

S =

S 2

 

 

 

 

 

0,10

 

0,13

0,15

 

квадратическое отклонение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент Стьюдента

t p ( f )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Объем выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n=5

n=30

 

 

 

Доверительная

 

р

 

 

 

 

1,13

 

1,01

 

 

 

вероятность

 

=0,68

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р=0,95

 

 

 

 

2,78

 

2,05

 

 

 

 

 

 

Р

 

 

 

 

4,60

 

2,76

 

 

 

 

 

 

=0,99

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Интервальная оценка генерального среднего,

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Объем

выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n=5

n=30

 

 

 

Доверительная

 

р

 

 

 

 

 

0,05

 

0,03

 

 

 

вероятность

 

=0,68

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р=0,95

 

 

 

 

 

0,13

 

0,05

 

 

 

 

 

 

Р

 

 

 

 

 

0,21

 

0,07

 

 

 

 

 

 

=0,99

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xГ (xB x),(xB + x)

Из полученных результатов видно, что с увеличением объема выборки при одном и том же значении доверительной вероятности полуширина доверительного интервала уменьшается.

31

В то же время при увеличение значения доверительной вероятности и одинаковом объеме выборки полуширина доверительного интервала увеличивается.

Приложение

Для вычисления точечных и интервальных оценок на занятии приведены значения некоторых случайных величин, распределенных по нормальному закону. Таблица 1

10,8

10,98

10,13

10,98

10,2

10,75

10,13

10,54

10,73

10,79

10,6

10,73

10,76

10,56

10,68

10,73

10,42

10,33

10,54

10,66

10,33

10,75

10,89

10,25

10,33

10,36

10,58

10,78

10,73

10,58

10,8

10,75

10,67

10,58

10,97

10,45

10,75

10,33

10,45

10,8

10,68

10,73

10,98

10,36

10,6

10,66

10,58

10,6

10,73

10,25

10,33

10,76

10,63

10,43

10,98

10,45

10,43

10,42

10,67

10,58

10,75

10,2

10,74

10,76

10,6

10,74

10,94

10,73

10,45

10,8

10,6

10,47

10,75

10,43

10,47

10,56

10,33

10,6

10,8

10,5

10,54

10,8

10,74

10,5

10,52

10,58

10,43

10,73

10,73

10,42

10,8

10,47

10,23

10,54

10,45

10,74

10,42

10,42

10,36

10,73

10,4

10,65

10,42

10,6

10,47

10,94

10,94

10,97

10,42

10,79

10,43

10,36

10,43

10,23

10,56

10,56

10,36

10,94

10,68

10,65

10,97

10,74

10,45

10,52

10,52

10,63

10,56

10,65

10,4

10,36

10,47

10,98

10,54

10,54

10,2

10,52

10,54

10,8

10,63

10,54

10,76

10,42

10,42

10,6

10,63

10,4

10,73

10,2

10,42

10,75

10,36

10,36

10,5

10,76

10,13

10,42

10,6

10,36

10,8

10,97

10,97

10,73

10,53

10,9

10,94

10,5

10,97

10,8

10,36

10,36

10,42

10,53

10,35

10,56

10,42

10,36

10,73

10,63

10,42

10,94

10,54

10,73

10,52

10,36

10,63

10,42

10,2

10,36

10,56

10,42

10,48

10,54

10,97

10,2

10,94

10,6

10,97

10,52

10,36

10,69

10,42

10,36

10,6

10,56

10,5

10,36

10,54

10,42

10,29

10,36

10,63

10,5

10,52

10,53

10,63

10,42

10,36

10,8

10,97

10,2

10,97

10,53

10,54

10,2

10,36

10,97

10,73

10,36

10,6

10,36

10,54

10,42

10,6

10,97

10,36

10,63

10,63

10,5

10,63

10,42

10,36

10,5

10,36

10,6

10,58

10,13

10,69

10,2

10,36

10,97

10,36

10,58

10,5

10,2

10,97

10,75

10,6

10,97

10,36

10,47

10,69

32

Таблица 2 Представленные данные показывают возраст больных язвенной болезнью (по

материалам А.Ю.Котаева - кафедра хирургических болезней №2 второго л/ф).

50

41

33

48

40

29

28

46

75

75

50

51

80

53

50

24

29

32

53

52

45

30

45

70

68

65

53

69

51

25

42

50

51

34

66

42

41

54

45

31

47

30

53

40

28

52

23

54

60

48

35

53

49

45

42

51

53

67

53

80

34

70

50

52

39

49

39

31

45

51

60

33

38

33

55

44

51

53

43

55

40

65

52

49

54

47

62

63

46

67

38

51

72

39

40

46

84

54

47

50

37

49

38

58

39

64

85

53

47

51

42

48

35

58

33

36

36

57

59

44

65

60

24

32

50

23

50

34

38

52

44

30

33

51

25

39

36

24

19

49

32

32

31

22

52

49

45

61

65

84

50

29

27

62

52

34

32

19

62

56

55

45

58

26

67

44

34

73

39

53

40

59

47

35

57

36

72

56

51

63

38

26

48

38

33

30

39

44

38

58

41

52

18

58

49

46

34

42

39

23

35

43

30

56

43

40

40

58

39

46

92

51

38

24

56

35

19

63

45

39

38

37

54

53

46

48

33

47

43

52

56

42

38

60

69

45

83

37

43

62

80

66

51

32

46

57

37

46

24

65

60

31

39

44

71

61

46

41

36

46

42

36

60

38

70

64

31

62

35

83

58

41

45

49

40

40

35

33

32

27

41

29

57

42

76

55

31

58

63

44

53

36

56

50

26

30

41

29

63

61

47

62

53

60

37

49

32

48

48

41

17

47

48

31

69

50

21

30

55

35

43

31

51

57

41

67

67

46

36

85

51

46

41

43

61

43

33

39

66

45

24

32

23

36

65

46

49

38

58

24

33

56

48

60

44

44

79

36

58

62

62

55

51

50

54

33

40

24

58

47

34

44

35

49

57

32

73

50

76

40

54

24

57

62

37

30

79

47

47

89

52

54

60

59

43

47

27

33

56

45

58

28

42

35

72

65

45

50

77

65

32

40

45

53

53

52

40

66

49

80

69

30

50

74

49

53

31

57

43

46

60

64

42

28

77

62

38

41

33

26

56

68

30

28

23

68

60

50

74

79

42

31

31

23

49

56

53

25

75

53

72

43

67

50

79

51

34

41

59

39

36

74

50

61

42

72

43

63

76

78

54

48

35

46

54

45

21

40

66

32

43

71

28

26

84

48

36

41

31

30

57

26

45

37

47

48

90

43

46

57

75

65

56

48

56

48

43

59

72

50

48

69

40

61

74

Т е м а 8

Об использовании гистограмм в задачах медицинской диагностики

Целью любого эксперимента является получение надежных выводов об измеряемых величинах или каких-либо функциях от них. Эта цель не достигается с окончанием измерений. Результаты измерений необходимо проанализировать и провести необходимую математическую обработку. Только после этого можно сформулировать выводы относительно величин, представляющих интерес. Если результаты измерений можно представить в виде интервального ряда распределения, то гистограмма является хорошей наглядной иллюст-

33

рацией экспериментальных данных. Этот графический способ представления материала широко используется в практике медицинских исследований.

Литература для подготовки к занятию по теме:

Ю.В.Морозов "Основы высшей математики и статистики", М., 1998,

с.135-140.

В процессе подготовки к практическому занятию по теме необходимо выполнить следующее:

1. Повторить следующие теоретические вопросы:

1)Что такое генеральная совокупность и выборка?

2)Дискретные и непрерывные случайные величины.

3)Статистический дискретный ряд распределения.

4)Как рассчитать выборочную среднюю?

5)Как рассчитать исправленную выборочную дисперсию и исправленное среднее квадратическое отклонение?

6)Как рассчитать полуширину доверительного интервала?

П. Изучить по указанной литературе следующие теоретические вопросы:

1)Понятие частоты, плотности частоты, относительной частоты, плотности относительной частоты случайной величины.

2)Статистическая вероятность случайного события.

3)Функция плотности распределения вероятностей.

4)Что называется статистическим интервальным рядом распределения? Как его построить?

5)Что называется гистограммой?

6)Как вычислить среднее выборочное значение для интервального ряда распределения?

7)Как вычислить исправленную выборочную дисперсию и исправленное среднее квадратическое отклонение для интервального ряда распределения?

Эталоны решения типовых задач и задачи для самоконтроля.

Задача 1. В 20 экспериментах ( n = 20 ) непрерывная случайная величина A принимает значения: 21, 11, 17, 23, 28,14,19,22,24,33,16,21,18,29,23,22,31,24,27,26.

По этим данным составить статистический интервальный ряд распределения.

Решение Среди полученных результатов находим минимальное и максимальное

значения случайной величины: xmin =11; xmax = 33 .

Далее разность xmax xmin надо разделить на равное число частей.

Однако часто эта разность нацело не делится на требуемое число частей. В этом случае весь интервал несколько расширяется как в сторону меньших, так и в сторону больших значений. В рассматриваемой задаче

удобно выбрать x = 5 . Тогда удобнее рассмотреть интервал (10,35). Получим, что в первый интервал (10-15) попадает всего два значения перемен-

ной x , а именно: 11,14. Частота m = 2 . Во второй интервал (15-20) попа-

дают значения переменной x равные 17,19,16,18, из чего следует m = 4 . Продолжая аналогичные рассуждения, составим таблицу, содержащую последовательность интервалов и соответствующих им частей, т.е. статистический

интервальный ряд распределения (всего 5 интервалов, k = 5).

34

 

X

 

 

 

10-15

 

15-20

 

 

20-25

 

 

 

 

 

25-30

 

30-35

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

2

 

4

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

4

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В общем виде статистический интервальный

ряд

распределения

имеет

вид таблицы:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

x0 x1

 

x

 

x

2

 

 

x

2

x

3

 

 

 

...

 

x

x

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

m1

 

m2

 

 

 

 

m3

 

 

 

 

 

 

...

 

mk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

i

 

 

 

 

 

 

Зная

частоты

m

 

и

 

величину

 

 

x , найдем плотности

частот

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

плотности

относительных

 

 

частот

 

 

 

 

Например,

 

для

1-го

интервала

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

плотность

частоты

 

 

mi

 

=

2

= 0.4

;

а

 

 

плотность

 

относительной

 

частоты

 

 

x

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P*

2

= 0.02 . Данные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

обработки

результатов представлены

в таблицах 3

и

 

x

520

 

4.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

10-15

 

15-20

 

20-25

 

 

 

 

25-30

 

30-35

 

 

 

 

 

 

 

 

 

 

 

mi

 

 

 

 

0,4

 

0,8

 

 

 

 

 

1,6

 

 

 

 

 

0,8

 

0,4

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

10-15

 

15-20

 

20-25

 

 

 

 

25-30

 

30-35

 

 

 

 

 

 

 

 

 

 

 

P*

 

 

 

 

0,02

 

0,04

 

 

 

 

0,08

 

 

 

 

 

0,04

 

0,02

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача для самоконтроля

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При измерении артериального давления у 30 случайным образом ото-

бранных пациентов клиники получены следующие результаты (в мм рт.ст.):

 

151,

166,

133,

155,

179,

148,

 

143,

 

128,

138,

172,

 

163,

163,

157,

 

158,

136,

169,

153,

142,

147,

134,

 

164,

 

167,

131,

152,

 

145,

176,

122,

 

149,

154, 161.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Представить эти данные в виде интервального статистического ряда распределения.

Задача 2. По результатам данных таблиц 3 и 4 построить гистограмму плотности частот и гистограмму плотности относительных частот.

35

 

 

Решение

 

 

P*

 

 

 

m

 

 

 

 

 

x

 

 

x

 

1,6

 

 

 

 

 

 

 

 

0,08

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,2

 

 

 

 

 

 

 

 

0,06

 

 

 

 

 

 

 

0,8

 

 

 

 

 

 

 

 

0,04

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

х

0,02

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

30

 

 

 

 

 

 

 

20

 

 

10 20 30

Рис.1 Гистограмма

 

 

 

Рис 2. Гистограмма плотности частот.

 

 

 

 

 

 

 

 

 

плотности относительных

 

 

 

 

 

 

 

 

 

 

 

 

 

частот.

 

Гистограммы на рис.1 и рис.2 имеют один и тот же вид. Поэтому с точки зрения наглядности не имеет значения представлять ли данные в виде гистограммы плотности частот или гистограммы плотности относительных частот. Однако для установления вида функции плотности распределения вероятностей необходимо пользоваться гистограммой плотности относительных частот.

Приближенно предполагаемый вид функции плотности распределения вероятностей показан на рис.2 пунктирной линией.

Представление экспериментальных данных именно в виде гистограммы плотности относительных частот необходимо, если ставится, например, задача о сравнении вида распределении двух или нескольких совокупностей. В таком случае бывает полезно совмещать различные гистограммы, а это возможно только, если рассматриваются плотности относительных частот. Это позволяет исключить зависимость от объема выборки и ширины интервала

x .

Практика показывает, что при построении гистограммы важно правильно

выбрать ширину интервала

x . Если число интервалов

k будет

мало

ширина интервала x

- велика), следует ожидать, что частично информация

о случайной величине

x

может быть потеряна. С другой

стороны,

если

k

слишком велико, ( x - мало), то обработка результатов измерений будет излишне трудоемкой, не давая существенного выигрыша в информации.

 

Практика показывает, что рационален выбор числа интервалов k

в за-

висимости от объема выборки с помощью таблицы 5.

 

 

 

 

 

 

Таблица 5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

объем выборки,

n

 

25-40

 

40-60

60-100

 

100-200

>200

 

 

 

 

число

интервалов,

 

5-6

 

6-8

 

7-10

 

 

8-12

 

10-15

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

Задачи для самоконтроля

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1) Измерения роста 30 случайным образом отобранных студентов дали

результаты:

163,

 

171,

176, 176,

180,

174,

167,

170,

 

 

 

 

178, 177,

179,

 

172,

176,

177,

175,

176,

181,

174,

175,

175,

181,

174,

180,

178,

175,

181, 177,

177,

179,

 

173.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

36

Построить статистический интервальный ряд распределения. Построить гистограмму плотности частот, гистограмму плотности относительных частот.

2) Построить гистограмму плотности частот и гистограмму плотности относительных частот величины кровяного давления у 200 практически здоровых женщин в возрасте 60-65 лет по данным статистического интервального ряда распределения.

X ,

70-

80-

90-

100-

110-

120-

130-

 

140-

150-

 

мм.рт.ст.

80

90

100

110

120

130

140

 

150

160

 

m

1

1

5

17

36

42

57

 

30

11

 

Нарисовать

приближенно функцию

плотности

распределения вероятно-

стей.

Задача 3. По результатам измерений массы (в кг) 80 девочек в возрасте 10 лет рассчитать среднее выборочное значение (xB ), исправленную выборочную дисперсию (S 2 ) и исправленное среднее квадратическое отклонение (S ).

X , кг

18-22

22-26

26-30

30-34

34-38

m

10

20

35

10

5

Решение.

Для расчета среднего выборочного значения интервального ряда рас-

пределения прежде всего находим значения середин интервалов x* . Они вычисляются по формуле:

xi* =

 

x

i1

+ x

i

, где

xi1

и xi - начальное и конечное значение интервала.

 

 

 

2

 

x* =

(18 + 22)

= 20;

x* =

(22 + 26)

= 24; x* =

(26 +30)

= 28; x* = 32;

x* = 36.

 

 

 

1

 

 

 

2

 

 

 

2

2

3

2

4

5

 

 

 

 

 

 

 

 

 

 

 

xB

S 2

S 2

Представим результаты в виде таблицы:

 

 

 

 

 

 

 

 

x*

20

 

24

 

 

28

 

32

36

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

10

 

20

 

 

35

 

10

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

mi xi*

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

B

i=1

 

 

 

 

 

 

 

 

Найдем

 

x

B

по формуле

 

 

, где

- число интервалов.

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

=

10 20 + 20 24 +35 28 +10 32 +5 36 27

 

 

 

 

 

 

 

 

 

10 + 20 +35 +10 +5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значение исправленной выборочной дисперсии находим по формуле

 

 

 

k

mi (xi*

 

B )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

k

 

 

 

 

=

 

i=1

 

 

 

 

 

 

,

где

 

 

n =

mi

 

-

объем

выборки,

 

 

 

n

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

=

 

1

[10(20 27)2

+ 20(24 27)2

+ 35(28 27)2

+10(32 27)2

+10(32 27)2 + 5(36 27)2 ]==16

79

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

37

Исправленное

среднее

квадратическое отклонение будет равно

S = S 2 ; S = 16 = 4

 

 

 

 

Таким образом,

 

 

B 27;

S 2 16; S = 4.

 

x

Задачи для выполнения на практическом занятии.

1) Данные о систолическом давлении крови x (в мм.рт.ст.) у 100 практически здоровых женщин в возрасте 60-69 лет приведены ниже.

Построить гистограмму плотности относительных частот. Вычислить

 

x

B;

S.

 

 

 

 

 

 

 

 

 

x (мм.рт.ст.)

139

115

120

125

137

139

122

121

127

132

152

126

133

111

122

123

135

137

139

150

81

95

136

114

128

140

149

144

125

141

101

101

129

138

132

145

105

107

130

136

134

135

115

148

140

146

119

113

127

136

142

137

111

151

143

116

121

123

127

106

73

143

106

120

144

147

142

127

131

110

159

133

109

130

154

148

116

139

118

124

112

98

134

131

131

156

119

124

113

125

113

102

139

141

140

112

128

126

118

134

Указание. Для выполнения

задания рекомендуется принять xmin = 70 ,

xmax = 200 , число интервалов k =13.

2) Значения артериального

давления крови x (мм.рт.ст.) у 50 женщин

в возрасте 60-69 лет с диагнозом "гипертоническая болезнь", составляют:

192

145

156

177

157

186

173

162

172

194

185

149

153

182

162

193

194

165

158

166

171

151

175

161

178

126

137

176

148

159

119

152

196

165

163

173

187

154

164

137

172

144

161

179

173

187

175

164

169

171

 

 

 

Построить гистограмму плотности

относительных

частот. Вычислить

 

 

B;

S.

 

 

 

x

 

 

 

 

 

Указание. Рекомендуется выбрать xmin = 70 , xmax = 200 , число интерва-

лов

k =13.

гистограммой

задания 1), исполь-

 

 

 

Гистограмму следует построить под

зуя числовую ось с тем же началом координат и масштабной единицей, что и в задании 1. Сравнить результаты.

Т е м а 9

Использование метода наименьших квадратов в процессе статистической обработки медико-биологических данных

Метод наименьших квадратов используется для расчета параметров функции заданного вида, наилучшим образом отражающей экспериментальнонаблюдаемую зависимость между двумя величинами.

38

Литература для подготовки к занятию по теме:

1)Ю.В.Морозов "Основы высшей математики и статистики", М., 1998, с.156157, 39-43, 54-56.

2)Данная методическая разработка.

Впроцессе подготовки к практическому занятию по теме необходимо выполнить следующее:

1. Повторить следующие теоретические вопросы:

1)Уравнение линейной зависимости y = ax + b

2)Что называется частной производной функции нескольких аргументов?

3)Правила нахождения частных производных функции нескольких аргументов.

4)Необходимые условия существования экстремума функции.

П. Изучить по указанной литературе следующие теоретические вопросы:

1)Для чего нужен метод наименьших квадратов (МНК)?

2)В чем состоит основная идея этого метода?

3)Исходя из чего выбирается тот или иной вид зависимости между изучаемыми величинами, наилучшим образом аппроксимирующей экспериментальные результаты?

Теоретические сведения Пусть производятся опыты, цель которых - исследование зависимости

некоторой величины Y от величины X , например, зависимости температуры электролита от времени воздействия на него электрического поля УВЧ. Исследуемые величины связаны определенной функциональной зависимостью

y = f (x) , содержащей в общем случае некоторое количество параметров а, в, с.

Пусть в результате измерений величин X и Y получены результаты, изображенные в таблице.

X

x

x

2

x

...

xn

 

1

 

 

2

 

Y

y

y

2

y

2

...

yn

 

1

 

 

 

 

 

 

n .

Число экспериментально полученных пар значений равно

Если точки (xi , yi

)

построить в прямоугольной системе координат, то

характер

расположения

 

этих точек

может привести

к определенному предпо-

ложению о форме зависимости величины Y от величины X . Действительно, если указанные точки расположены приблизительно вдоль прямой линии, как указано на рис.1, то вполне естественно предположить о существовании линейной зависимости между величинами. Если точки расположены вдоль ветви

параболы (рис.2),

то можно предположить квадратическую зависимость и

т.д.

 

у

у

х

х

39

рис.1 рис.2

Для простоты ограничимся рассмотрением тех случаев, когда подобный подход приводит к предположению о наличии линейной зависимости величины Y от величины X , т.е., когда есть основания предполагать, что уравнение сглаживающей линии имеет вид

y = ax + b

Метод наименьших квадратов позволяет найти параметры сглаживающей линии, являющейся графиком искомой зависимости, так, чтобы ординаты найденной линии минимально отличались от соответствующих экспериментальных значений. Полученное таким образом уравнение сглаживающей линии будет наилучшим приближением к экспериментальным данным.

При использовании этого метода критерием оптимальности подбора искомых параметров уравнения сглаживающей линии является выполнение следующего требования. Необходимо, чтобы сумма квадратов отклонений ординат всех эмпирических точек графика от ординат соответствующих (т.е. имеющих те же абсциссы) точек сглаживающей прямой была минимальной.

 

n

U (a,b) = [yi (axi +b)]2 min

 

i=1

 

Условием минимума этой функции является равенство нулю ее частных

производных

U

= 0

a

U

.

 

= 0

 

 

b

 

Найдя эти производные и приравняв их нулю, получим систему двух уравне-

ний для определения параметров a

и b .

U

 

n

 

 

 

 

 

 

 

=

2[( yi axi b)(xi )]= 0

 

 

a

 

 

 

i=1

 

 

 

 

 

 

 

 

U =

n

 

 

 

 

 

 

 

 

2[( yi axi b)(1)]= 0

 

 

b

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решая эту систему, можно получить выражения для a и b соответст-

венно:

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

n

n

 

a =

nxi yi xi yi

 

i=1

 

i=1

i=1

 

 

 

 

 

 

2

 

 

 

 

 

 

n

2

 

n

 

 

 

 

 

nxi

 

xi

 

 

 

 

 

i=1

 

i=1

 

 

 

 

 

 

n

n

 

 

n

n

 

 

 

nxi 2 yi xi xi yi

 

b = i=1

i=1

 

 

i=1

i=1

(1)

 

 

 

 

 

n

 

 

n

2

 

 

 

 

 

nxi 2

xi

 

 

 

 

 

 

i=1

 

i=1

 

 

Эталоны решения типовых задач и задачи для самоконтроля

40