5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_
.pdfГлава 9. Многомерные статистические методы |
,19 |
следнего (даже с закрытыми глазами), сразу же восстано
вить цельный образ этого животного.
Систем обучения нейронных сетей достаточно много: У. Маккалоха, Д. Хебба, М. Минского, Дж. Хопфилда,
Ф. Розенблата и др.
Наиболее распространена последняя модель в силу того, что касается наиболее простой структуры сети: од
нослойного персептрона (single layer perceptron), но мы в
данной книге не будем касаться теоретических обоснова
ний алгоритмов обучаемости сетей. И отсылаем заинте
ресованных в этом к ПРИВQДИМОЙ В конце изложения ли
тературе.
Наша цель значительно Уже - ввести читателя в про
цесс практического использования алгоритма нейронныx сетей по уже готовымпрограммам. Итак, как реально мож
но использовать модуль (Нейронные сети) в пакете Statis-
tica?
}'11"ёt)f(Ii~IiIf~ ~ti. • • • • • • • • • • • • • • • • • • • • • •
Дан динамический ряд числа заболеваний дизентери-
ей за год. 11редварительно была сформирована помесяч
ная таблица анализируемых реальных данных, она была
сохранена на диске в конкретной папке. И выделены и,З 11
|
Заболеваемость |
Число |
Качество |
|
Число |
|
|
проф. |
Оперативная |
случаев |
|||
|
||||||
|
детей |
порывов |
||||
Месяц |
работы |
эффеКТИВНОСТЬ. |
дизентерии |
|||
дизентерией |
водоводной |
|||||
|
в очаrах, |
0/0 |
(в расчете |
|||
|
на 1000 чел. |
сети, абс. |
||||
|
баллы |
|
на 10000 чел.) |
|||
|
|
|
|
|||
|
|
|
|
|
|
|
1 |
20,1 |
31 |
1 |
60 |
300 1 |
|
2 |
31,1 |
22 |
2 |
67 |
423.1 |
|
3 |
41,1 |
20 |
1 |
67 |
321,4 |
|
4 |
43,1 |
19 |
2 |
68 |
444,4 |
|
5 |
501 |
13 |
3 |
87 |
600,9 |
|
6 |
53,1 |
12 |
1 |
87 |
7899 |
|
7 |
55,1 |
14 |
1 |
87 |
988,8 |
|
8 |
60,1 |
21 |
2 |
89 |
1012,1 |
|
9 |
60,1 |
22 |
3 |
89 |
1112,4 |
|
10 |
66,6 |
23 |
3 |
90 |
11233 |
|
11 |
67,1 |
эо |
3 |
91 |
1109,8 |
|
12 |
67,8 |
18 |
3 |
88 |
8992 |
140 Медицинская статистика
входящих четыре основные: 1) детская заболеваемость ди
зентерией, 2) число порывов на водоводной сети, 3) каче
ство профилактической работы персонала в очагах, 4) опе
ративная эффективность.
Предстояло получить прогноз динамики заболеваемос ти и определи'ГЬ, какой из четырех отобранных факторов
является ведущим.
ВblПОЛНЯЯ задачу:
1. Открываем пакет Statistica, войдем в модуль Нейрон-
ные сети.
2. Через (Файл новый) выберем команду (Сеть).
3. На экране появится (Создать сеть) - (Create Network),
4.В поле {ТИI1) выбираем (Многослойный персептрон)и
делаем установки: Вход = f, Выход =1.
5.Зададим число слоев сети равное трем, т. е. выберем
трехслойный персептрон.
6.Временное окно (Steps) пометим «1211), это будет от
вечать ежемесячной. регистрации заболеваемости дизенте
рией с присущей сезонной составляющей.
7.Горизонт (Lookahead) пометим «1 ».
8.На экране монитора справа появится схема персеп
трона. Поскольку модель определена, необходимо сеть обу
чить. Для этого надо задать 66 обучающих (Training) и кон трольных (Verification) наблюдений.
9. Далее перемешиваем данные (Shuffle), поскольку мы
анализируем временной ряд, а порядок данных очень ва
жен в соответствии с временными промежутками, то исклю
чается пользование кнопкой СГРУnГlировать (Group Sets). 10. Откроем командой Запуск окно Проекция времен
ного ряда (Time Series Projection). Ряд можно построить
целиком или с какого-то интересующего нас момента. Гра
фически кривая идет достаточно круто вверх, число прогно
зируемых случаев не имеет тенденции к снижению, колеб
лясь в предел~ 1000,0-1020,0 на 10000 населения.
11. Проверимкачество работы обученной сети, открыв
окно Статистики регрессии, включим Запуск (Run).
ГлаВд 9. Многомерные статистические методы |
14. |
12. Для того чтобы получить прогноз, скажем, на один
шаг вперед в меню Запуск (Run) выберем команду (Single Case), откроется соответствующее диалоговое окно, где
надо ввести номер наблюдения, для которого строится про
гноз, жмем вверху справа кнопку Run, в строке Output полу чим искомый реЗУ/lьтат прогноза. Введя для Гlримера 1З, ·по лучим прогнозируемый уровень 1011,231. Оценивая значи
мость входов, мы определили, что из четырех выбранных факторов ведущими (по величине объясненной дисперсии)
являются детская заболеваемость: 0,567 и оперативная эф
фективность: 0,451. Точность прогноза на среднем уровне,
что объясняется малым объемом обучающей выборки, и тем,
что велика вероятность, что процесс по годам нестациона
рен, не совсем ясно и то, как определять закон распределе
ния признаков. Тем не менее ДЛЯ специалиста, принимаю щего решение, отправные точки для дальнейшего анализа
ситуации.. есть, в то время как приемы традиционной описа-
,
тельнои статистики этих выводов сделать не позволяют.
• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
3АКЛЮЧЕНИЕ
Данная книга вобрала в себя все те методы, которые автор использовал и использует в своей научной работе:
Безусловно, в одной даже очень объемистой книге нельзя
объединить то богатство статистических методов, которые
существуют на сегодняшний день, поэтому перед автором была поставлена сугубо прагматическая цель: показать в
ограниченном объеме наиболее значимое в статистике для
большинства практикующих специалистов и научных ра
ботников медико-биологической сферы.
И без того изначально сложная задача бьmа усложне на еще и- тем, что надо бьmо излагать материал просто,
без абстрактных математических и статистических «(умни
чаниЙ», поскольку большая часть тех, на кого рассчитана
книга (медицинские работники в первую очередь (!», пло
хо владеет математикой.
Насколько все получилось, судить тому, кто приобре
тет данную книгу и будет применять описанные в ней ме
тодики в своей работе. Если того, что изложено в ней,
кому-то окажется недостаточно, - в конце IJриведена биб
лиография, где ДЛЯ глубокого и серьезного анализа эмпи
рического материала собрано BC~ лучшее, что можно най
ти в библиотеках и на прилавках книжных магазинов. Возможности компьютерных технологий сегодня рас
тут не по дням и часам, а по минутам (!) и, естественно,
открывают такие большие возможности и перспективы
удачного и продуктивного симбиоза математики и меди
ко-биологических дисциплин, которые 10-15 лет назад
предполагать брались только одержимые статистикой ис
следователи-одиночки.
Удачи вам и успеха- в работе!
ЛИТЕРАТУРА
1. Айвазян С.А., Бежаева З.И., Староверов О.В. Клас сификация многомерных наблюдений. - .М.: Статисти
ка, 1974. - 240 с.
2. Айвазян С.А., Буштабер В.М., Еню"ов Н.С., Мешал
"ин л.д. Прикладная статистика: Классификация и сни
жение размерности. - М.: Финансы и статистика, 1989.
-608 с.
3.Айвазян С.А., Еню"ов И.С., Мешал"ин Л.Д. Приклад
ная статистика: Основы моделирования и первичная об
работка данных. - М.: Финансы и статистика, 1983.
-471 с.
4.Анастази А., Урбина С. Психологическое тестирова
ние. - СПб.: Питер, 2001. - 688 с.
5. Андерсон Т. Введение в многомерный статистический
анализ. - М.: Физ.-математ. литература, 1963. - 500 с.
6. Арене Х, Лейтер Ю. Многомерный дисперсионный
анализ. 1985. - 220 с.
7. Артемьева Е.Ю., Мартынов Е.М. Вероятностные
методы в психологии. - М.: Изд-во МГУ, 1975. - 207 с. ·8. Афифи А., Эйзен С. Статистический анализ: Подход
с использованием ЭВМ. - М.: Мир, .} 982. - 486 с.
9. Бейли Н. Статистические методы в биологии. - М.:
Мир, 1963.-272 с.
10. Бессмертный Б. С. Математическая статистика в клинической, профилактической и экспериментальной
медицине. - М.: Медицина, 1967. - 304 с.
11. Би"ел П., Доксам К. Математическая статистика.
М.: Финансы и статистика, 1983. - Вып. 1. - 278 с.;
Вып. 2. - 254 с.
12. Большой психологический словарь /Сост. и общ. ред. Б.Мещеряков, В.Зинченко. - СПб.: Прайм-ЕВРО
ЗНАК, 2003. - 672 с.
.44 |
Медицинская статистика |
13. Боровиков В. Statistica: искусство анализа данных |
|
на компьютере. - |
СПб.:, Питер, 2001. - 656 с. |
14. Боровuков В.П. Программа Statistica для студентов
иинженеров. - М.: КомпьютерПресс, 2001. - 301 с.
15.Боровuков В.П., Боровиков И.П. Statistica: Статис тический анализ и о~работка данных в среде Windows. -
М.: Филинъ, 1998. - 608 с.
16.Боровков А.А. Математическая статистика. - Но
восибирск: Наука, 1997. - 771 'с.
17.Бородин А.Н. Элементарный курс теории вероят
ностей и математической статистики. - СПб: Лань, 1999.
-224 с.
18.Браверман Э.м. Анализ эмпирических данных. -
М., 1979.
19.Брuллинджер Д. Временные ряды: Обработка дан
ных и теория. ,- М., Мир, 1980.
20.Бурлачук Л.Ф.~ Морозов С.м. Словаръ~справочник
по психодиаrностике. - СПб.: Питер, ,2000. - 528 с.
21.Ван дер Варден Б.Л. Математическая статистика. -
М.: Изд-во ,иностранной литературы, 1960. - 436 с.
22.Воронин Ю.А. Теория классифицирования и ее при
ложения. - Новосибирск: Наука, 1985. - 232 с.
23. Вулф Д.А., Холлендер М. Непараметрические мето
ды статистики. - М., 1983. - 518 с.
24. Ву.,ков И.Н., Бояджиева Л., Солоков Е. Приклад ной регрессионный анализ / Пер. с боЛг. Ю.Л. Адлера. - r...f.: Финансы и статистика, 1987. - 238 с.
25. Гайдышев И. Анализ и обработка данных: Специ
альный справочник. - СПб: Питер, 2001. - 752 с.
26. Гатаулин А.М. Методическое пособие по матема
тической статистике. -' М.: МСХА им. К.А. Тимирязева,
1968.
27.Гланц С. Медико-биоло~ическая статистика. - М.:
Практика, 1999. - 449 с.
28.Гласе Дж., Стэнли Дж. Статистические методы в
педагогике'и психологии. - М.: Прогресс, 1976. - 495 с.
Литература. |
145 |
.29. fублер Е.В. Вычислительные методы анализа и рас
познав~ния патологических процессов.·- Л.: Медицина,
1978.-296 с.
30. Гудвuн Дж. Исследование в психологии: методы и
планирование. - СПб.: Питер, 2004. - 558 с.
31·. Дэйвuсон М. Многомерное шкалирование. - М.:
Финансы и статистика, 1988. - 348 с.
32. Демиденко Е.З. Линейная и нелинейная регрессия.
М., 1981. - 302 с.
33. |
Дрейnер Н., Смит r. Прикладной регрессионный |
|
анализ. - М.: Статистика, 1973. - |
392 с. |
|
34. |
Дуда Р., Харт П. Распознавание образов и анализ |
|
сцен. - |
М.: Мир, 1976. - 512 с. |
|
35. ДЮК В. Обработка данных на ПК в примерах. - |
||
СПб.: Питер, 1997. - 240 с. |
|
|
36. Дюран Б., Оделл П. Кластерный анализ. - М.: Ста- |
||
тистика, 1977. - 128 с. |
. |
37. Елисеева И.И., Рукавишников В.е. Группировка, корреляция, распознавание образов. - М.: Статистика,
1977. - |
144 с. |
38. |
Енюков И. С. Методы, алгоритмы, прогРаммы мно |
гомерного статистического анализа. - М.: финансыI и ста |
|
тистика, 1986. - 232 с. |
|
39. |
Жамбю М. Иерархическии кластер-анализ и соот |
ветствия. - М.: Финансы и статистика, 1988. - 243 с. 40. Иберла К Факторный анализ. - М.: Статистика,
1980. - 321 с.
41. Ивантер Э.В., Коросов А.В. Основы биом~трии:
Учеб. пособие. - Петрозаводск: ПГУ, 1992. - 163 с.
42. Ивченко г.и., Медведев Ю.И. Математическая стати
стика: Учеб. пособие. - М.: Высшая школа, 1984. - 248 с. 43. Информатика: Практикум по технологии работы на компьютере / Под ред. Н.В. Макаровой. - М.: Финан
сы и статистика, 2000. - 256 с.
44. Кадыров ХМ., Антомонов Ю.Г. Синтез математи~
ческих моделей биологических и медицинских систем. -
Киев: Наукова думка, 1974.
'48 |
Медицинская статистика |
45. Камuнскuй Л. С. Обработка клинических и лабора |
|
торных данных. - |
Л.: Медгиз, 1959. - 196 с. |
46. Карасев А.И. Теория вероятностей и математичес |
|
кая статистика. - |
М.: Статистика, 1970. - 344 с. |
47.Кендалл М., Стьюарт А. Статистические выводы и
связи. - М.: HaYKat 1973. - 899 с.
48.Кендалл М., Стьюарт А. Теория распределений. -
М.: Наука, 1966. -. 588 с.
49.Кимбл r. Как правильно пользоваться статистикой.
-М.: Финансы и статистика, 1982. - 294 с.
50.Классификация и J<Ластер / Под ред. Дж. lJэн Рай
зина. - М.: Мир, 1980. - 392 с.
51.Клиzер С.А., Косолапов М.С., Толстова Ю.Н. Шка лирование при сборе и анализе социологической инфор
мации;- М.: Наука, 1978. - 112 с.
52.Кэндалл М. Ранговые корреляции. - М.: Статисти
ка, 1975. - 214 с.
53.Лакuн Г. Ф. Биометрия. - М.: Высшая школа,
1990. - 352 с.
54.Леман Э. Проверка статистических гипотез / Пер.
сангл. Ю.В. Прохорова. - М.: Наука, 1979. - 408 с.
55.Леман Э. Теория точечного оценивания / Пер. с
англ. - М.: Наука, 1991. - 443 с.
56.Леонтьев В. Новейшая энциклопедия персональ наго компьютера. - М.: ОЛМА-ПРЕСС, 2003. - 640 с.
57.Лuкеш Н., Ляга Н. Основные таблицы математичес
кой статистики. - М.: Финансы и статистика, 1985. - 356 с.
58. ЛисеmС08 А.Н. Математические методы планирова ния многофакторных медика-биологических эксперимен
тов. - М.: Медицина, 1979. - 344 с.
59.Литmл Р.Дж.А., РубинД.Б. Статистический анализ данных с пропусками. - М.: Финансы и статистика, 1990.
60.Макаров А.А., Кулаuчев А.П., Синева Н.С. Исполь
зование программ обработки данных в преподавании кур
сов теории вероятностей, математической и прикладной
статистики и информатики. - М.: МГУ, 2002. - 39 с.
Литература |
1.7 |
61. Мандель И.Д. Кластерный анализ. - М.: Финансы
истатистика, -1988. _. 176 с.
62.Математический энциклопедический словарь. -
М.: Большая Российская энциклопедия, 1995. - 848 с.
63.Мир"ин Б.Г. Анализ,качественных признаков и
структур. - М.: Статистика, 1980. - 320 с.
64.Мир"ин Б.Г. Группировки в социально-экономи
ческих исследованиях. - М.: Финансы и статистика,
1985. - 224 с.
65. Мостелер Ф., ТьюкиДж. Анализ данных и регрессия.
Вып. 1,2. - М.: Финансы и статиcrика, 1981; 1982. - 300 с.
66. Мюллер П., Пойман П., Шторм Р. Таблицы по ма
тематической статистике. - М.: Финансы и статистика,
1982. - 278 с.
67. Ншzuмов В.В. Теория эксперимента. - М.: Наука,
1971. - 208 с.
68.Ншzuмов В.В., Голикова т.и. Логические основания fUIанирования эксперимента. - М.: Металлургия, 1980.
69.Окунь Я. Факторный анализ. - М.: Статистика,
1974. - 200 с.
70. ОуЭН Д.Б. Сборник статистических таблиц. - М.:
ВЦ АН СССр, 1966. - 586 с.
71. ПетровА.П. Статистическая обработка результатов
экспериментальных исследований: Учеб. пособие. - Кур
ган: Изд-во Курганского ун-та, 1998. - 85 с.
72. Плохинекий Н.А. Биометрия. - М.: МГУ, 1970. -
368 с.
73. Плохинекий Н.А. Основные вопросы современной
биометрии // Биометрический анализ в биологии. - М.:
Изд-во МГУ, 1982. - С. 7-11.
74. Рао С.Р. Линейные статистические методы и их
применение. - М.: Наука, 1968. - 547 с.
75. Рунион Р. Справочник по непараметрической ста
тистике. - М.: Финансы и статистика, 1982. - 198 с.
7.6. Себер Дж. Линейный регрессионный анализ /Под ред. М.Б. Малютова. - М.: Мир, 1980. - 456 с.
'148 |
Медицинская статистика |
77. Справочник по прикладной статистике: В 2т. / Под
ред. Э. Лойда, У. Ледермана, Ю.Н. Тюрина. - М.: Финан
сы и статистика, 1989, 1990. - 510, 526 с.
78.Статистические методы дЛЯ ЭВМ / Под ред. к. Эн
елейна, Э.Рэлстона, [С.Уилфа. - М.: Наука, 1986. - 236 с.
79.ТеflЛов Б. М. Простейшие способы факторного ана
лиза / / Психология и психофизиология индивидуальных разЛичий. - М.: Институт практической психологии; -
Воронеж: МОДЭК, 1998. - 544 с. - С. 312-385.
80. Тюрuн Ю.Н., Макаров А.А. Анализ данных на ком пьютере /Изд. 3-е, перераб. и дополн. - М.: ИНФРА-М,
2003. - 540 с.
81. Тюрuн Ю.Н., Макаров А.А. Анализ данных на ком
пыОтере. - М.: ИНФРА-М; Финансы и статистика,
1995. - 384 с.
82. Тюрuн Ю.Н., Макаров А.А. Статистический анализ
данных на компьютере. - М.: ИНФРА-М, 1999. - 528 с.
83. УилКС С. Математическая статистика. - М.: Наука,
1967. - 632 с.
84. Факторный, дискриминантный и кластерный ана
лиз / Дж. о. Ким, Ч.У.Мюллер, У.Р.Клекка и др. / Под ред. И.С. Енюкова. - М.: Финансы и статистика, l2!9. - 215 с.
85. Фе.рсmер Э., Ренц Б. Методы корреляционного и
регрессионного анализа. - М.: Финансы и статистика,
1983. - 302 с.
86. Фишер Р. Статистические методы для исследовате лей. - М.: Госстатиздат, 1958. - 268 с.
87. Хан г., Шапиро С. Статистические модели в инже
нерных задачах. - М.: Мир, 1969. -. 289 с.
88. Хардле В. Прикладная непараметрическая регрес
сия. '- М., 1993. - 349 с.
89. Харман Г. Современный факrорный анализ. - М.:
Статистика, 1972. - 486 с.
90. Холлендер М., Вулф д. Непараметрические методы
статистики. - М.: Финансы и статистика, 1983. - 518 с.
91. Хьелл Л., Зuглер Д. Теории личности. - СПб.: Пи
тер, 2002. - 608 с.