Лекция №1
.pdfКению и т.д. Кроме организованного в 1901 г. Пирсоном и Гальтоном журнала «Biometrika» стали выходить журналы «Biometrics» (с 1945 г.), «Biometrische Zeitschrift» (с 1959 г.). Уже 16 лет издательством JOHN WILEY & SONS издается специализированный журнал «Statistics in Medicine». В 1998 г. это издательство выпустило 6-томную «Энциклопедию биостатистики», содержащую более 2 тысяч статей. Все эти издания не только выполняют обучающую функцию, но и прививают читателям вкус и потребность к грамотной статистической обработке экспериментальных данных. Наряду с этим созданы многочисленные факультеты эпидемиологии и биостатистики, школы и курсы по биостатистике, издано огромное количество специализированной литературы по биометрии.
Этапы анализа данных
Дело не в цифрах, - сказала она наконец, - а в том, что вы с ними делаете.
(А. Мэндервил. Крушение Лэймии Гёрдлнек)
Организационно-аналитическая деятельность при статистическом анализе включает семь основных шагов, или макроэтапов:
1)постановка задачи исследования и сбор исходных данных для
анализа;
2)ввод данных в компьютер, сохранение их в архиве;
3)визуальное изучение данных в графическом виде;
4)редактирование и выполнение различных преобразований
данных;
5)выбор и исполнение соответствующего метода анализа;
6)представление полученных результатов в числовой, табличной и графической форме;
7)выводы по результатам анализа и повторение всех или части
этапов.
1. Сбор данных для анализа
Сбор данных для анализа обычно осуществляется одним из трех
способов:
-в ходе активного эксперимента с технической регистрацией значений соответствующих переменных;
-в результате наблюдения или опроса с ручной регистрацией соответствующих показателей;
-данные извлекаются из литературных источников.
Процедура сбора данных определяется задачей исследования.
2. Ввод данных
Зафиксированные в документах учета сведения об изучаемом объекте представляют собой тот первичный материал, который нуждается в соответствующей обработке. Обработка начинается с упорядочения или систематизации собранных данных. Процесс систематизации результатов массовых наблюдений, объединения их в относительно однородные группы по некоторому признаку называется группировкой. Группировка – не просто технический прием, позволяющий представить первичные данные в комплексном виде, но и глубоко осмысленное действие, направленное на выявление связей между явлениями. Ведь от того, как группируется исходный материал, во многих случаях зависят выводы о природе изучаемого явления. Нельзя группировать в одну и ту же совокупность неоднородные по составу данные, необдуманно выбирать способ группировки. Группировка должна отвечать требованию поставленной задачи и соответствовать содержанию изучаемого явления.
Способы группировки данных
1.Таблицы. Наиболее распространенной формой группировки являются статистические таблицы. Они бывают простыми и сложными.
2.К простым относятся таблицы, применяемые при альтернативной группировке, когда одна группа вариант противопоставляется другой.
Рис. 18. Простая таблица
К сложным относятся таблицы, применяемые при выяснении причинно-следственных отношений между варьирующими признаками.
Рис. 19. Сложная таблица
3. Статистические ряды. Статистическим называют ряд числовых значений признака, расположенных в определенном порядке. В
зависимости от того, какие признаки изучаются, ряды делят на атрибутивные, вариационные, ряды динамики и регрессии, а также ряды ранжированных значений признаков и ряды накопленных частот,
являющихся производными вариационных рядов.
Введенные данные обычно отображаются в электронной таблице, или матрице данных, где столбцы представляют различные переменные, а строки
– измерения значений этих переменных, произведенные в различных условиях, в различное время, у различных объектов.
3. Визуальный анализ
После ввода на данные в электронной таблице следует просто посмотреть, чтобы составить общее представление о характере их изменения,
специфических особенностях и закономерностях, что очень важно для выбора стратегии и тактики дальнейшего исследования. Для этого можно использовать как исходное числовое представление, так и различные формы графического изображения. Действительно, человек часто намного более продуктивно воспринимает информацию в виде зрительных образов, чем в виде цифр. Визуальный анализ является одним из эффективнейших средств исследования. Действительно, человеческий глаз во взаимодействии с головным мозгом является точнейшим и мощнейшим измерительным и аналитическим инструментом, способным часто подмечать и выявлять то,
что недоступно ни одному вычислительному алгоритму.
4. Преобразование данных
Часто исходные данные перед вычислительным анализом необходимо скорректировать методами ручного редактирования или же полуавтоматического преобразования к виду, адекватному методу выбранного анализа. Нередко требуется также удаление из введенных данных выбросов (резко отличающихся от остальных данных по величине,
которые могут быть, например, результатом некорректных измерений) и
посторонних данных, а также замена (или удаление) пропущенных
(неизмеренных) значений.
После выполнения преобразований может потребоваться повторный визуальный анализ. В случае простейших задач исследования этот этап может отсутствовать.
5.Статистический анализ
После этого можно приступать собственно к выбору метода анализа,
адекватного поставленной задаче, и его последовательному исполнению.
6.Представление результатов
Для облегчения последующих выводов и заключений полученные результаты следует представить в виде обобщенных таблиц, а также адекватных, убедительных и эффективных графиков.
Рис. 20. Способы представления результатов исследования
7. Выводы
В зависимости от характера выводов по результатам статистического анализа возможны различные продолжения. Если выводы полностью исчерпывают поставленную задачу, то исследователь может перейти к постановке и решению новой задачи. В противном случае может понадобиться выбор и исполнение другого метода анализа, выполнение новых преобразований, их повторное визуальное изучение, ввод или извлечение из архива дополнительной информации.