Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лекция №1

.pdf
Скачиваний:
30
Добавлен:
21.05.2015
Размер:
832.46 Кб
Скачать

Кению и т.д. Кроме организованного в 1901 г. Пирсоном и Гальтоном журнала «Biometrika» стали выходить журналы «Biometrics» (с 1945 г.), «Biometrische Zeitschrift» (с 1959 г.). Уже 16 лет издательством JOHN WILEY & SONS издается специализированный журнал «Statistics in Medicine». В 1998 г. это издательство выпустило 6-томную «Энциклопедию биостатистики», содержащую более 2 тысяч статей. Все эти издания не только выполняют обучающую функцию, но и прививают читателям вкус и потребность к грамотной статистической обработке экспериментальных данных. Наряду с этим созданы многочисленные факультеты эпидемиологии и биостатистики, школы и курсы по биостатистике, издано огромное количество специализированной литературы по биометрии.

Этапы анализа данных

Дело не в цифрах, - сказала она наконец, - а в том, что вы с ними делаете.

(А. Мэндервил. Крушение Лэймии Гёрдлнек)

Организационно-аналитическая деятельность при статистическом анализе включает семь основных шагов, или макроэтапов:

1)постановка задачи исследования и сбор исходных данных для

анализа;

2)ввод данных в компьютер, сохранение их в архиве;

3)визуальное изучение данных в графическом виде;

4)редактирование и выполнение различных преобразований

данных;

5)выбор и исполнение соответствующего метода анализа;

6)представление полученных результатов в числовой, табличной и графической форме;

7)выводы по результатам анализа и повторение всех или части

этапов.

1. Сбор данных для анализа

Сбор данных для анализа обычно осуществляется одним из трех

способов:

-в ходе активного эксперимента с технической регистрацией значений соответствующих переменных;

-в результате наблюдения или опроса с ручной регистрацией соответствующих показателей;

-данные извлекаются из литературных источников.

Процедура сбора данных определяется задачей исследования.

2. Ввод данных

Зафиксированные в документах учета сведения об изучаемом объекте представляют собой тот первичный материал, который нуждается в соответствующей обработке. Обработка начинается с упорядочения или систематизации собранных данных. Процесс систематизации результатов массовых наблюдений, объединения их в относительно однородные группы по некоторому признаку называется группировкой. Группировка – не просто технический прием, позволяющий представить первичные данные в комплексном виде, но и глубоко осмысленное действие, направленное на выявление связей между явлениями. Ведь от того, как группируется исходный материал, во многих случаях зависят выводы о природе изучаемого явления. Нельзя группировать в одну и ту же совокупность неоднородные по составу данные, необдуманно выбирать способ группировки. Группировка должна отвечать требованию поставленной задачи и соответствовать содержанию изучаемого явления.

Способы группировки данных

1.Таблицы. Наиболее распространенной формой группировки являются статистические таблицы. Они бывают простыми и сложными.

2.К простым относятся таблицы, применяемые при альтернативной группировке, когда одна группа вариант противопоставляется другой.

Рис. 18. Простая таблица

К сложным относятся таблицы, применяемые при выяснении причинно-следственных отношений между варьирующими признаками.

Рис. 19. Сложная таблица

3. Статистические ряды. Статистическим называют ряд числовых значений признака, расположенных в определенном порядке. В

зависимости от того, какие признаки изучаются, ряды делят на атрибутивные, вариационные, ряды динамики и регрессии, а также ряды ранжированных значений признаков и ряды накопленных частот,

являющихся производными вариационных рядов.

Введенные данные обычно отображаются в электронной таблице, или матрице данных, где столбцы представляют различные переменные, а строки

– измерения значений этих переменных, произведенные в различных условиях, в различное время, у различных объектов.

3. Визуальный анализ

После ввода на данные в электронной таблице следует просто посмотреть, чтобы составить общее представление о характере их изменения,

специфических особенностях и закономерностях, что очень важно для выбора стратегии и тактики дальнейшего исследования. Для этого можно использовать как исходное числовое представление, так и различные формы графического изображения. Действительно, человек часто намного более продуктивно воспринимает информацию в виде зрительных образов, чем в виде цифр. Визуальный анализ является одним из эффективнейших средств исследования. Действительно, человеческий глаз во взаимодействии с головным мозгом является точнейшим и мощнейшим измерительным и аналитическим инструментом, способным часто подмечать и выявлять то,

что недоступно ни одному вычислительному алгоритму.

4. Преобразование данных

Часто исходные данные перед вычислительным анализом необходимо скорректировать методами ручного редактирования или же полуавтоматического преобразования к виду, адекватному методу выбранного анализа. Нередко требуется также удаление из введенных данных выбросов (резко отличающихся от остальных данных по величине,

которые могут быть, например, результатом некорректных измерений) и

посторонних данных, а также замена (или удаление) пропущенных

(неизмеренных) значений.

После выполнения преобразований может потребоваться повторный визуальный анализ. В случае простейших задач исследования этот этап может отсутствовать.

5.Статистический анализ

После этого можно приступать собственно к выбору метода анализа,

адекватного поставленной задаче, и его последовательному исполнению.

6.Представление результатов

Для облегчения последующих выводов и заключений полученные результаты следует представить в виде обобщенных таблиц, а также адекватных, убедительных и эффективных графиков.

Рис. 20. Способы представления результатов исследования

7. Выводы

В зависимости от характера выводов по результатам статистического анализа возможны различные продолжения. Если выводы полностью исчерпывают поставленную задачу, то исследователь может перейти к постановке и решению новой задачи. В противном случае может понадобиться выбор и исполнение другого метода анализа, выполнение новых преобразований, их повторное визуальное изучение, ввод или извлечение из архива дополнительной информации.