- •Лекция 5 Методы статистичекого анализа данных
- •Вариационные ряды и их анализ
- •Число групп в зависимости от числа наблюдений
- •Методика расчета средней арифметической величины по способу моментов
- •Характеристика разнообразия признака в статистической совокупности
- •Оценка достоверности результатов исследования
- •1. Определение средней ошибки средней (или относительной) величины (ошибки репрезентативности) - т.
- •2. Определение доверительных границ м и р.
- •Распределение больных корью в группе вакцинированных и невакцинированных лиц
Число групп в зависимости от числа наблюдений
п (число наблюдений) r (число групп) |
31—45 6—7 |
46—100 8—10 |
101—200 11 — 12 |
201—500 12—17 |
В нашем примере с задержкой дыхания число наблюдений n=50, поэтому в вариационном ряду следует иметь 10 групп.
При большом колебании признака его максимальные величины могут не соответствовать размерам последней группы и будут вне ее. В этом случае необходимо увеличить число групп с тем, чтобы можно было включить эти крайние варианты.
II этап: определение величины интервала (i) между группами. Обязательным требованием при построении вариационного ряда является соблюдение единого интервала. Определяя величину интервала между группами, амплитуду вариационного ряда (разность между максимальным и минимальным значениями вариант) делят на число групп. В нашем примере (табл.8) n=50 и тогда r=10.
Величина интервала i = Vmax – Vmin
r число групп
Полученный интервал 4,6 рекомендуется округлить до целого числа - 5.
III этап: определение начала, середины и конца группы. Прежде всего, необходимо определить середину для первой группы. В нашем примере максимальная варианта равна 64. Поскольку середина группы должна делиться на величину интервала, то, соблюдая это требование, за середину первой группы следует взять варианту, равную 65, которая будет ближайшей к максимальному значению и без остатка разделится на величину интервала, равного 5. Середины для других групп находят следующим образом: от середины каждой предыдущей группы отнимают величину интервала. Так, если середина первой группы - 65, то середина второй группы равна 60 (65-5), середина третьей группы - 55 (60-5) и т.д. (см. табл.10). После составления ряда из величин, принятых за середину группы - 65, 60, 55, 50 и т. д., нужно определить границы (начало и конец) этих групп. При этом следует иметь в виду, что границы не должны повторяться, иначе трудно будет распределить варианты по группам и построить вариационный ряд.
Таблица 10.
Распределение женщин 30—44 лет по времени задержки дыхания после вдоха (в секундах)
Начало группы |
Середина группы |
Конец группы |
Варианты (v) |
Частоты (р) |
67 |
65 |
63 |
67—63 |
1 |
62 |
60 |
58 |
62—58 |
1 |
57 |
55 |
53 |
57—53 |
3 |
52 |
50 |
48 |
52—48 |
2 |
47 |
45 |
43 |
47—43 |
5 |
42 |
40 |
38 |
42—38 |
13 |
37 |
35 |
33 |
37—33 |
8 |
32 |
30 |
28 |
32—28 |
8 |
27 |
25 |
23 |
27—23 |
5 |
22 |
20 |
18 |
22—18 |
4 |
IV этап: деление наблюдения группам. Для разноски рекомендуется использовать карточки, на каждой из которых записана' величина варианты. Карточки раскладывают по пачкам соответственно размерам показателей в группе. Подсчитывают количество карточек в каждой пачке и результаты записывают по группам, получая таким образом частоты (Р) вариационного ряда.
В табл. представлен вариационный ряд, который включает 50 наблюдений (n = 50) с разнообразными значениям и вариант (v), объединенных в 10 групп.
V этап: графическое изображение вариационного ряда. Для углубленного анализа полученных данных большее значение имеет правильное построение графического изображения вариационных рядов.
Основные правила построения графических изображений вариационных рядов заключаются в следующем:
необходимо построить оси координат: ось абсцисс (х) и ось ординат (у). Ось абсцисс (х) служит для изображения градации (середины групп) изучаемого признака (рост, масса тела, уровень белка в крови и т.д.), ось ординат (у) - для изображения числа случаев с данной величиной признака; при построении осей координат надо соблюдать определенные соотношения между длиной осей абсцисс и ординат (х:у = 4:3). Графическое изображение построенного нами вариационного ряда представлено на рис. 12. Полученный ряд распределения (вариационный ряд) и графическое его изображение делают статистические данные обозримыми, доступными для анализа и дальнейшего изучения.
Рис. 12. Распределение женщин 30-44 лет по времени задержки дыхания после вдоха.
СРЕДНИЕ ВЕЛИЧИНЫ
Построение из индивидуальных данных вариационного ряда (ряда распределения) - это только первый шаг к осмыслению особенностей всей совокупности. Далее необходимо определить средний уровень изучаемого количественного признака (среднее время задержки дыхания, среднее число посещений врача в день, средний рост той или иной возрастной группы, средняя длительность лечения в стационаре больных с определенным заболеванием, средний уровень белка крови, среднее время наступления стадии наркоза и т.д.).
Средний уровень измеряют с помощью критериев, которые носят название средних величин. Под средней величиной понимают число, выражающее общую меру исследуемого признака в совокупности. Средняя величина как бы выражает то общее, что характерно для признака в данной совокупности.
Общеупотребительными являются три вида средних величин:
Мода (М0), Медиана (Ме), Средняя арифметическая (М).
Для определения любой средней величины необходимо использовать результаты индивидуальных измерений, записав их в виде вариационного ряда (табл. 11).
Таблица 11
Результаты измерения массы тела у 25 юношей в возрасте 18 лет (вариационный ряд)
Масса тела, кг (v) Число лиц (Р) |
59 1 |
60 4 |
61 6 |
62 9 |
63 3 |
64 2 |
Всего (п)25 |
Мода (Мо) - соответствует величине признака, которая чаще других встречается в данной совокупности. Иначе говоря, за моду принимают варианту, которой соответствует наибольшее количество частот (Р) вариационного ряда. В нашем примере М0 = = 62 кг, так как эта масса тела наблюдается у 9 из 25 юношей.
Медиана (Mе) — величина признака, занимающая серединное положение в вариационном ряду. Она делит ряд на две равные части по числу наблюдений. Для определения медианы надо найти середину ряда. При четном числе наблюдений за медиану принимают среднюю величину из двух центральных вариант. Например, для ряда 2, 5, 6, 9, 11, 12, 15, 16 центральными вариантами будут 4-я и 5-я. Медиана в этом случае равна (9+11)/2=10
При нечетном числе наблюдений медианой будет серединная (центральная) варианта, которая определяется так: (n+1)/2 или (25+1)/2=13
Это означает, что середина ряда приходится на тринадцатую варианту с начала ряда или тринадцатую варианту с конца ряда. В нашем примере Mе=62кг. В данном случае Мо=Ме. Однако не во всех вариационных рядах числовое значение моды совпадает со значением медианы.
Следует заметить важную особенность моды и медианы: на их величины не оказывают влияние числовые значения крайних вариант. Допустим, в нашем вариационном ряду максимальная масса тела юношей была бы 65 кг, а минимальная — 58 кг. Эти изменения в значениях крайних вариант не отразились бы ни на величине моды, ни на величине медианы.
Средняя арифметическая величина опирается на все наблюдения и рассчитывают ее несколькими способами в зависимости от численности вариант, характера вариационного ряда и наличия вычислительной техники.
Основными способами расчета М являются: среднеарифметический способ и способ моментов (условных отклонений).
Среднеарифметический способ применяется для вычисления средней арифметической и средней арифметической взвешенной.
Средняя арифметическая простая - вычисляется из вариационного ряда, в котором каждая варианта встречается только один раз (для всех вариант р=1); средняя арифметическая взвешенная вычисляется из вариационного ряда, в котором отдельные варианты встречаются различное число раз р>1.
М простая = v/n М взвешенная = vp/n
Способ моментов. Применяя этот способ, среднюю арифметическую рассчитывают по формуле:
М = А + i ap/n где:
А - величина наиболее часто встречаемой варианты
i - величина интервала между группами
a - условное отклонение от условной средней (V-A)
V- величина варианты
p - частота встречаемости для варианты
n - число вариант
Эта формула технически упрощает расчеты, особенно в тех случаях, когда варианты состоят из многозначных чисел, а совокупность - из большого числа наблюдений.
Средняя арифметическая одним числом характеризует совокупность, обобщая то, что свойственно всем ее вариантам, поэтому она имеет ту же размерность, что и каждая из вариант.
Таблица 13