Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СРЕДНИЕ ВЕЛИЧИНЫ. ОЦЕНКА ДОСТОВЕРНОСТИ. КОРРЕЛЯ....doc
Скачиваний:
20
Добавлен:
02.08.2019
Размер:
161.79 Кб
Скачать

1.3. Характеристика разнообразия признака

в статистической совокупности.

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на её относительную однородность. Например, в группе детей, однородной по возрасту, полу и места жительства, рост каждого ребёнка отличается от роста сверстников. То же можно сказать о числе посещений, сделанных отдельными лицами в поликлинику.

В этом проявляется разнообразие, колеблемость признака в изучаемой совокупности.

Статистика позволяет охарактеризовать это специальными критериями, определяющими уровень разнообразия каждого признака в той или иной группе. К таким критериям относятся лимит /lim/, амплитуда ряда /A /, среднее квадратическое отклонение / / и коэффициент вариации /С /. Так как каждый из этих критериев имеет своё самостоятельное значение, то следует остановиться на них отдельно.

Лимит /lim/ определяется крайними значениями вариант в вариационном ряду

lim = V min + V max.

Амплитуда /Am/ - разность крайних вариант.

Лимит и амплитуда дают определённую информацию о степени разнообразия признака в каждой группе. Однако как лимит, так и амплитуда ряда обладает одним существенным недостатком. Они учитывают только разнообразие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учётом её внутренней структуры. Дело в том, что разнообразие проявляется не столько в крайних вариантах, сколько при анализе всей внутренней структуры групп. Поэтому этими критериями можно пользоваться для приближенной характеристики разнообразия, особенно при малом числе наблюдений, /n < 30/.

Наиболее полную характеристику разнообразию признака в совокупности даёт так называемое среднее квадратическое отклонение, обозначаемое греческой буквой «сигма» - σ.

Существует два способа расчёта среднего квадратического отклонения: среднеарифметический и способ моментов. При среднеарифметическом способе расчёта применяют формулу:

G простая = +E d² p , (n < 30; P=1; d=V-M)

n-1

где d – истинное отклонение вариант от истинной средней (V-M). Эта формула используется при небольшом числе наблюдений (n < 30), когда в вариационном ряду все частоты р=1. При р > 1 используют формулу такого вида:

G средневзвешенная = +E d² p , (n > 1; р > 1)

n

При наличии же вычислительной техники эта формула применяется и при большом количестве наблюдений.

Для определения по способу моментов предназначена формула:

G по способу моментов = +i² E d² p _ i E d p ² ,

n n

где d – условной отклонение вариант от условной средней: d = V-A; i² E d² p - момент второй степени, i E d p ² - момент первой сте-

n n

пени, возведённый в квадрат.

Этот способ применяется в тех случаях, когда нет вычислительной техники, а вариационный ряд громоздкий как за счёт большого числа наблюдений, так и за счёт вариант, выраженных многозначными числами. При числе наблюдений, равном 30 и менее, в момент второй степени n заменяют на (n – 1).

Как видно из формулы среднего квадратичного отклонения в знаменателе стоит (n – 1), т.е. при числе наблюдений, равном или меньшем 30 (n < 30), необходимо знаменатель формулы брать n – 1. если при определении простой средней арифметической М или взвешенной учитывают все элементы ряда, то, рассчитывая надо брать не все случаи, а на единицу меньше (n – 1).

При большом числе наблюдений (n > 30) в знаменатель всех формул берут n, так как единица не изменяет результаты расчёта и поэтому автоматически опускается.

I. Последовательность расчёта по формуле σ = +E d² p

n-1

1. Определить М (по среднеарифметическому способу)

М = Σ a · p

N

2. Найти истинное отклонение (d = V – M).

  1. Возвести каждое отклонение в квадрат (d²).

  2. найти произведение (d²· р) по всем строкам ряда.

  3. Определить сумму (Σ d²· р).

  4. Рассчитать σ по формуле.

Следует обратить внимание на то, что среднее квадратическое отклонение – именованное величина, поэтому оно должно иметь обозначение, общее для вариант и средней арифметической величины.

Рассчёт среднего квадратического отклонения по способу моментов производится после рассчёта средней величины;

II. Последовательность рассчёта по способу моментов.

  1. Найти условную среднюю А.

  2. Определить условное отклонение (а) каждой варианты: от условной средней: а = V – A.

  3. Получить произведение а · р, а затем их просуммировать.

  4. Рассчитать истинную среднюю арифметическую по формуле М = А + i Σ a · p

N

  1. Получить произведение d²· р по всем строкам вариационного ряда и просуммировать их: (Σ d²· р).

  2. Рассчитать σ по способу моментов по формуле:

σ = +i² E d² p _ i E d p ²

n n

Существует ещё один критерий, характеризующий уровень разнообразия величин признака в совокупности, - коэффициент вариации.

Коэффициент вариации (С) является относительной мерой разнообразия, так как исчисляется как процентное отношение среднего квадратического отклонения (σ) к средней арифметической величине (М). Формула коэффициента вариации такова:

Сv = σ

М * 100%

Для ориентировочной оценки степени разнообразия признака пользуются следующими градациями коэффициента вариации. Если коэффициент составляет более 20%, то отмечают сильное разнообразие; при 20-10% - среднее, и если коэффициент менее 10%, то считают, что разнообразие слабое.

Коэффициент вариации применяют при сравнении степени разнообразия признаков, имеющих различия в величине признаков или неодинаковую их размерность. Допустим, необходимо сравнить степень разнообразия массы тела у новорожденных и 7-летних детей. Понятно, что у новорожденных всегда будет меньше, чем у 7-летних детей, так как меньше их индивидуальная масса. Среднее квадратическое отклонение будет меньше там, где меньше величина самого признака. В этом случае для определения различия в степени разнообразия необходимо ориентироваться не на среднее квадратическое отклонение (σ), а на относительную меру разнообразия - коэффициент вариации С..

Среднее квадратическое отклонение связано со структурой ряда распределения признака.

Теорией статистики доказано, что при нормальном распределении в пределах М + σ находится 68% всех случаев, в пределах М + 2σ – 95,5% всех случаев, а в пределах М + 3σ – 99,7% всех случаев, составляющих совокупность. Таким образом, М + 3σ охватывает почти весь вариационный ряд.

Это теоретическое положение статистики о закономерностях структуры ряда имеет огромное значение для практического применения среднего квадратического отклонения. Можно воспользоваться этим правилом для выяснения вопроса о типичности средней величины. Если 95% всех вариант находятся в пределах М + 2σ, то средняя является характерной для данного ряда и не требуется увеличивать число наблюдений в совокупности. Для определения типичности средней сравнивается фактическое распределение с теоретическим путём расчёта сигмальных отклонений.

Значение среднего квадратического отклонения. Средняя арифметическая характеризует одной величиной весь вариационный ряд. Однако чем больше варьируют индивидуальные значения вариант, тем, очевидно, менее точно характеризуется вариационный ряд средней арифметической.

Ряд с большей амплитудой имеет большее среднее квадратическое отклонение (Амплитуда приближённо равна 6 σ).

Следовательно, две одинаковые средние, полученные из вариационных рядов с различной амплитудой, не в одинаковой степени характеризуют свои ряды. Та из них, которая имеет меньшее среднее квадратическое отклонение и. следовательно, получена из вариационного ряда с меньшей вариабельностью, своим размером будет больше приближаться к действительной величине значительного большинства единиц ряда.

Предположим, что имеются два ряда чисел – первый ряд – 6,7,7,9,7,6, средняя арифметическая этого ряда М равно 7,6 = 0,8; второй ряд: 2,2,4,3,2,29 – также имеет среднюю арифметическую М2 = 7, но 6 = 9,9.

Первая средняя чрезвычайно близка по размерам ко всем величинам первого ряда чисел и хорошо представляет собой этот ряд; вторая же средняя значительно отличается по величине от чисел своего ряда и не может считаться хорошо характеризующей его. Если бы не были известны ряды, из которых выведены средние. Такое же точно заключение можно было бы сделать, сравнивая размеры средних квадратических отклонений.

Теоретическое распределение частот может быть применено врачом для ряда практических целей. Так, например, при определении потребности в тех или иных размерах школьной мебели и т.п., зная величины и численность школьников, можно установить примерное число необходимых размеров парт.

Таким образом, среднее квадратическое отклонение служит для:

  1. измерения изменчивости (вариабельности) вариационного ряда;

  2. сравнительной оценки степени соответствия средних арифметических величин тем вариационным рядам, для которых они вычислены;

  3. оценки степени точности случайной выборки;

  4. оценки достоверности различий двух средних величин;

  5. расчётов распределения вариант вокруг средней арифметической.