Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика Астахов.doc
Скачиваний:
20
Добавлен:
05.02.2016
Размер:
3.44 Mб
Скачать
                1. Тема 12

СТРУКТУРНЫЕ СРЕДНИЕ

После изучения этой Темы Вы сможете:

  1. раскрыть природу и практическое значение структурных средних моды и медианы как особой разновидности средних величин в стати­стике;

  2. проводить различие между степенными средними величинами и структурными средними.

Помимо перечисленных в предыдущем Темах средних величин в ста­тистике находят широкое применение и структурные средние, характери­зующие структуру вариационных рядов. Такие структурные средние называются мода и медиана. Под модой понимается вариант, который чаще всего встречается в вариационном ряду.

В интервальном вариационном ряду мода определяется по формуле:

;

где - нижняя граница модального интервала; i - величина модального интервала; - частота соответственно модального, предмодального и послемодального интервала.

Под медианой - значение ранжированного (упорядоченного) ряда, распо­ложенное в его середине. Это такое значение ряда, которое делит его чис­ленность на две равные части то есть половина вариант имеют значение больше медианы, а половина меньше.

Ме - значение варьирующего признака, которое приходится на середину ранжированного вариационного ряда. Если в вариационном ряду 2m+1 случаев, то значение признака у случая m+1 будет медианным. Если в ряду четное число 2m случаев, медиана равна средней арифметической из двух срединных значений. Медиана в дискретном вариационном ряду равна:

; .

Медиана в интервальном ряду определяется по формуле

,

где - нижняя граница медианного ряда; i - величина медианного интервала; - сумма накопленных частот до медианного интервала; - частота медианного интервала.

Медианный интервал определяется по кумулятивным частотам: где впервые сумма частот превысит , значит, это и есть медианный интервал.

Степенные средние могут дать неправильную характеристику нормальности явления, так как сама вариация может быть очень велика, а значения признака распределены неравномерно по отношению к центру распределения, то мода и ме­диана в значительной степени дополняют информацию о нормальности и центре распределения в совокупности. Более того иногда мода и медиана дают более точную информацию о характере распределения. Например, Вас приглашают работать на предприятие где средняя заработная плата составляет 40 тысяч рублей. Вы с радостью соглашаетесь, а в результате оказывается, что начальники получают от 400 до 200 тысяч рублей, а большинство работников от 1,5 до 3 тысяч рублей. А вот если бы вы знали самую распространенную в организации заработную плату (мода), или ту заработную плату которая делит работников ровно на две части по численности (мода = 2 т. р., медиана = 2,2 т.р.), то ваши действия были бы другими. Этим и объясня­ется их значение в статистике и практическая незаменимость в решении ряда задач. Любопытно, но ведь то, что называется модой в статистике, имеет некоторое сходство с обычным, бытовым пониманием этого слова. Например, показ мод будущего сезона означает, что большинство будет носить в будущем сезоне и это правильно, а вот когда говорят, что девушка одета модно это должно означать, что она одета как большинство и это противоречит бытовому пониманию.

Знать моду и медиану и адекватно на нее реагировать актуально не только для жизни и бизнеса, но и для статистики, обслуживающей бизнес. В частности в маркетинге принято ориентироваться не на средние доходы населения, а на медиану и моду.

Медиана обладает важными свойствами. В частности, сумма модулей отклонений вариантов от медианы всегда меньше, чем сумма отклонений вариантов от любой другой величины, т.е.. Это свойство медианы широко используется при проектировании расположения цен­тров массового обслуживания населения, что продиктовано экономиче­ской целесообразностью. Показателями типа медианы, характеризующи­ми структуру вариационных рядов, выступают квартили (делят ряд на 4 равные части), квинтили (на 5), децили (на 10), перцентили (на 100 час­тей).

Отыскание моды производится по-разному, в зависимости от того, представлен ли варьирующий признак в виде дискретного ряда или ин­тервального. Поиск моды в дискретном ряду происходит путем простого просматривания столбца частот. В этом столбце находится наибольшее число, что будет говорить о наибольшей частоте по сравнению с другими частотами. Ей соответствует определенное значение признака, которое и является модой. В интервальном вариационном ряду модой приближенно можно считать центральный вариант так называемого модального интер­вала, т.е. интервала с наибольшей частотой. Более точный расчет моды для такого ряда производится по следующей формуле:

где х0 - нижняя граница модального интервала;

- величина модального интервала;

- частота домодального интервала;

- частота модального интервала;

- частота послемодального интервала.

При наличии в ряду неравных интервалов рекомендуется предвари­тельно преобразовать такой ряд. Приближенное значение моды можно легко определить графическим способом. Для этого вычерчиваем три центральных столбика гистограммы. Далее проводим две линии, соеди­няющие верхние крайние точки центрального столбика с верхними точ­ками примыкающих к нему столбиков. Из точки пересечения этих линий проводим перпендикуляр на основание, и на оси абсцисс получим вели­чину, близкую к моде. Понятно, что вычисление моды возможно лишь в том случае, когда за гистограммой скрывается кривая распределения с явно выраженной вершиной. Если такой вершины нет, то и вычисление моды невозможно.

Медианой в интервальном вариационном ряду приближенно считает­ся центральный вариант медианного интервала, т.е. того интервалам котором находится срединная (медианная) единица. Для более точного определения медианы используется известное из математической стати­стики понятие накопленных частот (частостей), под которым понимается нарастаю­щий итог частот (частостей), начиная с первого интервала. Формула расчета медианы следующая:

где - нижняя граница медианного интервала;

i - величина медианного интервала;

- сумма частот ряда;

- сумма накопленных частот предмедианного интервала;

- частота медианного интервала.

Заметим, что в ранжированных и дискретных вариационных рядах медиана, как и мода, всегда дана конкретно. В первичных рядах нахожде­ние медианы также не требует никаких расчетов. Если значение моды, медианы и среднего значения равны, то распределение в ряду симметрично и явление носит нормальный характер, если значения сильно отличаются друг от друга, явление не стабильно, не нормально, а возможно ряд показывает несколько разных по своей сути явлений. При использовании компьютера клона IBM – PC в среде MS OFFICE применяя табличные процессор Excel, моду, медиану, квартили, квинтили, перцентили (персентили), можно вычислить при помощи мастера функций, кроме того для работы со структурными массивами существует функция УРЕЗСРЕД для расчета средних в квартили или квинтили. Очень часто на практике приходиться анализировать, например, 20% самых бедных жителей (нижний квинтиль) или четвертую часть самых дорогих товаров (верхний квартиль).

Контрольное задание:

Вам предлагается найти среднее значение моду и медиану в одном из построенных Ва­ми рядов распределения при решении Контрольного задания из Темаа 5, применяя разные способы, в том числе и графический и провести анализ распределения. Если у Вас есть возможность работать с компьютером не тратьте время и усилия рассчитайте все виды средних моду и медиану при помощи мастера функций, а также проведите анализ при помощи функции «если»того же мастера функций.