Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
otvety_po_statistike.docx
Скачиваний:
254
Добавлен:
12.04.2015
Размер:
1.55 Mб
Скачать

48. Обусловленность выбора средней характером исходной информации.

Основная функция средней величины заключается в «сжатии» исходной информации. Представим, что нам интересно сравнить уровень зарплат в некоторых странах, в которых проживает по несколько миллионов человек. Зарплаты у всех разные, есть богатые, бедные, середнячки. Как правильно определить, в какой стране люди получают больше? Как получить обобщающую оценку уровня благосостояния? А ведь именно так часто ставится вопрос: где больше получают, у нас или у них? Невозможно ответить на этот вопрос, не прибегая к статистическому анализу данных. Однако, если рассчитать средние зарплаты по странам, то огромное количество исходных данных «сожмется» всего до одного показателя по каждой стране. После этого средние значения можно очень легко и наглядно сопоставить между собой. Нужно понимать, что при переходе от исходных данных к средним значениям все многообразие первоначальных данных исчезает. Мы уже не увидим зарплату каждого работника в отдельности (часть информации теряется), но зато огромный объем исходной информации, который невозможно осмыслить и переварить невооруженным мозгом, превращается в достаточно компактную и информативную характеристику всей совокупности значений. Жонглировать одним мячом легче, чем несколькими. Следить за одной птичкой легче, чем за десятью. Короче, с одним предметом легче управиться, чем со многими.

 Качество такой характеристики (средней) зависит от исходных данных, но суть от этого не меняется – большой объем данных «сжимается» до одного значения. Если исходные данные в статистическом смысле качественные (однородные), то среднее значение, сохранит информативность (то есть корректно отразит закономерность) исходных данных и во много раз уменьшит их объем. Однако в реальности однородная совокупность данных встречается не часто. Дальнейшие действия зависят от целей анализа. Если нам все-таки важно быстро и просто получить обобщенную оценку зарплат по странам, то можно рассчитать средние величины, игнорируя их однородность. Тогда нужно иметь в виду, что рассчитанные средние значения не будут надежно отражать закономерный уровень зарплат, а будут только показывать общий фонд заработной платы на одного работника. Именно этот показатель чаще всего можно встретить в различных публикациях. Но мы теперь, как грамотные аналитики понимаем, что трактовать его следует не как средний (закономерный) уровень з/п, а буквально так, как он рассчитывается: фонд з/п на одного работника. Это, конечно, мелочь для обывателя, но все-таки согласимся, что между рядами чисел {8, 10, 9, 7, 8, 7, 2, 1, 2, 1, 3, 2} и {4, 5, 5, 6, 3, 5, 5, 4, 7, 5, 6, 5} есть некоторая качественная разница, хотя в обоих рядах средняя арифметическая одинаковая – 5. Для наглядности различий изобразим данные на графиках.

 

  

На левом рисунке отчетливо видно, что в первом множестве чисел данные неоднородны – часть значений существенно больше, чем среднее значение (красная линия), часть – значительно меньше; во втором множестве (правый рисунок) все значения гораздо более однородны (незначительно отличаются друг от друга и скученны около среднего значения – красной линии). Этот пример с числами аналогичен примеру в предыдущей статье о бедных и богатых.

Если мы хотим добиться статистически качественных средних, то исходную неоднородную совокупность следует разделить на однородные группы и уже по сгруппированным данным рассчитывать средние значения. Сколько получится групп, столько и средних значений. Это если делать по науке. На практике мало кто знает, что такое однородность и продолжает считать «среднюю температуру по больнице». С другой стороны, зачастую однородность вовсе и не требуется, потому что аналитику обычно интересен анализ ситуации в динамике. А в динамике неоднородность нивелируются примерно так же, как сокращаются дроби (не будем вдаваться в увлекательную алгебру 6-го класса). В общем, однородность данных – это важное требование, но не всегда необходимое. Однако вернемся к правильной и строгой статистике.

Очевидно, чем на большее количество групп разделить исходные данные, тем более однородными они будут внутри каждой группы. Однако при этом возрастает количество самих средних значений, а это в свою очередь затрудняет проведение и осмысление статистическо анализа. По этой причине аналитик должен стараться добиться оптимального соотношения между количеством групп и их качеством (однородностью). Также следует обратить внимание на количество значений внутри групп. Часто бывает, что вся совокупность делится так, что большинство значений попадает только в одну-две группы, а остальные значения настолько отличаются от основной массы, что хоть отдельные группы делай для них. Понятно дело, что анализировать данные из одного или двух наблюдений нет смысла. Такие значения называют аномальными, и во многих случаях их следует вообще исключить из расчетов (но, все-таки не забывая об их существовании).

Таким образом, есть два полярных типа информации: либо максимально точный (если оперировать каждым исходным значением отдельно), либо максимально компактный (когда вся информация заменяется одной характеристикой, например средним значением). Промежуточные варианты определяются группировкой данных. Чем больше групп, тем более однородны в них данные, но тем больше и средних значений. Данное положение вызывает проблему выбора между точностью и компактностью. Если данные анализируется в динамике, то неоднородностью можно пренебречь, так как она мало влияет на динамику показателя. Но если мы сравниваем средние величины с другими средними величинами (с другими объектами в пространстве, а не в динамике), то на качество показателей все же следует обращать внимание. Для неоднородных данных следует провести группировку и/или корректно трактовать результаты расчетов. Самое главное для аналитика не отрываться от земли и за каждым расчетом чувствовать связь с реальностью.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]