Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по теории статистики - темы 5, 6.doc
Скачиваний:
6
Добавлен:
22.08.2019
Размер:
278.02 Кб
Скачать

6.2 Сущность группировки и её задачи. Виды группировок и их назначение

Статистическая группировка – расчленение изучаемой совокупности на группы и подгруппы по определённым существенным признакам для глубокого и всестороннего изучения общественных явлений.

При проведении группировки решается ряд задач:

1) выделение группировочного признака;

2) определение числа групп и величины интервалов;

3) определение того, как группировочные признаки комбинируются между собой;

4) установление показателей, которыми должны характеризоваться группы.

Виды группировок и их назначение представлены в таблице 6.2.

Таблица 6.2 – Виды группировок и их назначение

Критерии классификации

Виды группировок

1. Решаемые с помощью группировок задачи

1) типологические - обеспечивают разграничение массовых явлений на качественно однородные совокупности; при этом качественно однородными совокупностями считаются такие, все единицы которых подчинены определенному закону развития (качеству объекта); пример типологической группировки - расчленение народного хозяйства на отрасли и подотрасли;

2) структурные (вариационные) - группировки, применяемые для изучения структуры массовых явлений: определяется структура или структурные сдвиги в совокупности однородных единиц или/и осуществляется расчленение совокупности по величине варьирующего признака; с помощью таких группировок можно изучить состав (структуру) качественно однородной совокупности;

3) аналитические - группировки, предназначенные для изучения взаимосвязей и зависимостей между явлениями и процессами на основании факторных признаков, обуславливающих изменение явлений, и результативных признаков, которые изменяются под влиянием факторных; например, изучая взаимосвязь между производительностью труда и себестоимостью продукции предприятия, следует формировать группировки по уровню производительности труда

2. Число положенных в основание группировки признаков

1) простые – группировки, выполненные по одному признаку;

2) многомерные – производятся по двум и более признакам

3. Временной критерий

1) статические – дают характеристику совокупности на определённый момент времени или за определённый период;

2) динамические – показывают переходы единиц из одних групп в другие (составляется матрица перехода или миграционная, матрица мобильности)

4. По видам признаков

1) атрибутивные (качественные); 2) количественные;

3) признаки пространства; 4) признаки времени

5. По комбинации признаков

1) простые – осуществляются по одному признаку;

2) комбинационные (сложные) – для выделения групп берут два или более признаков, т. е. группы, образованные по одному признаку, подразделяются на подгруппы по другому (группы рекомендуется образовывать не более чем по трём признакам)

6. Требования анализа

1) первичные группировки;

2) вторичные группировки, осуществляемые с помощью перегруппировки первичных группировок (в современной математической статистике этот прием известен под названием многомерного кластерного анализа)*.

* Исходные данные для задач многомерной классификации обычно представляют в виде матрицы «объект-признак»; в её строках содержатся значения признаков, характеризующих соответствующий объект, а в столбцах – значения каждого признака для рассматриваемой совокупности объектов.

Выделяют следующие типы мер сходства: коэффициенты подобия, коэффициенты связи, коэффициенты расстояния. Меры первых двух типов называются мерами близости (сходства, подобия), которые могут определяться не только между объектами, но и между признаками.

Для измерения степени близости между двумя объектами i и j, каждый из которых принимает значения 0 и 1, используется коэффициент подобия S (0 <= Sij <= 1). Наиболее простой коэффициент подобия рассчитывается по формуле двух сравниваемых объектов (6.1):

Sij = Pij / m, (6.1)

где Pij – число совпадающих признаков у объектов i и j;

m – общее число признаков, по которым осуществляется сравнение.

Способы, используемые в качестве мер сходства:

1) использование коэффициентов корреляции – измеряют либо силу связи между объектами (между строками матрицы «объект-признак»), либо силу связи между признаками (между столбцами матрицы «объект-признак»); для измерения связи количественных признаков используют коэффициенты линейной корреляции; если признаки не поддаются точной количественной оценке, то мерами их сходства служат коэффициенты ранговой корреляции;

2) использование функции расстояния – для сопоставимости показатели расстояния определяются по статистически стандартизированным данным; распространённый способ стандартизации – замена первичных значений признаков их отклонениями от среднего уровня; наиболее известными мерами расстояния между объектами являются:

а) хеммингово расстояние (между признаками, обладающими значениями 0 и 1);

б) евклидово расстояние (между количественными признаками);

в) взвешенное евклидово расстояние (при ненормированных осях, для двух объектов, сильно различающихся только по одному признаку);

г) расстояние Махаланобиса (через ковариационную матрицу связи признаков).

Для выполнения многомерных классификаций чаще всего применяют:

1) метод дендритов:

- дендрит – ломаная, которая может разветвляться, но не может содержать замкнутых ломаных и такова, что ею соединены любые две точки множества; метод дендритов позволяет получать нелинейное упорядочивание изучаемых единиц;

- графически рассматриваемые случаи упорядочивания можно представить в виде точек либо кругов (вершин) с вписанными в них обозначениями или номерами, связанных отрезками (связями, дугами);

- наилучшее упорядочивание заключается в нахождении такого дендрита, в котором смежные единицы будут иметь наименее различающиеся значения признаков; выполнение этой задачи приведёт к упорядочиванию с наименьшим расстоянием или с наибольшими связями;

- в оптимальном дендрите смежные объекты в наименьшей степени отличаются друг от друга;

2) метод шаров:

– используется матрица расстояний между точками;

- для каждой точки строится шар заданного радиуса, затем для каждого элемента подсчитывается число точек, находящихся внутри данного шара;

- после этого вычисляют объём подмножества – величину, определяющую первое выделяемое подмножество; это подмножество образуют единицы, которые содержатся в шаре, ближе всего находящемся от начала системы координат;

- дальнейшие действия производятся аналогично (исключая первое подмножество) до полного исчерпания множества;

3) многомерная средняя:

– первичные данные нормируются либо по среднему значению, либо по максимальному уровню;

- по нормативным значениям для каждого объекта или наблюдения рассчитывается средняя арифметическая величина;

- совокупность этих величин представляет некоторый обобщённый признак, в соответствии со значениями которого и происходит распределение объектов по группам;

4) метод корреляционных плеяд.