Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
мат-лы по статистике1.doc
Скачиваний:
6
Добавлен:
07.09.2019
Размер:
1 Mб
Скачать

Статистическая сводка и группировка

Сводка – комплекс последовательных операций по обобщению конкретных единичных факторов для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

Виды сводки:

  • По глубине обработки данных – простая и сложная

  • По форме обработки данных – централизованная и децентрализованная

  • По технике исполнения – ручная и компьютерная

Группировка – расчленение множества единиц изучаемой совокупности на группы по определенным, существенным для них признакам.

Группировочный признак (основание группировки) – признак, по которому производится разбиение единиц совокупности на отдельные группы.

Оптимальное число групп определяется с помощью формулы Стерджесса:

где - число групп;

- число единиц совокупности

Виды группировок:

  • По целям и задачам – типологическая, структурная, аналитическая

  • По числу группировочных признаков – простая, сложная (комбинационная, многомерная)

  • По упорядоченности исходных данных – первичная, вторичная.

Типологическая группировка – распределение исследуемой качественной разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки.

Структурная группировка – разделение исследуемой качественно однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку.

Аналитическая группировка – группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками.

Ряд распределения – упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.

Виды рядов распределения:

  • Атрибутивные (построенные по качественному признаку)

  • Вариационные (построенные по количественному признаку)

Варианты – отдельные значения признака, которые он принимает в вариационном ряду.

Частоты ( ) – выраженные в долях единицы или в процентах к итогу значения изучаемого признака.

Частости ( ) – частоты, выраженные в виде относительных величин (доли единиц, процентов).

Объем распределения (численность распределения) – сумма всех частот.

Интервал – значения варьирующего признака, лежащие в определенных границах.

Величина интервала – разность между верхней и нижней границами интервала.

Закрытые интервалы – интервалы, у которых обозначены обе границы.

Открытые интервалы – интервалы, у которых указана только одна граница.

Для группировки:

- с равными интервалами величина интервала находится по

формуле: где - размах вариации;

; - максимальное и минимальное значения признака в совокупности;

- число групп;

- с неравными интервалами величина интервала может изменяться в арифметической и геометрической прогрессии по формулам:

Для вариационного ряда с неравными интервалами исчисляют плотность распределения.

Абсолютная плотность распределения – это частота, приходящаяся на единицу длины интервала, т.е. .

Относительная плотность распределения – частость, приходящаяся на единицу длины интервала, т.е. .

Полигон, использующийся при изображении дискретных вариационных рядов, представляет собой замкнутый многоугольник, абсциссами вершин которого являются значения варьирующего признака, а ординатами – соответствующие им частоты или частости.

Гистограмма (разновидность столбиковых диаграмм), применяется для изображения интервального вариационного ряда, и представляет собой совокупность столбиков с основаниями, равными ширите интервалов, и высотой, соответствующей частоте. Гистограмма может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить отрезками.

Кумулятивная кривая (кумулята) используется для изображения ряда накопленных частот.

Вторичная группировка – операция по образованию новых групп

на основе ранее построенной группировки.

Методы построения вторичной группировки:

  • Укрупнение интервалов;

  • Долевая перегруппировка.