Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Stat_metod.doc
Скачиваний:
7
Добавлен:
10.09.2019
Размер:
4.6 Mб
Скачать

7. Инструменты обработки данных

Содержание темы

Применение таблицы EXCEL для сводки, группировки и анализа статистических данных. Назначение. Основной алгоритм обработки. Построение итоговых таблиц. Построение сводных таблиц. Сводная таблица - как форма динамической обработки статистических данных.

Понятия, определения, теоретические вопросы

Электронная таблица EXCEL позволяет формировать книгу, которая представляет собой файл, используемый для обработки и хранения данных. Каждая книга может состоять из нескольких листов. Листы служат для организации и анализа данных. Возможность сводки и группировки данных в рамках таблицы может быть реализована различными способами: путем расчета итогов (пункт меню «Данные», «Итоги») или путем динамической обработки данных (пункт меню «Данные» «Сводная таблица»). Динамическая обработка данных осуществляется посредством построения сводной таблицы, что существенно расширяет аналитические возможности и не требует применения специфических знаний в вопросах программирования. Применение таблицы EXCEL для решения различных статистических задач будет осуществляться по мере изучения курса.

8. Ряды распределения

Содержание темы Приемы изучения изменчивости статистической совокупности. Основные понятия и определения. Виды рядов распределения (атрибутивные и вариационные). Виды вариационных рядов (интервальные и дискретные). Определение варианты, частоты, частости. Графическое представление рядов распределения. Полигон частот. Гистограмма - графический смысл. Полигон частот.

Понятия, определения, теоретические вопросы

Результаты сводки или группировки статистического наблюдения представляют собой статистические ряды распределения. При этом ряды распределения образованные по качественному признаку называют атрибутивными (например, распределение экспорта или импорта по товарным группам, по таможням, характеру сделки, категориям участников ВЭД). Если в качестве группировки выступает количественный признак, то получается вариационный ряд распределения. На практике в статистике внешней торговли, в основном, формируются атрибутивные ряды распределения.

Атрибутивные ряды распределения.

Изучение структуры в разрезе атрибутивных признаков целесообразно проводить по объемным показателям, таким как экспорт, импорт. Так экспорт (импорт) можно подразделять по всем тем признакам, которые отражены в ГТД (товарным группам, странам, отраслям промышленности, таможенным режимам и т.д.). Принципы построения атрибутивных рядов распределения:

  • число групп не должно быть слишком большим, иначе теряется наглядность (но и не слишком маленьким) ;

  • элементы структуры не должны пересекаться между собой;

Таблица 8.1.

Объемы внешней торговли

Наименование

Вес (т)

Стоимость (тыс.долл.)

Доля %

 

 

стоим.

Веса

Экспорт

1000

2000

56%

57%

Импорт

800

1500

44%

43%

Итого

1800

3500

 

 

Элементом структуры атрибутивного ряда являются группы значений, объединенных по качественному признаку (структура отраслей промышленности, страна, товарная позиция). Для более наглядного описания структуры ряда распределения используют относительные величины ( доли, %). Еще более наглядным является графическое изображение.

Основная цель статистического анализа - отделение закономерности от случайности с учетом предположения, что закономерное случается часто, а случайное - редко. Подсчет частоты встречаемости значений исследуемого показателя и анализ частоты характеристик является предметом изучения вариационных рядов. При решении этой задачи исходной информацией служат одномерные пространственные ряды наблюдений, т.е. совокупность наблюдений за значениями одного и того же показателя в один и тот же момент времени по различным объектам.

Любой вариационный ряд состоит из элементов: вариантов и частот.

Вариантами (х) называются отдельные значения признака, которые он принимает в вариационном ряду, т.е. значения варьирующего признака.

Частоты (f) - это численность отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность совокупности, ее объем. Например, при исследовании средней цены товара, частотой будет количество килограммов товара, цена которого попадает в определенный интервал.

Таблица 8.2

Интервал цен (ц/кг)

Частота (кг)

Частость (%)

18 – 19

50

12

19 – 20

100

23

20 – 21

200

46,5

21 – 22

80

18,5

Объем совокупности

430

100

Частость, или относительная частота ( w)- это отношение частоты к объему всей совокупности, т.е. частота, выраженная в процентах к итогу.

При проведении вариационного анализа исходные данные группируются в виде ряда распределения, рассчитываются статистические характеристики, описывающие форму распределения, строится его график. Затем делается вывод о соотношении закономерности и случайности.

В статистике вариационные ряды делятся на дискретные, в которых значения признака выражены в виде изолированных величин (чаще всего целых), и интервальные (непрерывные) - в которых значения признака заданы определенным интервалом. Например, участники ВЭД по товарообороту разделены на группы: от 1000 до 10000 долл., от 10000 до 20000 долл..

Статистическое распределение дискретного вариационного ряда - это перечень вариант в возрастающем порядке и соответствующих им частот (относительных частот).

Статистическое распределение непрерывного вариационного ряда - это последовательность интервалов в возрастающем порядке и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал).

Способы построения и представления вариационных интервальных рядов. Интервалы подбираются так, чтобы ряд распределения дал более подробную, но обозримую структуру статистической совокупности.

Интервалы бывают равные и неравные:

  • Равные применяют в случаях, когда показатель изменяется в незначительных пределах.

  • Неравные - в остальных случаях.

Величина равных интервалов вычисляется по формуле:

, (5.1)

где xmax, xmin - максимальное и минимальное значения показателя, соответственно;

k - число интервалов.

Если не решен вопрос о количестве интервалов, то его рассчитывают по формуле, предложенной американским ученым Стеджерссом:

k= [1 + 3,222 lg (N)], (5.2)

где N - кол-во рассматриваемых показателей (объем совокупности),

[ ] – означает целую часть числа,

k – количество интервалов

Например, при объеме совокупности в 100 единиц с минимальной ценой условного товара 6 долл./кг, а максимальной - 20 долл./кг, оптимальное количество интервалов - [1+3,222*lg(100)]]=7.

При этом величина интервала, рассчитанная по формуле (), составит (20-6)/7=2 долл. Таким образом, 1-й интервал – от 6 до 8 долл./кг, 2-й – 8-10 долл./кг, …7-й – 18-20 долл./кг.

Часто для расчета статистических показателей от непрерывного (интервального) ряда удобно перейти к дискретному. Для этого в качестве дискретных значений ряда берут середины частичных интервалов, а в качестве частот принимают сумму частот вариант, попавших в соответствующий интервал. Проделав эту операцию в приведенном ниже примере, получим статистическое распределение дискретного вариационного ряда.

Пример статистического распределения интервального вариационного ряда рассмотрим по ценам условного товара, импортируемого различными участниками ВЭД.

Таблица 8.3.

Интервальный вариационный ряд распределения цен на условный товар

Цена (долл/кг)

Участники ВЭД (шт)

В % к итогу

19,1-19,3

2

9

19,3-19,5

4

17

19,5-19,7

10

43

19,7-19,9

6

26

19,9-20,1

1

5

Итого

23

100

Таблица 8.4

Дискретный вариационный ряд, полученный из интервального

Цена, долл/кг.

19,2

19,4

19,6

19,8

20

Количество участ. ВЭД

2

4

10

6

1

Для наглядности строят различные графические изображения статистического распределения.

Рис. 8.1. Полигон распределения участников ВЭД по цене условного товара

Полигон частот (относительных частот)это ломаная, вершинами которой являются точки (x1,f1),…, (xk ,fk) ((x1,fw1),…, (xk ,wk)), где x1,…, xk – варианты дискретного вариационного ряда, а f1,…,fk (w1,…,wk) – соответствующие частоты, выраженные в абсолютных единицах (относительные частоты, т.е. выраженные в %).

Для графического изображения интервального вариационного ряда используют гистограмму. При ее построении на оси абсцисс откладывают интервалы ряда, высота которых равна частотам (частостям), отложенным по оси ординат.

Рис. 8.2 Гистограмма распределения участников ВЭД по цене на условный товар

Гистограмма частот (относительных частот)это ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длины h, а высотами – плотности частот (плотности относительных частот). Плотность частоты (относительной частоты) определяется формулой ( ). Площадь частичного прямоугольника гистограммы частот равна fi, а площадь всей гистограммы равна объему выборки.

На практике гистограмму частот (относительных частот) часто строят, выбирая в качестве высот прямоугольников соответствующие частоты (относительные частоты).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]