- •Тема 1. Предмет и задачи статистики
- •Контрольные вопросы по теме 1.
- •Тема 2. Статистические наблюдения
- •Контрольные вопросы по теме 2.
- •Тема 3. Группировка и сводка данных наблюдения
- •Контрольные вопросы по теме 6.
- •Контрольные вопросы по теме 11.
- •Контрольные вопросы по теме 13.
- •Тема 14. Статистическая проверка гипотез
- •Контрольные вопросы по теме 14. Введение
- •Контрольные вопросы по теме 1.
- •1.1. Роль и значение статистики в обществе. Основные этапы развития статистической науки. Связь дисциплины «Статистика" с другими дисциплинами
- •1.2. Предмет статистики
- •1.3. Общие понятия о статистической методологии (о методе статистики)
- •1.4. Система учёта и статистики, задачи статистики
- •1.5. Организация статистики в Республике Беларусь
- •1.6. Отчетность предприятий и ее виды
- •1.7. Специальные статистические наблюдения и их виды
- •Контрольные вопросы по теме 1
- •Тема 2. Статистические наблюдения
- •Контрольные вопросы по теме 2.
- •2.1. Сущность статистического наблюдения и его задачи
- •2.2. Формы организации статистического наблюдения
- •2.3. Виды статистического наблюдения
- •2.4. Программа статического наблюдения
- •2.5. Способы учета фактов в статистических наблюдениях
- •2.6. Ошибки статистического наблюдения. Меры по обеспечению надежности статистической информации
- •2.7. Пути совершенствования статистического наблюдения
- •Контрольные вопросы по теме 2
- •Тема 3. Группировка и сводка данных наблюдения
- •3.1. Сущность классификации и группировки, их задачи
- •3.2. Виды группировок и их назначение
- •3.3. Понятие, виды и принципы выбора группировочных признаков
- •3.4. Образование групп и определение интервалов группировок. Система статистических показателей
- •3.5. Содержание и значение сводки
- •3.6. Программа статистической сводки и ее основных элементов
- •3.7. Организация и техника сводки. Территориальный и отраслевой разряды сводки статистических материалов
- •3.8. Принципы современной организации обработки статистических данных
- •Контрольные вопросы по теме 3
- •Тема 4. Анализ статических данных и проблема измерения связи
- •4.1. Сущность и основные принципы анализа статической информации
- •4.2. Содержание основных этапов анализа статических данных
- •4.3. Содержание и виды статических расчётов
- •4.4 Основные приёмы (методы) анализа статических данных
- •4.5. Задачи измерения связи в статистике. Основные виды связей между явлениями (признаками)
- •Контрольные вопросы по теме 4
- •Тема 5. Статистические таблицы
- •5.1. Общие понятия о статистических таблицах
- •5.2. Виды статистических таблиц
- •5.3. Основные правила составления и анализа статистических таблиц
- •Контрольные вопросы по теме 5
- •Тема 6. Ряды распределения
- •Контрольные вопросы по теме 6.
- •6.1. Понятие и виды статистических рядов
- •6.2. Графический метод изучения рядов распределения
- •6.3. Понятие о закономерностях статического распределения. Теоретические кривые распределения
- •6.4. Свойства основных кривых распределения
- •Контрольные вопросы по теме 6
- •Тема 7. Абсолютные и относительные величины
- •7.1. Значение и виды статистических показателей. Проблема совершенствования системы статистических показателей
- •7.2. Абсолютные статистические величины
- •7.3. Относительные величины
- •7.4. Отношения между разноимёнными показателями
- •Контрольные вопросы по теме 7
- •Тема 8. Средние величины и показатели вариации
- •8.1. Сущность и значение средних величин в статистике
- •8.2. Виды средних
- •8.3. Средняя арифметическая, ее свойства и техника исчисления
- •8.4. Средняя гармоническая
- •8.5. Структурные средние величины (мода и медиана)
- •8.6. Показатели вариации
- •8.7. Техника исчисления простых показателей вариации
- •8.8. Основные показатели вариации. Свойства дисперсии, методы ее расчета
- •8.9. Сложение дисперсий изучаемого признака
- •8.10. Упрощенные способы вычисления средней арифметической и среднего квадратического отклонения
- •8.11. Основные правила применения средних в статистике
- •Контрольные вопросы по теме 8
- •Тема 9. Ряды динамики
- •9.1. Понятия рядов динамики и их виды
- •9.2. Обеспечение сопоставимости в рядах динамики
- •9.3. Основные характеристики рядов динамики
- •9.4. Средние показатели в рядах динамики
- •9.5. Изучение основной тенденции развития (тренда)
- •9.6. Выявление и изучение сезонных колебаний
- •9.7. Совместный анализ нескольких рядов динамики
- •Контрольные вопросы по теме 9
- •Тема 10. Индексы
- •10.1 Общее понятие об индексах. Классификация индексов
- •Индексы классифицируются по ряду признаков:
- •10.2. Индивидуальные индексы
- •10.3. Агрегатная форма общего индекса
- •Агрегатный индекс физического объема (реализации) товарооборота.
- •10.4. Преобразование агрегатного индекса в индексы средних
- •10.5. Индексы переменного и фиксированного состава
- •10.6. Другие виды индексов
- •10.7. Система взаимосвязанных индексов
- •Контрольные вопросы по теме 10
- •Тема 11. Графические изображения в статистике
- •Контрольные вопросы по теме 11.
- •11.1. Понятие о статических графиках. Основные элементы графика
- •11.2. Виды статистических графиков. Графики сравнения
- •11.3. Наглядное изображение структуры и структурных сдвигов
- •11.4. Контроль выполнения плана с помощью графиков
- •Контрольные вопросы по теме 11
- •Тема 12. Выборочный метод в статистических исследованиях
- •12.1. Выборочное статистическое наблюдение и его виды
- •12.2. Ошибка выборки
- •12.3. Обоснование численности выборки
- •А) для доли альтернативного признака
- •12.4. Способы распространения характеристик выборки на генеральную совокупность
- •12.5.Способы отбора единиц из генеральной совокупности
- •12.6. Малая выборка
- •Контрольные вопросы по теме 12
- •Тема 13. Корреляционная связь и ее статистическое изучение
- •13.1. Предпосылки изучения корреляционной связи
- •13.2. Статистические методы выявления корреляционной связи
- •13.3. Статистическое измерение тесноты корреляционной связи. Показатели меры тесноты корреляционной связи
- •13.4. Корреляция рангов
- •Примеры на ранговые корреляции
- •13.5 Множественная и частная корреляция
- •13.6. Статистические исследования формы корреляционной связи. Линия регрессии и уравнение регрессии
- •13.7. Статистическое исследование зависимости между качественными признаками
- •13.8. Изучение корреляционной зависимости между рядами динамики
- •Контрольные вопросы по теме 13
- •Тема 14. Статистическая проверка гипотез
- •Контрольные вопросы по теме 14.
- •14.1. Сущность и задачи статистической проверки гипотез
- •14.2. Критерий как инструмент проверки статистической гипотезы. Выбор типа критической области
- •14.3. Проверка гипотезы о принадлежности выделяющих единиц исследуемой генеральной совокупности
- •14.4. Понятие о критерии согласия (проверка гипотезы о соответствии эмпирического распределения нормальному)
- •14.5. Проверка гипотезы о величине средней арифметической и доли
- •14.6. Понятие о критерии для измерения связи
- •Контрольные вопросы по теме 14
- •Литература
- •220013, Минск, п. Бровки, 6
13.2. Статистические методы выявления корреляционной связи
Корреляционная связь, как видели из материала п.1 данной темы, характеризуется согласованностью в вариации значений признаков. Однако согласованность эта не всегда свидетельствует о наличии причинно-следственной связи между рассматриваемыми признаками. Так например, согласованность в вариации значений признаков может быть следствием какой-либо одной, общей для них причины, или отражать случайное совпадение в изменениях признаков, не находящихся между собой в какой-либо связи. Неправильно возлагать полностью на статистику задачу установления наличия связи. Статистика только обнаруживает и характеризует фактическое проявление связи, указания на возможность которой дает теория изучаемого явления.
Именно теоретический анализ указывает на вытекающую из существа изучаемого явления возможность связи между признаками, процессами, сопровождающими это явление. Однако теория не может дать ответ на вопрос, проявляется ли в действительности и как проявляется теоретически возможная связь в данных конкретных условиях.
При статистическом изучении корреляционной связи между признаками исходным материалом являются данные об индивидуальных значениях этих признаков в изучаемой статистической совокупности.
Статистическая наука в настоящее время располагает большим набором приемов (методов) выявления корреляционной связи. Одни приемы можно отнести к элементарным (простейшим), другие предусматривают использование специального сложного математического аппарата.
К так называемым элементарным приемам (методам) выявления наличия корреляционной связи относятся: параллельное сопоставление рядов значений факторного и результативного признаков, графическое изображение фактических данных с помощью поля корреляции, построение групповой и корреляционной таблиц, факторные (аналитические) группировки и исчисление групповых средних.
К сложным методам изучения взаимосвязей относятся балансовые таблицы, дисперсионный анализ, методы теории корреляции и регрессии, методы многомерного анализа, методы распознавания образов, метод главных компонентов и др.
В данном параграфе рассмотрим сущность методов первой группы.
При отсутствии ярко выраженной причинной связи между факторным и результативным признаками наличие и характер связи можно установить при помощи метода параллельных рядов: в одной таблице приводятся упорядоченные значения факторного признака, который обычно обозначается символом х, и соответствующие им значения результативного признака, который обычно обозначается символом у.
Наличие и характер связи определяется по степени согласованности вариации данных рядов.
В тех случаях, когда возрастание величины факторного признака влечет за собой возрастание величины результативного признака, говорят о возможном наличии прямой корреляционной связи. Если же с увеличением факторного признака величина результативного признака имеет тенденцию к уменьшению, то можно предполагать обратную связь между этими признаками.
Пример. В результате наблюдений получены следующие данные о величине производственного стажа (х) и размере дневной заработной платы (у) 12 рабочих производственного участка:
х, лет |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
у, т.р. |
10 |
13 |
11 |
14 |
16 |
15 |
14 |
17 |
19 |
18 |
19 |
21 |
Параллельное сопоставление рядов индивидуальных значений в данном случае показывает на наличие прямой корреляционной связи по мере увеличения производственного стажа размер дневной заработной платы повышается.
Метод параллельных рядов обычно используется для установления характера связи при относительно небольшом объеме исходного материала. Однако при наличии большого числа значений признаков, когда одному и тому же значению признака-фактора, как правило, соответствует несколько различных значений результативного признака, восприятие параллельных рядов сильно затрудняется. В этих случаях целесообразно для установления наличия связи воспользоваться методом построения корреляционных таблиц.
Построение корреляционной таблицы начинают с группировки значений факторного и результативного признаков. В корреляционной таблице, как правило в подлежащем указывается факторный признак х, а в сказуемом – результативный признак у.
В корреляционной таблице указываются частоты: сколько раз данная величина одного признака повторяется в сочетании с соответствующей величиной другого признака. Итоговые графа и строка отражают распределение единиц совокупности по рассматриваемым признакам.
Если частоты в корреляционной таблице расположены на «главной» диагонали (из левого верхнего угла в правый нижний угол), но можно предположить наличие прямой корреляционной зависимости между признаками. Если же частоты расположены по «вспомогательной» диагонали (из левого нижнего угла в правый верхний угол), то предполагают наличие обратной связи между признаками.
Следует подчеркнуть, что при рассмотрении корреляционной таблицы важно установить расположение основной части частот. Возможны варианты, что все клетки корреляционной таблицы окажутся заполненными. Однако это обстоятельство еще не означает, что корреляционная связь между данными признаками отсутствует. Если основная масса частот расположена по той или иной диагонали, то корреляционная связь между признаками существует.
Корреляционная таблица позволяет сжато, компактно и достаточно наглядно изложить исходный материал. Поэтому даже расчеты по методам корреляции и регрессии можно вести по корреляционной таблице.
Пример. Используя приведенные выше данные, выполним группировку и построим корреляционную таблицу, характеризующую зависимость между стажем работы и размером дневной заработной платы рабочих:
Длительность производственного стажа в годах (х) |
Размер дневной заработной платы в тыс. руб. (у) |
Итого |
||
10-13 |
14-17 |
18-21(свыше 18) |
||
1-3 |
3 |
- |
- |
3 |
4-6 |
- |
3 |
- |
3 |
7-9 |
- |
2 |
1 |
3 |
10-12 |
- |
- |
3 |
3 |
Итого |
3 |
5 |
4 |
12 |
Анализ корреляционной таблицы также подтверждает о наличии между рассматриваемыми признаками положительной корреляционной связи.
Корреляционная таблица, как и метод параллельных рядов, полностью базируется на сопоставлении индивидуальных значений изучаемых признаков. А индивидуальные значения формируются под влиянием как основных, так и случайных факторов.
Корреляционная связь обнаруживается более ясно, четко, если влияние случайных факторов удается нивелировать. Это обеспечивается при применении для выявления наличия корреляционной связи метода аналитической группировки и исчисления групповых средних.
Метод аналитической группировки и исчисления групповых средних состоит в следующем:
а) совокупность результатов наблюдений разбивается на группы по величине факторного признака и для каждой группы вычисляется средняя величина результативного признака.
Пример. Данные по параллельным рядам и корреляционной таблице сведем в так называемую групповую таблицу:
Группы рабочих по длительности производственного стажа в годах (х) |
Число рабочих в данной группе |
Общая сумма дневной заработной платы рабочих в данной группе (тыс. руб.) |
Средняя дневная зарплата одного рабочего в данной группе в тыс. руб. ( ) |
|
по индивидуальным данным (а) |
по данным корреляционной таблицы (б) |
|||
1-3 |
3 |
34 |
11,3 |
11,5 |
4-6 |
3 |
45 |
15,0 |
15,5 |
7-9 |
3 |
50 |
16,7 |
16,8 |
10-12 |
3 |
58 |
19,3 |
19,5 |
Итого |
12 |
187 |
15,6 |
15,8 |
Сравнив средние значения результативного признака (последний столбец а или б) по группам значений признака-фактора (первый столбец) можно сделать вывод, что между данными признаками имеется тесная прямая корреляционная зависимость.
Корреляционная зависимость, если она существует, будет тем отчетливее обнаруживаться, чем большее число данных будет по каждой группе. Другими словами, предполагаются по каждой группе. Другими словами, предполагаются что все случайные факторы взаимно погашаются и различия в величине средних будут связаны только с различиями в величине факторного признака. Если бы связи между факторным и результативным признаками не было, то все групповые средние результативного признака были бы приблизительно одинаковыми по величине.
Попутно заметим, что оценка существенности расхождения групповых средних лежит в основе использования методов дисперсионного анализа для выявления наличия и оценки тесноты корреляционной связи.
При применении метода аналитической группировки и исчисления групповых средних необходимо помнить, что оценка наличия или отсутствия корреляционной связи между изучаемыми признаками зависит как от количества выделяемых групп, так и от установления границ интервалов. Недостатком этого метода является неоднозначность результатов при различных группировках.
Для предварительного выявления наличия связи и раскрытия ее характера применяют также графический метод.
Сущность данного метода состоит в следующем. В прямоугольной системе координат на оси абсцисс откладываются значения факторного признака х, на оси ординат – результативного признака у. Используя индивидуальные данные по х и у строится точечный график. Каждая точка имеет соответствующие друг другу координаты (х, у).
Совокупность полученных точек образует корреляционное поле. По характеру расположения точек на корреляционном поле можно судить о наличии или отсутствии связи (о силе связи), а также о направлении связи. Так, если точки беспорядочно разбросаны по полю (в виде шара), то зависимость между переменными отсутствует; если точки образуют эллипс, т.е. концентрируются вокруг оси, идущей из нижнего левого угла в верхний правый (или наоборот), то имеется прямая (или обратная) зависимость между исследуемыми признаками.
у
у
у
х
х
х
а) б) в)
Рис. 13.1. Виды корреляционного поля
На рисунках график (а) соответствует отсутствию зависимости между признаками; график (б) – наличию прямой (положительной) и график (в) – наличию обратной (отрицательной) зависимости.
Пример. Построим корреляционное поле по параллельным рядам, приведенным выше:
у
Рис. 13.2. Зависимость у от х
Точки корреляционного поля не лежат на линии, параллельной одной из осей, не образуют форму шара. Можно предположить наличие положительной связи между данными признаками. Расположение точек такого, что можно говорить о наличии прямолинейной корреляционной связи между стажем работы и дневной заработной платы рабочих.
Корреляционное поле (точечный график) может быть построен и по данным аналитической группировки, и по групповым средним. В последнем случае последовательным соединением точек корреляционного поля получают эмпирическую линию (ломаную) регрессии (подробно будет рассмотрено в п.13.6. данной темы).