- •Предмет статистической науки.
- •Основные методы статистической науки.
- •Место общей теории статистики в комплексе статистических дисциплин.
- •Отраслевые статистики их роль в статистической науке.
- •Основные категории статистической науки (статистическая совокупность, ее единицы, статистическая закономерность).
- •Основные категории статистической науки (статистические признаки и показатели).
- •Статистическое наблюдение, его роль в процессе статистического исследования.
- •Формы статистического наблюдения
- •Виды и способы статистического наблюдения.
- •Виды несплошного наблюдения
- •Способы статистического наблюдения
- •Организационные формы статистического наблюдения.
- •Виды несплошного наблюдения.
- •Статистические таблицы и их виды.
- •Понятие системы статистических показателей объекта.
- •Основные функции статистических показателей.
- •Абсолютные величины и их разновидности в зависимости от применяемых единиц измерения.
- •Относительные величины и их разновидности
- •Виды относительных величин
- •Средние величины, их сущность и виды.
- •Свойства средней арифметической и техника ее вычисления.
- •Расчет средней арифметической по данным интервального вариационного ряда.
- •Средняя гармоническая величина, ее смысл и обоснование применения.
- •Ряды распределения (вариационные ряды) статистических данных и их виды. Основы техники построения интервальных рядов.
- •Графические методы отображения вариационных рядов.
- •Техника построения гистограмм. 24.Техника построения полигонов.
- •25.Техника перехода от гистограммы к полигону и наоборот.
- •26. Общая характеристика показателей центра распределения вариационного ряда.
- •27. Мода вариационного ряда, ее определение для дискретного и интервального ряда.
- •28. Медиана вариационного ряда, ее определение для дискретного и интервального ряда.
- •Абсолютные показатели колеблемости (вариации) признака в ряду.
- •Относительные показатели колеблемости (вариации) признака в ряду, области их целесообразного применения.
- •Показатели формы распределения вариационного ряда, их интерпретация.
- •Статистическая проверка гипотезы о соответствии данных вариационного ряда некоторой теоретической функции распределения.
- •Критерий согласия Пирсона.
- •36. Простая случайная выборка.
- •40. Типическая выборка
- •41. Серийная выборка
- •42. Районированная
- •43. Механическая
- •44. Понятие корреляционной связи.
- •46. Метод параллельных рядов.
- •Метод групповых таблиц.
- •Метод корреляционных таблиц.
- •Метод корреляционных полей.
- •50. Парная корреляция. Линейный коэффициент корреляции.
- •51. Эмпирическое корреляционное отношение, его значение и свойства, техника расчета.
- •52. Коэффициент ранговой корреляции.
- •53. Коэффициент Спирмена, его свойства.
- •54. Коэффициент ранговой корреляции Кендела.
- •55. Понятие связанных рангов.
- •56. Коэффициент конкордации, его свойства и техника расчета.
- •59. Коэффициенты Пирсона и Чупрова, их свойства.
- •60. Понятие уравнение регрессии.
- •61. Парная регрессия.
- •62. Применение мнк для оценки параметров уравнения регрессии.
- •65. Множественная регрессия.
- •67. Ряды динамики: понятие, виды. Показатели ряда динамики.
- •68. Содержание и аспекты проблемы сопоставимости уровней ряда.
- •69. Тренд динамического ряда.
- •70. Простейшие показатели динамики количественных признаков, связь между ними.
- •71. Техника расчета средних значений для интервальных рядов.
- •72. Техника расчета средних значений для моментных рядов.
- •73. Выравнивание динамического ряда, его цель, метод скользящей средней.
- •74. Аналитическое выравнивание динамического ряда мнк.
- •75. Использование трендовых моделей динамических рядов в прогнозировании.
- •76.Анализ сезонной неравномерности динамического ряда и ее аналитическое выражение.
Метод групповых таблиц.
Групповыми называются таблицы, имеющие в подлежащем группировку единиц совокупности по одному признаку.
Распределение населения России по полу на 1 января 2007 г. |
||
|
млн.чел |
в % к итогу |
Численность населения — всего |
142,0 |
100,0 |
В том числе: |
|
|
Мужчины |
65,8 |
46,3 |
Женщины |
76,4 |
53,7 |
Метод корреляционных таблиц.
Корреляционный анализ — это количественный метод определения тесноты и направления взаимосвязи между выборочными переменными величинами.
Линейная корреляция:
Данная корреляция характеризует линейную взаимосвязь в вариациях переменных. Она может быть парной (две коррелирующие переменные) или множественной (более двух переменных), прямой или обратной — положительной или отрицательной, когда переменные варьируют соответственно в одинаковых или разных направлениях.
Если переменные — количественные и равноценные в своих независимых наблюдениях при их общем количестве , то важнейшими эмпирическими мерами тесноты их линейной взаимосвязи являются коэффициент прямой корреляции знаков австрийского психолога Г.Т.Фехнера (1801-1887) и коэффициенты парной, чистой (частной) и множественной (совокупной) корреляции английского статистика-биометрика К.Пирсона (1857-1936).
Коэффициент парной корреляции знаков Фехнера определяет согласованность направлений в индивидуальных отклонениях переменных и от своих средних и . Он равен отношению разности сумм совпадающих ( ) и несовпадающих ( ) пар знаков в отклонениях и к сумме этих сумм:
Величина Кф изменяется от -1 до +1. Суммирование в (1) производится по наблюдениям , которые не указаны в суммах ради упрощения. Если какое-то одно отклонение или , то оно не входит в расчет. Если же сразу оба отклонения нулевые: , то такой случай считается совпадающим по знакам и входит в состав . В таблице 12.1. показана подготовка данных для расчета (1).
Таблица 12.1 Данные для расчета коэффициента Фехнера.
Магазин |
Число работников, тыс. чел. |
Товарооборот, у.е. |
Отклонение от средних и |
Сравнение знаков и |
||
|
|
|
|
|
совпа-дение (Ск) |
несов-падение (Нк) |
1 |
0,2 |
3,1 |
+0,0 |
-0,9 |
0 |
1 |
2 |
0,1 |
3,1 |
-0,1 |
-0,9 |
1 |
0 |
3 |
0,4 |
5,0 |
+0,2 |
+1,0 |
1 |
0 |
4 |
0,2 |
4,4 |
+0,0 |
+0,4 |
1 |
0 |
5 |
0,1 |
4,4 |
-0,1 |
+0,4 |
0 |
1 |
Итого |
1,0 |
20,0 |
- |
- |
3 |
2 |
По (1) имеем Кф = (3 — 2)/(3 + 2) = 0,20. Направление взаимосвязи в вариациях !!Средняя численность работников|численности работников]] и объема товарооборота — положительное (прямолинейное): знаки в отклонениях и и в своем большинстве (в 3 случаях из 5) совпадают между собой. Теснота взаимосвязи переменных по шкале Чеддока — слабая.
Коэффициенты парной, чистой (частной) и множественной (совокупной) линейной корреляции Пирсона, в отличие от коэффициента Фехнера, учитывают не только знаки, но и величины отклонений переменных. Для их расчета используют разные методы. Так, согласно методу прямого счета по несгруппированным данным, коэффициент парной корреляции Пирсона имеет вид:
Этот коэффициент также изменяется от -1 до +1. При наличии нескольких переменных рассчитывается коэффициент множественной (совокупной) линейной корреляции Пирсона. Для трех переменных x, y, z он имеет вид
Этот коэффициент изменяется от 0 до 1. Если элиминировать (совсем исключить или зафиксировать на постоянном уровне) влияние на и , то их "общая" связь превратится в "чистую", образуя чистый (частный) коэффициент линейной корреляции Пирсона:
Этот коэффициент изменяется от -1 до +1. Квадраты коэффициентов корреляции (2)-(4) называются коэффициентами (индексами) детерминации — соответственно парной, чистой (частной), множественной (совокупной):
Каждый из коэффициентов детерминации изменяется от 0 до 1 и оценивает степень вариационной определенности в линейной взаимосвязи переменных, показывая долю вариации одной переменной (y), обусловленную вариацией другой (других) — x и y. Многомерный случай наличия более трех переменных здесь не рассматривается.
Согласно разработкам английского статистика Р.Э. Фишера (1890-1962), статистическая значимость парного и чистого (частного) коэффициентов корреляции Пирсона проверяется в случае нормальности их распределения, на основании -распределения английского статистика В.С. Госсета (псевдоним "Стьюдент"; 1876-1937) с заданным уровнем вероятностной значимости и имеющейся степени свободы , где — число связей (факторных переменных). Для парного коэффициента имеем его среднеквадратическую ошибку и фактическое значение -критерия Стьюдента:
Для чистого коэффициента корреляции при расчете его вместо (n-2) надо брать , т.к. в этом случае имеется m=2 (две факторные переменные x и z). При большом числе n>100 вместо (n-2) или (n-3) в (6) можно брать n, пренебрегая точностью расчета.
Если tr > tтабл. , то коэффициент парной корреляции — общий или чистый является статистически значимым, а при tr ≤ tтабл. — незначимым.
Значимость коэффициента множественной корреляции R проверяется по F — критерию Фишера путем расчета его фактического значения
При FR > Fтабл. коэффициент R считается значимым с заданным уровнем значимости a и имеющихся степенях свободы и , а при Fr≤ Fтабл — незначимым.
В совокупностях большого объема n > 100 для оценки значимости всех коэффициентов Пирсона вместо критериев t и F применяется непосредственно нормальный закон распределения (табулированная функция Лапласа-Шеппарда).
Наконец, если коэффициенты Пирсона не подчиняются нормальному закону, то в качестве критерия их значимости используется Z — критерий Фишера, который здесь не рассматривается.
Условный пример расчета (2) — (7) дан в табл. 12.2, где взяты исходные данные табл.12.1 с добавлением к ним третьей переменной z — размера общей площади магазина (в 100 кв. м).
Таблица 12.2. Подготовка данных для расчета коэффициентов корреляции Пирсона
Мага-зин |
Показатели |
||||||||
к |
xk |
yk |
zk |
xkyk |
xkzk |
ykzk |
|
|
|
1 |
0,2 |
3,1 |
0,1 |
0,62 |
0,02 |
0,31 |
0,04 |
9,61 |
0,01 |
2 |
0,1 |
3,1 |
0,1 |
0,31 |
0,01 |
0,31 |
0,01 |
9,61 |
0,01 |
3 |
0,4 |
5,0 |
1,0 |
2,00 |
0,40 |
5,00 |
0,16 |
25,00 |
1,00 |
4 |
0,2 |
4,4 |
0,2 |
0,88 |
0,04 |
0,88 |
0,04 |
19,36 |
0,04 |
5 |
0,1 |
4,4 |
0,6 |
0,44 |
0,06 |
2,64 |
0,01 |
19,36 |
0,36 |
Итого |
1,0 |
20,0 |
2,0 |
4,25 |
0,53 |
9,14 |
0,26 |
82,94 |
1,42 |
Согласно (2) — (5), коэффициенты линейной корреляции Пирсона равны:
Взаимосвязь переменных x и y является положительной, но не тесной, составляя по их парному коэффициенту корреляции величину и по чистому — величину и оценивалась по шкале Чеддока соответственно как "заметная" и "слабая".
Коэффициенты детерминации dxy =0,354 и dxy.z = 0,0037 свидетельствуют, что вариация у (товарооборота) обусловлена линейной вариацией x (численности работников) на 35,4% в их общей взаимосвязи и в чистой взаимосвязи — только на 0,37%. Такое положение обусловлено значительным влиянием на x и y третьей переменной z — занимаемой магазинами общей площади. Теснота ее взаимосвязи с ними составляет соответственно rxz=0,677 и ryz=0,844.
Коэффициент множественной (совокупной) корреляции трех переменных показывает, что теснота линейной взаимосвязи x и z c y составляет величину R = 0,844, оцениваясь по шкале Чеддока как "высокая", а коэффициент множественный детерминации — величину D=0,713, свидетельствуя, что 71,3 % всей вариации у (товарооборота) обусловлены совокупным воздействием на нее переменных x и z. Остальные 28,7% обусловлены воздействием на y других факторов или же криволинейной связью переменных y, x, z.
Для оценки значимости коэффициентов корреляции возьмем уровень значимости . По исходным данным имеем степени свободы для и для . По теоретической таблице находим соответственно tтабл.1. = 3,182 и tтабл.2. = 4,303. Для F-критерия имеем и и по таблице находим Fтабл. = 19,0. Фактические значения каждого критерия по (6) и (7) равны:
Все расчетные критерии меньше своих табличных значений: все коэффициенты корреляции Пирсона статистически незначимы.