- •Теория статистики Пособие для студентов, обучающихся по дистанционной системе Введение
- •Тема 1. Предмет и метод статистики
- •Определение статистики
- •1.2. Статистическая закономерность, статистическая совокупность, единица совокупности
- •1.3. Признаки и их классификация, статистический показатель
- •Классификация признаков в статистике
- •1.4. Метод статистики
- •Контрольные вопросы к теме «Предмет и метод статистики»
- •Контрольные задания к теме «Предмет и метод статистики»
- •Тема 2. Статистическое наблюдение
- •Понятие статистического наблюдения
- •2.2. Виды статистического наблюдения
- •2.3. Способы наблюдения
- •2.4. Программно-методологические вопросы статистического наблюдения
- •2.5. Ошибки статистического наблюдения
- •Контрольные вопросы к теме «Статистическое наблюдение»
- •Тема 3. Сводка и группировка статистических данных
- •3.1. Содержание и виды статистической сводки
- •3.2. Метод группировки. Виды группировок
- •Административно-территориальное деление Российской Федерации (на 1 января 2007 г.)
- •Распределение населения рф по величине среднедушевых денежных доходов в 2004-2007гг. ( в процентах в итогу)
- •Группировка процентных ставок по объемам выданных кредитов банка n (условные данные)
- •Внешнеторговый оборот России в 2006 г.
- •Сводка и группировка статистических данных
- •3.3. Ряды распределения: виды, правила построения и графическое отображение
- •3.4. Статистические таблицы и графики
- •Контрольные вопросы к теме «Сводка и группировка»
- •Тема 4. Абсолютные и относительные статистические показатели
- •4.1. Сущность, значение и классификация статистических показателей
- •4.2. Абсолютные величины
- •4.3. Относительные величины
- •Производство легковых автомобилей в рф в 2000 - 2003гг. (тыс.Шт)
- •Структура валового внутреннего продукта рф в 1 квартале 2003 г.
- •Контрольные вопросы к теме «Абсолютные и относительные статистические показатели»
- •Контрольные задания к главе 4
- •Рассчитайте относительные показатели динамики, интенсивности, сравнения и сделайте выводы о естественном движении населения в области.
- •Тема 5. Средние показатели
- •5.1. Средняя, её сущность и определение
- •5.2. Виды и формы средних величин
- •5.3. Средняя арифметическая
- •Сделки по акциям эмитента "х" за торговую сессию
- •Себестоимость продукции "z"
- •Распределение сотрудников предприятия по возрасту
- •5.4. Средняя гармоническая.
- •Решение
- •Решение
- •Информация о вкладах в банке для расчета средних значений
- •Решение
- •5.5. Средняя геометрическая
- •Контрольные вопросы по теме «Средние показатели»
- •Контрольные задания по теме «Средние показатели»
- •Доходы банков в отчетном году характеризуется следующими показателями:
- •Тема 6. Показатели вариации
- •Относительные показатели вариации
- •6.3. Меры вариации для сгруппированных данных. Правило сложения дисперсий
- •Общая дисперсия равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий:
- •Группировка населения отдельных областей России по среднему размеру ежемесячных денежных льгот пенсионеров
- •6.3. Вариация альтернативного признака
- •Контрольные вопросы к теме «Показатели вариации»
- •Контрольные задания к теме «Показатели вариации»
- •Тема 7. Виды и формы связей, различаемые в статистике
- •6.1. Виды и формы связей, различаемые в статистике
- •6.2. Измерение тесноты связи в случае корреляционной зависимости.
- •6.3. Оценка достоверности коэффициента корреляции
- •6.4. Ранговая корреляция
- •6.5. Корреляция альтернативных признаков
- •Решение
- •Решение
- •5. Коэффициент взаимной сопряженности к.Пирсона
- •Контрольные задания по теме «Статистическое изучение связи между явлениями»
- •Тема 8. Статистическое изучение динамики социально-экономических процессов
- •8.1. Основные понятия и показатели
- •8.2. Виды рядов динамики
- •8.3. Показатели изменения уровней ряда динамики
- •8.4. Приемы преобразования временных рядов
- •Контрольные вопросы к теме «Анализ динамики социально-экономических процессов»
- •Контрольные задания к теме «Анализ динамики социально-экономических процессов»
- •Тема 9. Индексный метод
- •Индексы, их сущность. Индивидуальные индексы и их взаимосвязи
- •Агрегатные индексы. Проблема соизмерения индексируемых величин
- •9.3. Средний арифметический и средний гармонический индексы, тождественные агрегатному
- •Индексный метод анализа динамики среднего уровня: индексы переменного, постоянного состава и структурных сдвигов
- •Данные о ценах и объемах реализации товара "X" в двух регионах
- •Ряды индексов с постоянной и переменной базой сравнения (цепные и базисные), с постоянными и переменными весами
- •Ряды индексов с постоянными и переменными весами
- •Взаимосвязи индексов. Индексный метод выявления роли отдельных факторов динамики сложных явлений
- •Контрольные вопросы к теме «Индексный метод»
- •Контрольные задания по теме «Индексный метод»
6.3. Оценка достоверности коэффициента корреляции
Коэффициент линейной корреляции, исчисленный по выборочным данным является случайной величиной. Полученный из выборки коэффициент корреляции r является оценкой коэффициента корреляции в генеральной совокупности. С уменьшением числа наблюдений надежность коэффициента корреляции падает. Оценка существенности (значимости) линейного коэффициента корреляции основана на сопоставлении значения r с его средней квадратической ошибкой :
,
При оценке значимости коэффициента корреляции обычно рассматриваются следующие ситуации.
Если число наблюдений достаточно велико (обычно свыше 30), а значение коэффициента корреляции не превышает 0.9, распределение коэффициента корреляции r можно считать приближенно нормальным со средней квадратической ошибкой
,
При достаточно большом числе наблюдений r должен превышать свою среднюю ошибку не менее, чем в три раза: . Если это неравенство не выполняется, то существование связи между признаками нельзя считать доказанным.
Задавшись определенной вероятностью, можно построить доверительные границы r:
Так, например, при вероятности 0,95, для которой t = 1,96, доверительные границы составят
,
При вероятности 0,997, для которой коэффициент доверия t = 3, доверительные границы составят
Поскольку значение r не может превышать единицу, то в случае, если > 1, следует указать только нижний предел, то есть утверждать, что реальный r не меньше, чем .
2. Для малого объема выборки, с распределением r далеким от нормального, применяются другие методы оценки значимости коэффициента корреляции. При небольшом числе наблюдений (n < 30), средняя ошибка линейного коэффициента корреляции находится по формуле:
а значимость проверяется на основе t критерия Стьюдента. При этом выдвигается гипотеза о равенстве коэффициента корреляции нулю, то есть об отсутствии связи между y и x в генеральной совокупности. Для этого используется статистика:
расчетное значение которой сопоставляется с табличным, из таблиц распределения Стьюдента. Если нулевая гипотеза верна, то есть r=0, то распределение t- критерия подчиняется закону распределения Стьюдента с n-2 степенями свободы и принятым уровнем значимости (обычно 0,05). В каждом конкретном случае по таблице распределения t-критерия Стьюдента находится табличное (критическое) значение t, которое допустимо при справедливости нулевой гипотезы, и с ним сравнивается фактическое (расчетное) значение t. Если t расч. > t табл. , то нулевая гипотеза отклоняется и линейный коэффициент считается значимым, а связь между x и y – существенной. И наоборот.
3. При малом числе наблюдений в выборке и высоком коэффициенте корреляции (распределение r отличается от нормального) для проверки гипотезы о наличии корреляционной связи, а также построения доверительного интервала применяется z-преобразование Фишера.
Для этого рассчитывается величина
Распределение z приближается к нормальному. Вариация z выражается формулой
Рассчитаем z критерий для примера 1, поскольку в этом случае мы имеем небольшое число наблюдений и высокий коэффициент корреляции.
.
Чтобы не вычислять значения логарифмов, можно воспользоваться специальными таблицами Z-преобразований (Ефимова М.Р. стр. 402, Шмойлова Р.А. стр.446, Елисеева И.И. стр.473). Находим, что коэффициенту корреляции 0,94 соответствует Z=1,74.
Находим
Отношение Z к средней квадратической ошибке равно 3. Таким образом, мы можем полагать действительное наличие связи между величиной выпуска продукции и расходом электроэнергии для всей совокупности предприятий.