- •Конспект лекций По предмету «Статистика»
- •Содержание
- •Глава 1 Введение. Понятие статистики, предмет и методология. Основные определения………………………………………………………………………......4
- •Глава 2 Статистический анализ рядов распределения…………………….….14
- •Глава 3 Выборочное наблюдение………………………………………………..26
- •Глава 4 Статистическое изучение связей. Корреляционно-регрессионный анализ………………………………………………………………………………..33
- •Глава 5 Статистический анализ временных рядов……………………………45
- •Глава 1 Введение. Понятие статистики, предмет и методология. Основные определения.
- •1.1 Понятие статистики. Предмет и объект изучения статистики
- •1.2 Методология статистики
- •1.3 Этапы статистического исследования
- •1.3.1 Статистическое наблюдение
- •1.3.2 Сводка и группировка данных
- •1.4 Статистические показатели
- •1.4.1 Средняя арифметическая простая
- •1.4.2 Средняя арифметическая взвешенная
- •1.4.3 Средняя гармоническая
- •1.4.4 Средняя геометрическая
- •1.4.5 Средняя квадратическая
- •Глава 2 Статистический анализ рядов распределения
- •2.1 Построение ряда распределения
- •2.2 Графическое изображение вариационных рядов
- •2.3 Показатели центра и структуры распределения
- •2.4 Показатели вариации
- •Среднее линейное отклонение
- •3. Дисперсия
- •4. Среднее квадратическое (стандартное) отклонение
- •Относительное линейное отклонение
- •2.5 Характеристика формы распределения
- •2.6 Выравнивание эмпирических распределений и оценка соответствия эмпирического распределения теоретическому
- •Глава 3 Выборочное наблюдение
- •3.1 Способы отбора единиц в выборочную совокупность
- •3.2 Виды выборки
- •3.3 Ошибка репрезентативности (ошибка выборки)
- •3.4 Правило сложения дисперсий
- •3.5 Ошибка выборки для доли
- •3.6 Определение объема выборки
- •3.7 Особенности малой выборки
- •Глава 4 Статистическое изучение связей. Корреляционно-регрессионный анализ
- •Функционально (жестко-детерминированная) связь
- •2) Статистические связи и зависимости (стохастически детерминированная).
- •4.1 Причины возникновения корреляционной зависимости
- •4.2 Условия применения методов корреляционно-регрессионного анализа
- •4.3 Графическое изображение корреляционной зависимости
- •Показатели корреляции
- •Коэффициент корреляции
- •Коэффициент детерминации
- •Корреляционное отношение
- •Индекс корреляции
- •4.5 Регрессионный анализ. Парное и множественное уравнение регрессии
- •4.5.1 Уравнение парной регрессии
- •4.5.2 Уравнение множественной регрессии
- •4.5.3 Построение матрицы парных коэффициентов корреляции. Отбор факторов
- •4.5.4 Коэффициенты эластичности и β-коэффициенты
- •4.6 Оценка статистической значимости уравнения регрессии и его параметров
- •4.6.1 Оценка статистической значимости уравнения регрессии
- •4.6.2 Оценка статистической значимости параметров уравнения
- •Глава 5 Статистический анализ временных рядов (рядов динамики)
- •5.1 Показатели изменения уровней временного ряда
- •1) Абсолютный прирост;
- •4) Абсолютное значение 1% прироста.
- •Абсолютный прирост
- •1. Абсолютный цепной прирост
- •2. Абсолютный прирост базисный
- •Темп роста (коэффициент роста)
- •5.3.2 Изучение основной тенденции временного ряда. Выравнивание рядов динамики
- •5.3.3 Экстраполяционное прогнозирование на основе трендовых моделей
- •5.4 Автокорреляция в рядах динамики (автокорреляция уровней временных рядов)
- •5.5 Корреляция рядов динамики
- •5.6 Изучение сезонности в динамических рядах
- •5.7 Статистические индексы. Индексный анализ
- •1) Индивидуальные (I)
- •2) Общие индексы (сводные, I)
- •5.7.1 Агрегатные индексы
- •5.7.2 Индексы Ласпейреса и Пааше
- •5.7.3 Идеальный индекс Фишера
- •5.7.4 Индексы средние из индивидуальных
- •5.7.3 Индексы-дефляторы
Глава 3 Выборочное наблюдение
Выборочное наблюдение – один из видов несплошного наблюдения. Преимущество выборочного наблюдения по сравнению со сплошным заключается в экономии времени, трудовых ресурсов, денежных ресурсов и появляется возможность расширить программу наблюдения. Преимущества выборочного наблюдения по сравнению с другими видами несплошного наблюдения: по результатам выборки с определенной вероятностью можно судить о генеральной совокупности.
Генеральная совокупность – совокупность, свойства которой интересуют исследователя, и из которой осуществляется отбор единиц в выборочную совокупность.
Выборочная совокупность – совокупность отобранных единиц, по которым в процессе наблюдения будут регистрироваться признаки или значения признаков.
N - объем генеральной совокупности;
n - объем выборочной совокупности.
Задача организации выборочного наблюдения – формирование репрезентативной выборки.
3.1 Способы отбора единиц в выборочную совокупность
Случайный отбор. Реализуется с использованием жеребьевки или таблиц случайных чисел.
Механический отбор. Частный случай случайного отбора. Реализуется через расчет шага отбора.
, где
N – объем генеральной совокупности,
n – объем выборки.
Пример: = - в выборку попадает каждая пятая единица генеральной совокупности.
3.2 Виды выборки
Собственно-случайная выборка. Без предварительной подготовки генеральной совокупности случайно или механически из нее извлекают единицы в выборочную совокупность. В данном случае единица отбора совпадает с единицей наблюдения.
Стратифицированная типологическая (районированная) выборка. В генеральной совокупности выделяются типы или страты, а затем из каждого типа извлекается число единиц, пропорционально доли каждого типа в общем объеме генеральной совокупности. Единица отбора совпадает с единицей наблюдения.
Серийная выборка (гнездовая). В генеральной совокупности выбираются серии (гнезда) и в выборку случайно или механически производят отбор серий. Внутри серий, попавших в выборку, проводится сплошное наблюдение. Чаще всего используется для оценки качества продукции, товаров и в сельском хозяйстве.
Многоступенчатая выборка. Связана со сложностью социально-экономических явлений, что не позволяет на первом этапе сформировать окончательно выборочную совокупность. На каждом этапе меняется единица отбора.
Многофазная выборка. Каждая фаза отличается объемом программы наблюдения. Чем меньше объем выборки, тем шире программа наблюдения.
3.3 Ошибка репрезентативности (ошибка выборки)
Репрезентативная выборка – выборка, которая позволяет получить так называемые несмещенные оценки параметров генеральной совокупности. Выборочную совокупность можно назвать репрезентативной, если распределение единиц в выборке соответствует распределению единиц генеральной совокупности.
При проведении любого наблюдения возникают ошибки наблюдения, которые могут быть случайными и преднамеренными. При достаточно хорошей организации наблюдения этих ошибок можно избежать. При организации выборочного наблюдения возникают ошибки репрезентативности. Эти ошибки связаны не с организацией наблюдения, а с самой сутью выборочного исследования (по части, по выборочной совокупности, приходится судить о целом, о генеральной совокупности). Ошибка выборки неизбежна и состоит в том, что параметры выборочной совокупности (показатели, рассчитанные по выборке) не совпадают с параметрами (показатели генеральной совокупности). Задача исследователя: сформировать выборку, позволяющую получить минимальную ошибку и определить конкретную величину полученной ошибки. Теоретической основой определения ошибки репрезентативности являются теоремы Чебышева, Ляпунова и Бернулли.
Суть теоремы Чебышева: При неограниченном увеличении числа наблюдений в генеральной совокупности с ограниченной дисперсией с вероятностью, близкой к 1, можно утверждать, что величина ошибки выборки не превысит сколь угодно малой положительной величины ε
n → ∞ , → 1 , где
- выборочная средняя;
- генеральная средняя;
P - вероятность события, заключенного в скобках.
Суть события в том, что ошибка чрезвычайно мала.
Теорема Чебышева доказывает принципиальную возможность оценки параметров генеральной совокупности на основе выборочных данных. Исходя из этой теоремы не ясно, чему равна ошибка выборки и с какой именно вероятностью можно гарантировать непревышение конкретной величины ошибки. На эти вопросы отвечает теорема Ляпунова.
Суть теоремы Ляпунова.
При неограниченном увеличении числа наблюдений в генеральной совокупности с ограниченной дисперсией вероятность того, что ошибка выборки не превысит величины равна нормированной функции Лапласа.
n → ∞ , , где
μ- средняя ошибка выборки.
, где
- средняя выборочная по i-ой выборке.
n - число выборок.
Данная формула на практике не может быть использована, так как неизвестна величина генеральной средней и фактически проводится всегда лишь одна выборка.
Математической статистикой доказано, что μ2 прямо пропорциональна дисперсии генеральной совокупности и обратно пропорциональна объему выборки.
, где
σ2 – генеральная дисперсия.
Между величинами выборочной и генеральной дисперсий существует зависимость:
, где
S2 – выборочная дисперсия.
При большом объеме выборки сомножитель
Поэтому на практике его игнорируют и в расчете средней ошибки используют величину выборочной дисперсии.
t·μ = Δ - предельная ошибка выборки.
- нормированное отклонение
- нормированное отклонение выборочной средней от генеральной среденей.
Теорема Ляпунова доказывает, что при большом объеме выборки распределение ошибки выборки подчинено закону нормального распределения.
Для нормального распределения составлены таблицы, в которых зафиксировано отношение t и уровня вероятности.
Задавая уровень вероятности, по таблицам находится соответствующее значение нормированного отклонения. Социально-экономические исследования чаще всего проводятся с вероятностью p = 0.954, t = 1.96 ≈ 2
p = 0.997 , t ≈ 3.
Если задана p = 0.954 , то Δ = 2·μ
Доверительный интервал:
В условиях большой выборки распределение ошибки выборки подчиняется закону нормального распределения. Поэтому, задавая уровень вероятности, величину t (значение нормированного отклонения) находят по таблице нормированной функции Лапласа.
Выше указанные формулы расчета ошибки выборки разработаны для повторного отбора. В статистике понятие повторного и бесповторного отбора соответствует понятиям возвратного и безвозвратного шара в теории вероятности. Повторный отбор заключается в том, что единица генеральной совокупности, изъятая в выборку, возвращается назад в генеральную совокупность и может быть повторно выбрана в выборочную совокупность. Бесповторный отбор – отобранная из генеральной совокупности единица не возвращается назад.
При повторном отборе на протяжении всего отбора сохраняется неизменная вероятность попадания единицы в выборку p = 1/N
При бесповторном отборе вероятность изменения от для первой единицы отбора до для последней единицы отбора.
Поэтому формула средней ошибки выборки для бесповторного отбора, который, как правило, используется в анализе социально-экономических явлений, имеет вид
Величина ошибки выборки зависит также от вида выборки. В формуле средней ошибки при реализации различных видов выборки используются разные дисперсии.