- •Вопросы к экзамену по курсу «статистика»
- •Примеры задачек к экзамену:
- •1.Понятие, предмет, задачи статистики.
- •2. Выборочное наблюдение
- •9.Ошибки наблюдения:
- •3. Вариация
- •5 Средняя величина
- •2.Взвешенное среднее
- •6. Ряды распределения
- •24.Стандартная ошибка выборки.
- •7. Малая выборка: понятия особенности проверки гипотез.
- •95% Всех значений находятся на расстоянии от среднего.
- •29. Гипотеза
- •32. Виды связей между признаками
- •34.Множественная корреляция
- •38.Множественная регрессия.
- •Компоненты временного ряда.
- •46. Тренд
- •48.Показатели изменения уровней дин. Рядов:
- •50.Контроль качества
- •51.Индекс
- •53.Индексы средние из индивидуальных.
- •55.Система показателей статистики цен. Индекс потребительских цен.
- •56. Индексы Ласпейреса и Пааше.
- •57. Характеристики уровня жизни населения.
- •58. Денежные доходы.
- •Показатели дифференциации.
- •60. Статистические показатели потребления населением материальных благ и услуг. Коэффициент эластичности.
- •Система статистических показателей инфляции.
- •62.Трудовые ресурсы и занятость
- •Анализ естественного движения и миграции населения.
- •64.Статистический анализ безработицы
- •65. Национальное богатство в системе макроэкономической статистики. Состав национального богатства
- •66.Статистика основных фондов (оф)
- •67.Статистика материальных оборотных фондов
- •68. Индекс развития человеческого потенциала.
2.Взвешенное среднее
Степенные средние.
Виды:
Простые Взвешенные
(k-степень ср. величины)
Среднее гармоническое (К = -1):
простое взвешенное
Применяем для оценки средних затрат труда, времени, расстояния, материалов
на единицу продукции.
Среднее геометрическое (К=0):
простое взвешенное
П-произведение
Применяем для интегрального сравнения объектов
Среднее квадратическое (К=2):
простое взвешенное
Для исчисления среднего квадратического отклонения.
Среднее кубическое (К=3):
простое взвешенное
Правило мажорантности средних:
(Хгарм<Xгеом<Харифм<Хквадр<Хкуб)
6. Ряды распределения
В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают:
Атрибутивный ряд распределения- качественный признак
Вариационный - количественныйу признак.
Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями.
Вариационные ряды:
Ранжированный (если объектов не много)
Дискретный (если признак принимает небольшое число значений). В основу построения положены признаки с прерывными изменениями (дискретные признаки-кол-во детей в семье, число работников на предпр-ии,.Строится табл., где каждая строчка значения признака- кол-во единиц совокупности с данным значением признака.Табл.состоит из 2-х граф. В 1-ой-указ-ся конкретное значение признака, а во 2-ой-число единиц сов-ти с опред.значением признака.
Интервальный (если признак может принимать большое количество значений или эти значения могут быть дробными- объединяем значения признака в интервал). Если признак имеет непрерывное изменение (размер дохода, стаж работы). Групповая таблица имеет 2 графы. В 1-ой указ-ся значение признака в интервале «от-до»(вар-ты), во 2-ой-число единиц, входящих в интервал(частота).
Формула Стерджеса К=1+3,322lg n
i=R/K R=(xmax-xmin)
K – количество интервалов, n – кол-во единиц совокупности, i – величина интервала.
.Характеристики центра распределения
Средняя величина - обобщающая величина изучаемого признака совокупности, характеризующая типичный уровень совокупности.
Мода-величина признака, кот встречается в ряду распределения чаще всего.
Бимодальное распред.-распределение значений признака
Унимодальное-одна ярко выраженная мода
Если ряд ранжированный-переводим его в дискретный. Мода в дискретном ряду считается- считаем частоту по каждому признаку и выбираем наиболее часто встречаемый.
Медиана—значение, расположенное посередине ранжированного вариационного ряда.
Порядковый номер(ранг)= (n+1)/2
Соотношение среднего, моды и медианы:
Хср<Ме<Мо- левосторонняя асимметрия
Мо<Ме<Хср- правосторонняя
Мо=Ме=Хср- классическое нормальное распределении.
Характеристики структуры распределения
Мода-величина признака, кот встречается в ряду распределения чаще всего.
Бимодальное распред.-распределение значений признака
Унимодальное-одна ярко выраженная мода
Если ряд ранжированный-переводим его в дискретный. Мода в дискретном ряду считается- считаем частоту по каждому признаку и выбираем наиболее часто встречаемый.
Медиана—значение, расположенное посередине ранжированного вариационного ряда.
Порядковый номер(ранг)= (n+1)/2
Квантили - значения признака, которые делят совокупность на 4 равные по числу единиц части.
Квинтили, деление на 5 частей
Сикстили- деление на 6 частей
Децили- на 10
Перцентли -10
Нормальное распределение
теоретически гладкая гистограмма. Идеальный набор данных, в которых большинство чисел сконцентрировано в средней части диапазона значений.
Значения наблюдений не ограничены по своей величине.
диапазон ±1 S - 68,26% площади (значений).
диапазон ±2 S – 95,44% площади (значений).
диапазон ±3 S - 99,72% площади (значений).
Расстояние по горизонтальной оси, измеренное в единицах стандартного отклонения от среднего арифмет-го всегда даёт одинаковую площадь под кривой.
Показатели формы распределения:
Асимметрия.
Правосторонняя As > 0; Левосторонняя As < 0
Эксцесс.
Асимметрия НР=0 и Эксцесс=0
Более вытянутая вершина графика эксцесс >0, более пологий график эксцесс<0
Показатели изменчивости.
1.Размах - абсолютная разность между максимальным и минимальным значениями признака в изучаемой совокупности. R=Хmax-Хmin. Размах исп-ся для поиска ошибок в данных. Акцентируется внимание на экстремальных значениях.
2.Среднее линейное отклонение:
простая взвешенная
3.Среднее квадратическое отклонение = стандартное отклонение. Отражает типичное расстояние между средним значением и отдельными значениями набора данных (если знач.пост.,то изменчивость=0).
Показывает степень случайности в расположении отдельных значений относительно их среднего.
Простое и взвешенное стандартное отклонение.
для выборки
Простое Взвешенное
для ген. сов-ти
Простое Взвешенное
4.Дисперсия-квадрат ср.квадр.откл.
(квадрат среднего-среднее квадрата)
5.Коэф-ент осцилляции. к-т осцилляции (относительный размах вариации)
6.Коэф-нт вариации- мера относительного разброса случайной величины; показывает, какую долю среднего значения этой величины составляет ее средний разброс.
Vσ < 33% => совокупность однородная
Задача сглаживания эмпирического распределения
заключается в определении вероятности попадания случайной величины на заданный интервал. Вероятность того, что значение попадет в интервал = площади соответствующей области под кривой НормРасп.
Стандартизованная теоретическая кривая НР: (станд.откл.)
Таблица нормального распред-я = таблица Z значений
Правило определения вероятностей случайной величины наз-ся распределением вероятностей. Площадь в табл. НР – это вероятность.
Критерии согласия- критерии для проверки гипотезы о нормальности распределения или оценка близости эмпирических и теоретических частот.
1.Критерий согласия Пирсона, который можно представить как сумму отношений квадратов расхождений между f' и f к теоретическим частотам:
df=(r-1)*(c-1) Количество степеней свободы - количество значений в распределении, которые свободны для изменений.
Если χэмп2 < χкр0,012
Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения. λ= D/√n,
где D -максимальная разность накопленных теоретических f’ и экспериментальных f частот. Если λ<0,3 => P(λ)=1 => отклонения между теоретическим и эмпирическим нет
Критерий согласия В.И. Романовского
K – число степеней свободы
R < 3 => расхождение между теоретическим и эмпирическим – случайное
R > 3 => неслучайное, существенное
Критерий Ястремского.
r – число групп
lфакт < 3 => расхождение между теоретическим и эмпирическим – случайное
lфакт > 3 => неслучайное, существенное
Θ = 0,6 при числе групп< 20
Выбор вида распределения.
Нормальное распределение – непрерывные величины
Характеристики:
1.Среднее или ожидаемое значение дискретной случайной величины X:
2.Стандартное отклонение дискретной случайной величины X (риск, неопределенность ситуации)
Биномиальное распределение- если количество наступлений событий выражается как процент от общего количество возможностей.
Применение:
-В каждой из n попыток вероятность наступления события π одна и та же;
-Все попытки независимы друг от друга.
Примеры
Количество дефектных изделий среди 10 единиц выпущенной продукции;
Количество женщин, работающих в отделе со штатом 75 человек…
Распределение Пуассона -распределение дискретной величины, которое зависит только от ожидаемого среднего количества наступления событий
Применение: события происходят:
-Случайно
-Независимо
-Среднее число наступления события с ростом числа попыток не изменяется
Примеры
Количество заказов, которые фирма получит завтра;
Количество дефектов в произведенной продукции;
Экспоненциальное распределение- Непрерывное распределение с сильной асимметрией
Применение: события происходят:
-Случайно
-Независимо
-С постоянной частотой
Время ожидания между 2-мя последовательно наступающими событиями
Примеры
Длительность типичного телефонного разговора;
Время безотказной работы кинескопа
Характеристики основных видов распределения.
Нормальное распределение – непрерывные величины
Характеристики:
1.Среднее или ожидаемое значение дискретной случайной величины X:
2.Стандартное отклонение дискретной случайной величины X (риск, неопределенность ситуации)
Биномиальное распределение- если количество наступлений событий выражается как процент от общего количество возможностей.
Характеристики биномиального распределения:
-1.Количество наступлений события, X и Доля(процент), p=X/n
Среднее
Стандартное отклонение
X и Доля(процент), p=X/n
Среднее
Стандартное отклонение
Если для Бр нужно определить вероятность того, что вероятность события = α , то для НР надо считать вероятность попадания в интервал.
Распределение Пуассона -распределение дискретной величины, которое зависит только от ожидаемого среднего количества наступления событий
Характеристики:
1.стандартное отклонение = корень из среднего
2.вероятность того, что случайная величина Х со средним значением = α
Экспоненциальное распределение- Непрерывное распределение с сильной асимметрией
Характеристики:
1.Стандартное отклонение всегда равно среднему значению;
2. Вероятность того, что случайная величина X со средним значением μ принимает значения, меньшее α: