Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
statistika.doc
Скачиваний:
4
Добавлен:
23.09.2019
Размер:
759.81 Кб
Скачать

2.Взвешенное среднее

Степенные средние.

Виды:

Простые Взвешенные

(k-степень ср. величины)

Среднее гармоническое (К = -1):

простое взвешенное

Применяем для оценки средних затрат труда, времени, расстояния, материалов

на единицу продукции.

Среднее геометрическое (К=0):

простое взвешенное

П-произведение

Применяем для интегрального сравнения объектов

Среднее квадратическое (К=2):

простое взвешенное

Для исчисления среднего квадратического отклонения.

Среднее кубическое (К=3):

простое взвешенное

Правило мажорантности средних:

(Хгарм<Xгеом<Харифм<Хквадр<Хкуб)

6. Ряды распределения

В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают:

Атрибутивный ряд распределения- качественный признак

Вариационный - количественныйу признак.

Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями.

Вариационные ряды:

Ранжированный (если объектов не много)

Дискретный (если признак принимает небольшое число значений). В основу построения положены признаки с прерывными изменениями (дискретные признаки-кол-во детей в семье, число работников на предпр-ии,.Строится табл., где каждая строчка значения признака- кол-во единиц совокупности с данным значением признака.Табл.состоит из 2-х граф. В 1-ой-указ-ся конкретное значение признака, а во 2-ой-число единиц сов-ти с опред.значением признака.

Интервальный (если признак может принимать большое количество значений или эти значения могут быть дробными- объединяем значения признака в интервал). Если признак имеет непрерывное изменение (размер дохода, стаж работы). Групповая таблица имеет 2 графы. В 1-ой указ-ся значение признака в интервале «от-до»(вар-ты), во 2-ой-число единиц, входящих в интервал(частота).

Формула Стерджеса К=1+3,322lg n

i=R/K R=(xmax-xmin)

K – количество интервалов, n – кол-во единиц совокупности, i – величина интервала.

.Характеристики центра распределения

Средняя величина - обобщающая величина изучаемого признака совокупности, характеризующая типичный уровень совокупности.

Мода-величина признака, кот встречается в ряду распределения чаще всего.

Бимодальное распред.-распределение значений признака

Унимодальное-одна ярко выраженная мода

Если ряд ранжированный-переводим его в дискретный. Мода в дискретном ряду считается- считаем частоту по каждому признаку и выбираем наиболее часто встречаемый.

Медиана—значение, расположенное посередине ранжированного вариационного ряда.

Порядковый номер(ранг)= (n+1)/2

Соотношение среднего, моды и медианы:

Хср<Ме<Мо- левосторонняя асимметрия

Мо<Ме<Хср- правосторонняя

Мо=Ме=Хср- классическое нормальное распределении.

Характеристики структуры распределения

Мода-величина признака, кот встречается в ряду распределения чаще всего.

Бимодальное распред.-распределение значений признака

Унимодальное-одна ярко выраженная мода

Если ряд ранжированный-переводим его в дискретный. Мода в дискретном ряду считается- считаем частоту по каждому признаку и выбираем наиболее часто встречаемый.

Медиана—значение, расположенное посередине ранжированного вариационного ряда.

Порядковый номер(ранг)= (n+1)/2

Квантили - значения признака, которые делят совокупность на 4 равные по числу единиц части.

Квинтили, деление на 5 частей

Сикстили- деление на 6 частей

Децили- на 10

Перцентли -10

Нормальное распределение

теоретически гладкая гистограмма. Идеальный набор данных, в которых большинство чисел сконцентрировано в средней части диапазона значений.

Значения наблюдений не ограничены по своей величине.

  • диапазон ±1 S - 68,26% площади (значений).

  • диапазон ±2 S – 95,44% площади (значений).

  • диапазон ±3 S - 99,72% площади (значений).

Расстояние по горизонтальной оси, измеренное в единицах стандартного отклонения от среднего арифмет-го всегда даёт одинаковую площадь под кривой.

Показатели формы распределения:

Асимметрия.

Правосторонняя As > 0; Левосторонняя As < 0

Эксцесс.

Асимметрия НР=0 и Эксцесс=0

Более вытянутая вершина графика эксцесс >0, более пологий график эксцесс<0

Показатели изменчивости.

1.Размах - абсолютная разность между максимальным и минимальным значениями признака в изучаемой совокупности. R=Хmax-Хmin. Размах исп-ся для поиска ошибок в данных. Акцентируется внимание на экстремальных значениях.

2.Среднее линейное отклонение:

простая взвешенная

3.Среднее квадратическое отклонение = стандартное отклонение. Отражает типичное расстояние между средним значением и отдельными значениями набора данных (если знач.пост.,то изменчивость=0).

Показывает степень случайности в расположении отдельных значений относительно их среднего.

Простое и взвешенное стандартное отклонение.

для выборки

Простое Взвешенное

для ген. сов-ти

Простое Взвешенное

4.Дисперсия-квадрат ср.квадр.откл.

(квадрат среднего-среднее квадрата)

5.Коэф-ент осцилляции. к-т осцилляции (относительный размах вариации)

6.Коэф-нт вариации- мера относительного разброса случайной величины; показывает, какую долю среднего значения этой величины составляет ее средний разброс.

< 33% => совокупность однородная

Задача сглаживания эмпирического распределения

заключается в определении вероятности попадания случайной величины на заданный интервал. Вероятность того, что значение попадет в интервал = площади соответствующей области под кривой НормРасп.

Стандартизованная теоретическая кривая НР: (станд.откл.)

Таблица нормального распред-я = таблица Z значений

Правило определения вероятностей случайной величины наз-ся распределением вероятностей. Площадь в табл. НР – это вероятность.

Критерии согласия- критерии для проверки гипотезы о нормальности распределения или оценка близости эмпирических и теоретических частот.

1.Критерий согласия Пирсона, который можно представить как сумму отношений квадратов расхождений между f' и f к теоретическим частотам:

df=(r-1)*(c-1) Количество степеней свободы - количество значений в распределении, которые свободны для изменений.

Если χэмп2 < χкр0,012

Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения. λ= D/√n,

где D -максимальная разность накопленных теоретических f’ и экспериментальных f частот. Если λ<0,3 => P(λ)=1 => отклонения между теоретическим и эмпирическим нет

Критерий согласия В.И. Романовского

K – число степеней свободы

R < 3 => расхождение между теоретическим и эмпирическим – случайное

R > 3 => неслучайное, существенное

Критерий Ястремского.

r – число групп

lфакт < 3 => расхождение между теоретическим и эмпирическим – случайное

lфакт > 3 => неслучайное, существенное

Θ = 0,6 при числе групп< 20

Выбор вида распределения.

Нормальное распределение – непрерывные величины

Характеристики:

1.Среднее или ожидаемое значение дискретной случайной величины X:

2.Стандартное отклонение дискретной случайной величины X (риск, неопределенность ситуации)

Биномиальное распределение- если количество наступлений событий выражается как процент от общего количество возможностей.

Применение:

-В каждой из n попыток вероятность наступления события π одна и та же;

-Все попытки независимы друг от друга.

Примеры

Количество дефектных изделий среди 10 единиц выпущенной продукции;

Количество женщин, работающих в отделе со штатом 75 человек…

Распределение Пуассона -распределение дискретной величины, которое зависит только от ожидаемого среднего количества наступления событий

Применение: события происходят:

-Случайно

-Независимо

-Среднее число наступления события с ростом числа попыток не изменяется

Примеры

Количество заказов, которые фирма получит завтра;

Количество дефектов в произведенной продукции;

Экспоненциальное распределение- Непрерывное распределение с сильной асимметрией

Применение: события происходят:

-Случайно

-Независимо

-С постоянной частотой

Время ожидания между 2-мя последовательно наступающими событиями

Примеры

Длительность типичного телефонного разговора;

Время безотказной работы кинескопа

Характеристики основных видов распределения.

Нормальное распределение – непрерывные величины

Характеристики:

1.Среднее или ожидаемое значение дискретной случайной величины X:

2.Стандартное отклонение дискретной случайной величины X (риск, неопределенность ситуации)

Биномиальное распределение- если количество наступлений событий выражается как процент от общего количество возможностей.

Характеристики биномиального распределения:

-1.Количество наступлений события, X и Доля(процент), p=X/n

Среднее

Стандартное отклонение

X и Доля(процент), p=X/n

Среднее

Стандартное отклонение

Если для Бр нужно определить вероятность того, что вероятность события = α , то для НР надо считать вероятность попадания в интервал.

Распределение Пуассона -распределение дискретной величины, которое зависит только от ожидаемого среднего количества наступления событий

Характеристики:

1.стандартное отклонение = корень из среднего

2.вероятность того, что случайная величина Х со средним значением = α

Экспоненциальное распределение- Непрерывное распределение с сильной асимметрией

Характеристики:

1.Стандартное отклонение всегда равно среднему значению;

2. Вероятность того, что случайная величина X со средним значением μ принимает значения, меньшее α:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]