Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции. Статистика.docx
Скачиваний:
4
Добавлен:
30.07.2019
Размер:
118.88 Кб
Скачать

Рассмотри аналогичные показателя для сгруппированных данных.

Задание оценить типичность показателя для данных в таблице.

Время ожидания транспорта на остановке

F –частота

0-5

6

5-10

10

10-15

12

  1. Рассчитаем среднее взвешенное = (2,5*6+7,5*10+12,5*12)/28=9м.

  2. Рассчитаем дисперсию, так как данные сгруппированы в интервалы будем использовать взвешенную дисперсию S2=((2,5-9)2*6+(7,5-9)2*10+(12,5-9)2*12)/ 28=15,1.

  3. Рассчитаем стандартное или среднеквадратичное отклонение S=корень из S2=корень из15,1=3,9.

В среднем ожидание транспорта на остановке составляет 9 минут, но в каждом отдельном случае оно может быть больше или меньше в среднем на 4 минуты.

  1. Оценить типичность среднего показателя Vs= (4/9)*100=44% - разброс большой, среднее не типично для данной совокупности.

Иногда считают абсолютный показатель разброса(размах вариации) R=max-min.

Показатели вариации для альтернативного признака:

Альтернативный признак- это признак, который может принимать только 2 значения.

Альтернативные вариации никак не интерпретируются используются только в дальнейших видов анализа. Рассчитывается дисперсия 2Sw=p*q. (р-доля едениц, q-доля признаков).

Из 200 обследованных семей в регионе 30 оказалось раков в догонку.

2Sw=30/200*(1-30/200)=0,13

S=корень из 0,13=0,36.

Оценка параметров генеральной совокупности.

Понятие оценки связано с проверкой гипотезы о возможности переноса результата с выборочной совокупности на генеральную совокупности.

Если выборка, которую изучает является случайной и репрезентативной, то результаты можно переносить на генеральную совокупность соблюдая определённые правила.

Случайность формирования выборки означает что у каждого элемента генеральной совокупности есть равные шансы попасть в выборку.

Существует два способа оценки точечное и интервальное оценивание.

Точечное оценивание означает, что результат переносится на генеральную совокупность в виде одного числа.

Было доказано, что среднее в генеральной совокупности можно оценить по выборочной средней без каких-либо корректировок т.е. М(х)=хсреднее.

Например: если в случайно или репрезентативной выборке студентов УрФУ было посчитано, что время ожидания транспорта = 9 мин, тогда следование логики точечного оценивая можно сказать, что для всех студентов УрФУ будет характера эта закономерность 9 минут.

Было доказано, что генеральную дисперсию нельзя оценить по выборочной дисперсии без корректировок.

Д(х)не равна S2, чтобы оценить Д(х) нужно рассчитать исправленную выборочную дисперсию Д(х)=S2исправленная.

S2исправленная= (N/N-1)*S2=(28/27)*15,1=15,66. Корень из 15,66=3,96

Как правило исправленная дисперсия мало отличается от обычной, при объёме выборке больше 30, поэтому на практике при n больше 30 корректировку не проводят.

Было доказано, что выборочная доля равна генеральной доле.

Р=W.

ДЗ, по тем же данным, оценить типичность среднего уровня дохода. Расчёт по сгруппированным данным.

Интервальное оценивание.

Интервальное оценивание означает, что результаты полученные на выборке переносятся на генеральную совокупность в виде интервала возможных значений. Этот интервал называется доверительным и задаётся следующим образом. Хср. - дельта Больше или равенМ(х)меньше или равен Х-ср.+дельта. Истинное значение среднего показателя гениальной совокупности находятся в интервале от Хср. – предельная ошибка выборки до Хср.+ предельная ошибка выборки.

Предельная ошибка выборки(Дельта) = t*(корень S2/n ). S – дисперсия выборки, n – объём выборки t- аргумент функции лапласа (находим по таблице).

Пример:

Пусть по выборке работников предприятия объёмом 100 человек было определено, что средние потери рабочего времени в течении дня составляют 12 минут. Определить величину эти потерь в целом, для всего предприятия. (среднеквадратичное отклонение = 1).

Хср.=12

N=100

S=1

tЗависит от уровня надёжности, а надёжность задаёт сам исследователь - t(гамма=95%)=1,96

Дельта = 1,96*(корень 1/100)=0,196=0,2

11,8Больше или равно М(х)меньше или равно12,2.

C вероятностью 95% потеря рабочего времени для каждого работника предприятия будут находиться в интервале от 11,8 до 12,2 минут.