- •2. Базовые понятия статистики
- •2.1. Генеральная совокупность и выборка
- •2.2. Способы представления и обработки статистических данных
- •2.3. Вычисление выборочных характеристик
- •Вопросы для самопроверки
- •Упражнения и задачи
- •3. Статистические выводы: оценки и проверка гипотез
- •3.1. Точечные оценки и их свойства
- •3.2. Свойства выборочных оценок
- •3.3. Интервальные оценки
- •3.3.1. Доверительный интервал для математического ожидания нормальной св при известной дисперсии
- •3.3.2. Доверительный интервал для математического ожидания нормальной св при неизвестной дисперсии
- •3.3.3. Доверительный интервал для дисперсии нормальной св
- •3.4. Статистическая проверка гипотез
- •3.4.1. Основные понятия
- •3.4.2. Критерии проверки. Критическая область
- •3.5. Примеры проверки гипотез
- •3.5.1. Проверка гипотезы о математическом ожидании нормальной св при известной дисперсии
- •3.5.2.Проверка гипотезы о математическом ожидании нормальной св при неизвестной дисперсии.
- •3.5.3. Проверка гипотезы о величине дисперсии нормальной св
- •3.5.4Проверка гипотезы о равенстве математических ожиданий двух нормальных св при известных дисперсиях
- •3.5.5.Проверка гипотезы о равенстве математических ожиданий двух нормальных св при неизвестных дисперсиях
- •3.5.6. Проверка гипотезы о равенстве дисперсий двух нормальных св
- •3.5.7. Проверка гипотезы о значимости коэффициента корреляции
- •Вопросы для самопроверки
- •Упражнения и задачи
- •4. Парная линейная регрессия
- •4.1. Взаимосвязи экономических переменных
- •4.2. Суть регрессионного анализа
- •4.3. Парная линейная регрессия
- •4.4. Метод наименьших квадратов
- •Вопросы для самопроверки
Упражнения и задачи
1.Приведена статистика по годовым темпам (%) инфляции в стране за последние 10 лет: 2,8; 3,2; 5,1; 1,8; -0,6; 0,7; 2,1; 2,7; 4,1; 3,5. Необходимо найти несмещенные оценки среднего темпа инфляции, дисперсии и среднего квадратического отклонения.
2.Оценивается годовой доход (X, тыс.$) на душу населения в некотором городе. Случайная выборка из 16 обследованных че-
ловек дала следующие результаты: 8,5; 10,5; 12,25; 7,0; 17,0; 8,75; 10,0; 9,3; 8,0; 11,5; 10,0; 12,0; 9,0; 6,5; 13,0; 10,2. Оцените среднедушевой доход в городе и разброс в доходах. Будут ли такими же значения для всего города?
3.Предполагается, что месячный доход граждан страны имеет нор- мальное распределение с математическим ожиданием т = 1000$ и дисперсией = 40 000($)2. По выборке из 500 человек определили выборочный средний доход х = 900$.
а) Постройте 90 и 95%-е доверительные интервалы для средне- душевого дохода в стране.
б) Следует ли на основании построенных доверительных интерва- лов отклонить предположение об ежемесячном доходе в 1000$?
в) Как проверить то же предположение на основании общей схемы проверки гипотез? Какую альтернативную гипотезу вы выбрали и почему?
4.Для изучения влияния двухнедельной диеты и соответствующего комплекса упражнений на изменение веса спортивный клуб про- вел анализ по двум выборкам из 7 человек до и после диеты и упражнений. Отбор осуществлялся случайным образом по член- ским карточкам. Получены следующие результаты (буквы — ини- циалы испытуемого, цифры — вес, кг):
I выборка: АГ 85,5; ВТ 92,7; ДИ 79; КД 68,6; КЛ 102,5; МА 88,3; ТВ 82,7.
II выборка: БП 90,5; ДИ 77,5; ИВ 85,3; КР 72,5; ЛМ 108,7; МТ 80,3; ЯК 79.
а) Определите 95%-е доверительные интервалы для: 1) среднего веса до диеты; 2) среднего веса после диеты; 3) среднего изменения веса за время диеты.
б) Можно ли по имеющимся данным достаточно объективно оценить результаты диеты и упражнений? Обоснуйте свой ответ.
в) Для того же анализа в повторную выборку отобрали тех же людей, что и в первую выборку, и получили следующие данные:
АГ 83; ВТ 90,5; ДИ 77,5; КД 68; КЛ 94,5; МА 85; ТВ 80,5.
По этим данным постройте 95% -й доверительный интервал для
потери веса.
г) Есть ли основания не доверять рекламному проспекту клуба, обещающему потерю веса в 3 кг?
5.Станок-автомат заполняет пакеты чипсами по 250 г. Считается, что станок требует подналадки, если стандартное отклонение от номинального веса превышает 5 г. Контрольное взвешивание 10 пакетов дало следующие результаты: 245, 248, 250, 250, 252, 256, 243, 251, 244, 253.
а) Постройте 95 и 99% -е доверительные интервалы для стандартного отклонения от номинального веса.
б) Можно ли по этим интервалам судить о необходимости под- наладки станка? Как ответить на этот вопрос на основе использования статистической проверки гипотез?
6.Расход (X) бензина автомобилей некоторой фирмы имеет нормальный закон распределения с тх = 7,5 л и = 0,5 л. Выпустив новую модификацию автомобиля, фирма утверждает, что у него средний расход ту топлива снижен до 7 л при том же значении σ. Выборки из 15 автомобилей каждой модели дали следующие средние расходы: = 7,45; = 7,15. Можно ли по этим данным доверять рекламе фирмы?
7.Два университета (А и В) готовят специалистов аналогичных специальностей. Министерство образования решило проверить качество подготовки в обоих университетах, организовав для этого объемный тестовый экзамен для студентов пятого курса. Отобранные случайным образом студенты показали следующие суммы баллов:
А: 41, 50, 35, 45, 53, 30, 57, 20, 50, 44, 36, 48, 55, 28, 40, 50. В: 40, 57, 52, 38, 25,47, 52,48, 55,48, 53, 39, 46, 51,45, 55, 43, 51, 55, 40.
а) Каковы точечные оценки средних баллов и дисперсий результа- тов для обоих университетов?
б) Можно ли утверждать при уровне значимости α= 0,05, что один из университетов обеспечивает лучшую подготовку? Какие тесты целесообразно использовать для такого рода анализа?
в) Сравните разброс в знаниях студентов этих университетов.
г) Были бы выводы такими же при уровне значимости а = 0,01?
8.На основании наблюдений за работой 25 кандидатов на должность секретаря-референта установлено, что в среднем они тратили 7 ми- нут на набор одной страницы сложного текста на компьютере при выборочном стандартном отклонении S = 2 минуты. При предпо- ложении, что время (X) набора текста имеет нормальный закон распределения:
а) Определите 90 и 99% -е доверительные интервалы для математи- ческого ожидания тх и среднего квадратического отклонения .
б) Оцените количество претендентов на работу, которые набрали текст быстрее, чем за 5 минут.
в) Предполагалось, что среднее время набора страницы текста должно составить 5,5 минуты. Не противоречат ли полученные данные этой гипотезе?
9.Предполагается, что месячная зарплата сотрудников фирмы сос- тавляет 1000$ при стандартном отклонении σ= 100$. Выборка из 36 человек дала следующие результаты: = 900$ и S = 150$.
Можно ли по результатам проведенных наблюдений утверждать, что средняя зарплата сотрудников фирмы меньше рекламируемой, а разброс в зарплатах больше? Какие критические области вы в этом случае использовали?
10.Расход бензина по паспортным данным автомобиля должен составлять 10 л на 100 км. На новую модель автомобиля устанавливается модернизированный двигатель, обеспечивающий расход в 9 л на 100 км. Данное утверждение считается неверным, если х > 9,4. Найти вероятности ошибок первого и второго рода, если решение принимается по выборке объема п = 25.
11.Обследование 25 человек показало, что их средний доход составил 1200$ при среднем отклонении S = 120$. Полагая, что доход имеет нормальный закон распределения, определите:
а) 90%-е интервальные оценки для математического ожидания m и среднего квадратического отклонения σ.
б) С какой вероятностью можно утверждать, что абсолютное значе- ние ошибки оценивания т не превзойдет 50$?
в) Каким должно быть количество обследованных, чтобы абсо- лютное значение ошибки оценивания т не превзошло 50$ с ве- роятностью 0,9?
12.Клиенты банка в среднем снимают со своего счета 100$ при среднем квадратическом отклонении σ= 50$. Если выплаты отдельным клиентам независимы, то сколько денег должно быть зарезервировано в банке на выплаты клиентам, чтобы их хватило на 100 человек с вероятностью 0,95? Каков будет при этом остаток денег, гарантированный с той же надежностью, если для выплат зарезервировано 16 000$?
13.При анализе зависимости между двумя показателями X и Y по 25 наблюдениям получены следующие данные:
Оцените наличие линейной зависимости между X и Y. Будет ли коэффициент корреляции статистически значимым?
14.Проверьте значимость коэффициента корреляции по следующим данным:
а) при альтернативной гипотезе
б) при альтернативной гипотезе
в) при альтернативной гипотезе
15.Исследуется зависимость между количеством (N) покупателей в ювелирном магазине и количеством (Q) проданных товаров. За 10 дней наблюдений получены следующие данные:
N |
50 |
61 |
72 |
43 |
60 |
65 |
76 |
55 |
62 |
40 |
Q |
10 |
12 |
20 |
9 |
15 |
15 |
21 |
14 |
18 |
.7 |
Оцените наличие и степень линейной зависимости между N и Q.
16.Пусть СВ X — ежемесячный доход (млн руб.) определенной группы населения. При этом X ~ N (т = 25, = 36). Производится случайная выборка из 25 представителей данной группы. Какова вероятность, что их средний доход лежит в интервале от 15 до 30 млн руб.?
17.Анализируется зависимость между доходом горожан (СВ X), имеющих индивидуальные домовладения, и рыночной стоимостью их домов (СВ У). По случайной выборке из 450 горожан данной категории получены следующие результаты:
Вычислите выборочные средние и стандартные отклонения для обоих показателей.
б)Можно ли было ожидать, что стандартные отклонения для рассматриваемых случайных величин приблизительно равны между собой? Проверьте это предположение при уровне значи- мости α= 0,05.
в)Постройте 95% -й доверительный интервал для средней стоимос- ти домов. Какое предположение вы сделали при этом?
г)Проверьте гипотезу о наличии сильной линейной зависимости между исследуемыми показателями (α= 0,01).