Тема 7. Выборочное наблюдение
ЗАДАЧИ
№ 1. Для определения срока службы металлорежущих станков было проведено 10%-ное выборочное обследование по методу случайного бесповоротного отбора, в результате которого получены следующие данные:
Срок службы станков, лет |
Число станков, шт. | ||||
вариант 1-й |
вариант 2-й |
вариант 3-й |
вариант 4-й |
вариант 5-й | |
До 4 |
11 |
6 |
18 |
15 |
12 |
4-6 |
24 |
23 |
36 |
32 |
26 |
6-8 |
35 |
38 |
26 |
27 |
39 |
8-10 |
25 |
26 |
11 |
18 |
21 |
Свыше 10 |
5 |
7 |
9 |
8 |
2 |
Итого |
100 |
100 |
100 |
100 |
100 |
Определите для каждого варианта: 1) с вероятностью 0,997 предельную ошибку выборки и пределы, в которых ожидается средний срок службы металлорежущих станков; 2) с вероятностью 0,954 предельную ошибку репрезентативности для доли и пределы удельного веса станков со сроком службы свыше 8 лет.
Ответ: для варианта 1: 1) ∆х = 0,6 лет; 2) ∆ω = 9,0%.
№ 2. С целью изучения выполнения норм выработки 5000 рабочими машиностроительного завода было отобрано в случайном порядке 1000 рабочих. Из числа обследованных 80% рабочих выполняют норму выработки на 100 % и выше. Определите с вероятностью 0,997 ошибку выборки и возможные пределы доли рабочих завода, выполняющих и перевыполняющих норму выработки.
Ответ: ∆ω = 3,4%.
№ 3. По данным 2%-ного выборочного обследования (n=100) средняя урожайность зерновых культур равна 32 ц/га при дисперсии, равной 6,15. определите ошибку выборки и возможные пределы средней урожайности зерновых культур со всей посевной площади с вероятностью: а) 0,954; б) 0,997.
Ответ: а) ∆х = 0,5ц/га.
№ 4. Принимая распределение металлорежущих станков по сроку службы, приведенное в задаче № 1, за результаты ранее проведенного выборочного наблюдения, рассчитайте для каждого варианта, какое число станков следует подвергнуть наблюдению при условии, что: а) предельная ошибка выборки при определении среднего срока службы была бы не более одного года при вероятности 0,997; б) то же при вероятности 0,954; в) предельная ошибка доли станков со сроком службы свыше 8 лет была бы не более 5% с вероятностью 0,954; в) предельная ошибка доли станков со сроком службы свыше 8 лет была бы не более 5% с вероятностью 0,954; г) с той же вероятностью (0,954) предельная ошибка доли не должна превышать 3%.
Ответ: а) n = 39 станков.
№ 5. С целью определения среднего стажа работы рабочих завода произведена 20%-ная типическая пропорциональная выборка ( внутри групп применялся метод случайного бесповторного отбора). Результаты обследования характеризуются следующими данными:
Группы рабочих по полу |
Группы рабочих по стажу, лет | |||||
До 5 |
5-10 |
10-15 |
15-20 |
20 и выше |
Итого | |
Мужчины |
10 |
20 |
50 |
30 |
15 |
125 |
Женщины |
15 |
18 |
27 |
10 |
5 |
75 |
И т о г о |
25 |
38 |
77 |
40 |
20 |
200 |
Определите с вероятностью 0,954 ошибку выборки и пределы, в которых будет находиться: а) средний стаж работы всех рабочих; б) удельный вес рабочих со стажем до 5 лет.
Ответ: а) ∆х = 0,7года: б) ∆ω = 4,1%.
№ 6. Для оценки средней урожайности пшеницы посевную площадь совхоза в 5000 га разделили на 50 равных участков. Из них по методу случайной бесповторной выборки отобрали пять участков, где произвели сплошной учет фактического урожая. В результате получены следующие данные:
|
№ участков | ||||
1 |
2 |
3 |
4 |
5 | |
Средняя урожайность, ц/га |
26 |
27 |
28 |
29 |
30 |
Погибшие посевы, % |
3,0 |
2,5 |
2,0 |
1,5 |
1,0 |
Определите: 1) с вероятностью 0,997 предельную ошибку выборочной средней и границы, в которых будет находиться средняя урожайность пшеницы.
Ответ: 1) ∆х = 0,8ц/га; 2) ∆n = 0,6%.
№ 7. Партия готовых деталей упакована в 500 ящиков по пять штук в каждом. Для определения средней массы деталей обследовано пять ящиков. Результаты проверки показали, что средняя масса обследуемых деталей составляет 2 кг, межсерийная дисперсия равна 0,025. определите с вероятностью 0,954 ошибку выборки и пределы, в которых будет находиться средняя масса деталей, поступивших на склад.
Ответ: ∆х = 0,14 кг.
№ 8. Из партия готовых продукции в 1000 шт. в случайном бесповторном порядке обследовано 100 шт., из которых продукция со Знаком качества составила 85%. Определите вероятность того, что допущенная при выборочном обследовании погрешность в оценке среднего процента продукции со Знаком качества не превысит: а) 5%; б) 10%.
Ответ: а) t = 1,47; б) t = 2,94.
№ 9. В результате исследования 20 проб молока, поступившего из колхоза на молокозавод, определили, что средняя жирность молока 3,6% при среднеквадратическом отклонении 0,5%. Какова вероятность того, что возможная ошибка средней жирности поступившего молока не более 0,3%?
Ответ: t = 2,68.
№ 10. В порядке 5%-ной серийно-гнездовой выборки обследовано пять сберегательных касс одного из городов. Результаты обследования показали, что средний размер вклада составляет 2000 руб., доля рабочих в общей численности вкладчиков обследованных сберегательных касс равна 60%, межсерийные дисперсии: а) для средней – 13155; б) для доли – 0,0025.
Определите, с какой вероятностью можно гарантировать: а) предельную ошибку среднего вклада во всех сберкассах города, не превышающую 100 руб.; б) предельную ошибку доли рабочих в общей численности вкладчиков, равную 6%.
Ответ: а) t = 2,0; б) t = 3,08.
.
РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ
№ 1. Для изучения оснащения заводов основными производственными фондами было проведено 10%-ное выборочное обследование, в результате которого получены следующие данные о распределении заводов по стоимости основных производственных фондов:
Среднегодовая стоимость основных производст-венных фондов, млн. руб. |
До 2 |
2-4 |
4-6 |
Свыше 6 |
Итого |
Число заводов |
5 |
12 |
23 |
10 |
50 |
Требуется определить: 1) с вероятностью 0,997 предельную ошибку выборочной средней и границы, в которых будет находиться среднегодовая стоимость основных производственных фондов всех заводов, генеральной совокупности; 2) с вероятностью 0,954 предельную ошибку выборки при определении доли и границы, в которых будет находиться удельный вес заводов со стоимостью основных производственных фондов свыше 4 млн. руб.
Решение. Предельная ошибка выборки (ошибка репрезентативности) исчисляется по формуле:,
где μ - средняя ошибка репрезентативности;
t – коэффициент кратности ошибки, показывающий, сколько средних ошибок содержится в предельной ошибке.
Пределы возможной ошибки (∆) определяются с вероятностью. Значение t найдем по таблице интеграла вероятностей.
Для Соответствует
вероятность
t = 1……………………………………………. Р = 0,683;
t = 2……………………………………………. Р = 0,954;
t = 3……………………………………………..Р = 0,997 и т.д.
Конкретное количественное выражение предельная ошибка принимает после определения средней ошибки выборки. Для нахождения ошибки репрезентативности собственно случайной и механической выборок имеются нижеследующие формулы.
Повторная выборка при определении:
среднего размера
ошибки признака ; (1)
средней ошибки доли
признака (2)
Бесповторная выборка при определении:
среднего размера
ошибки признака (3)
средней ошибки доли
признака (4)
N - численность генеральной совокупности;
n - численность выборочной совокупности;
-дисперсия варьирующего (осредняемого) признака в
выборочной совокупности;
- доля данного признака в выборке;
- доля противоположного признака в выборке.
1. Для определения границ генеральной средней необходимо исчислить среднюю выборочную и дисперсию, техника расчета которых приведена в таблице:
Среднегодовая стоимость основных производственных фондов, млн. руб., х |
Число заводов, f |
Середина интервала x |
xf |
x- | ||
До 2,0 |
5 |
1 |
5 |
-3,52 |
12,39 |
61,95 |
2,0-4,0 |
12 |
3 |
36 |
-1,52 |
2,31 |
27,72 |
4,0-6,0 |
23 |
5 |
115 |
0,48 |
0,23 |
5,29 |
Свыше 6,0 |
10 |
7 |
70 |
2,48 |
6,15 |
61,50 |
|
50 |
|
226 |
|
|
156,46 |
Тогда
млн. руб.;
==3,13.
Для упрощения расчетов средней и дисперсии можно использовать способ моментов. Техника расчетов ипо способу моментов изложена в первой части брошюры «Практикум по общей теории статистики» (М.6 изд. ВЗФЭИ, 1989).
Итак, имеются данные: N = 500, N = 50 заводов; = 3,13.
Средняя ошибка выборки при определении среднегодовой стоимости основных фондов составит:
а) при повторном отборе (по формуле 1) –
млн. руб.;
б) при бесповторном отборе (по формуле 3) –
млн.руб.
Следовательно, при определении среднегодовой стоимости основных производственных фондов в среднем мы могли допустить среднюю ошибку репрезентативности в 0,25 млн. руб. при повторном и 0,24 млн. руб. при бесповторном отборе в ту или иную сторону от среднегодовой стоимости основных производственных фондов приходящейся на один завод в выборочной совокупности. Исчисленные данные показывают, что при бесповторной выборке средняя ошибка репрезентативности (0,24) меньше, чем при тех же условиях при повторном отборе (0,25).
В нашем примере Р = 0,997, следовательно, t = 3.
Исчислим предельную ошибку выборочной средней (∆х):
∆х = ± 3μ ; т.е. ∆х = ± 3 · 0,25 = ±0,75 млн. руб.(при повторном отборе); ∆х = ± 3 · 0,24 = ±0,72 млн. руб.(при бесповторном отборе).
Порядок установления пределов, в которых находится средняя величина изучаемого показателя в генеральной совокупности в общем виде, может быть представлен следующим образом:
;
Для нашего примера среднегодовая стоимость основных производственных фондов в среднем на один завод генеральной совокупности будет находиться в следующих пределах:
а) при повторном отборе - или 4,27 млн.руб. ≤ ≤ 4,77 млн. руб.;
б) при бесповторном отборе - или 4,28 млн.руб. ≤ ≤ 4,76 млн. руб.;
Эти границы можно гарантировать с вероятностью 0,997.
2. Вычисление пределов при установлении доли осуществляется аналогично нахождению пределов для средней величины. В общем виде расчет можно представить следующим образом :
;
где р – доля единиц, обладающих данным признаком в генеральной совокупности.
Доля заводов в выборочной совокупности со стоимостью основных производственных фондов свыше 4 млн. руб. составляет:
, или 66%.
Определяем предельную ошибку для доли. По условию задачи известно, что N = 500; n = 50; ω = 0,66; P = 0,95; t = 2.
Исчислим предельную ошибку доли:
при повторном отборе (по формуле 2) –
, или 13,4%;
при бесповторном отборе (по формуле 4) -
, или 12,7%.
Следовательно, с вероятностью 0,954 доля заводов со стоимостью основных производственных фондов свыше 4 млн. руб. в генеральной совокупности будет находиться в пределах:
или 52,6% ≤ р ≤ 79,4% при повторном отборе;
или 53,3% ≤ р ≤ 78,7% при бесповторном отборе.
Расчеты убеждают в том, что при бесповторном отборе ошибка выборки меньше, чем при тех же условиях при повторной выборке.
№ 2. Используя данные предыдущей задачи, требуется ответить, каким должен быть объем выборочной совокупности при условии, что: 1) предельная ошибка выборки при определении среднегодовой стоимости основных производственных фондов (с вероятностью 0,997) была бы не более 0,5 млн. руб.; 2) то же при вероятности 0,954; 3) предельная ошибка доли (с вероятностью 0,954) была бы не более 15%.
Решение. Для нахождения численности случайной и механической выборок имеются следующие четыре формулы:
Повторный отбор Бесповторный отбор
при определении
среднего размера ; (5) (6)
ошибки признака
при определении
ошибки доли признака ; (7)(8)
1) Известно, что N = 500; млн. руб.;;Р = 0,997; t = 3.
Найдем объем выборки для расчета ошибки средней: при повторном отборе (по формуле 5) –
заводов;
при бесповторном отборе (по формуле 6) –
завода;
2) Известно, что N = 500; млн. руб.;;Р = 0,954; t = 2.
Определим объем выборки при бесповторном отборе (по формуле 6):
заводов.
3) известно, что N = 500; млн. руб.;;Р = 0,954;
t = 2.
Объем выборки для расчета ошибки доли будет:
при повторном отборе (по формуле 7) –
заводов;
при бесповторном отборе (по формуле 8) -
заводов;
В ы в о д ы: 1) численность выборки увеличится, если при прочих равных условиях уменьшить предельную ошибку; 2) численность выборки уменьшится, если при прочих равных условиях уменьшить вероятность, с которой требуется гарантировать результат выборочного обследования; 3) численность выборки уменьшится, если при прочих равных условиях уменьшить вероятность, с которой требуется гарантировать результат выборочного обследования; 3) численность выборки уменьшится, если при прочих равных условиях увеличить предельную ошибку.
№ 3. На заводе 1000 рабочих вырабатывают одноименную продукцию. Из них со стажем работы до пяти лет трудятся 400 чел., а более пяти лет – 600 чел. Для изучения среднегодовой выработки и установления доли квалифицированных рабочих проведена 10%-ная типическая выработка с отбором единиц пропорционально численности рабочих по указанным группам (внутри групп применялся случайный метод отбора).
На основе обследования получены следующие данные:
Группа рабочих со стажем работы |
Общая числен-ность рабочих чел., N |
Число обследованных рабочих чел., n |
Средне- дневная выра-ботка, шт., |
Дисперсия выра-ботки, число |
Число квалифицированных рабочихв выборке, чел., |
Доля квалифицированных рабочих, |
До 5 лет (включительно) |
400 |
40 |
25 |
81 |
32 |
0,8 |
Свыше 5 лет |
600 |
60 |
30 |
64 |
54 |
0,9 |
И т о г о |
1000 |
100 |
|
|
|
|
Определим: 1) с вероятностью 0,954 предельную ошибку выборки и границы в которых будут находиться среднедневная выработка всех рабочих завода; 2) с той же вероятностью пределы удельного веса квалифицированных рабочих в общей численности рабочих завода.
Решение. 1) Средняя ошибка типической выборки определяется по формуле:
; (9)
где - средняя из внутригрупповых дисперсий.
Она исчисляется по формуле:
;
Тогда =.
Определим среднюю ошибку выборки при бесповторном отборе (по формуле 9):
шт.
Технику расчета предельной ошибки при типической выборке аналогична вышеизложенному расчету предельной ошибки при случайном отборе:
или ;
Подставив данные, получим: шт.
Для определения возможных пределов среднедневной выработки всех рабочих завода первоначально нужно исчислить среднедневную выработку в выборочной совокупности по средней арифметической взвешенной:
шт.
пределы среднедневной выработки всех рабочих завода: шт.
С вероятностью 0,954 можно утверждать, что среднедневная выработка всех рабочих завода находится в пределах 26,4 шт.шт.
2) Средняя ошибка репрезентативности для доли исчисляется по формуле:
(10)
где - дисперсия долиявляется средней из внутригрупповых дисперсий.
Эта величина исчисляется по формуле:
=
Технику расчета покажем в таблице:
Группы рабочих со стажем работы |
Числен-ность рабочих, чел., |
Доля квалифици-рованных рабочих, |
Доля малоква-лифици-рованных рабочих, |
Дисперсия доли |
Взвешен-ный пока-затель дисперсии, |
До 5 лет |
40 |
0,8 |
0,2 |
0,16 |
6,4 |
Свыше 5 лет |
60 |
0,9 |
0,1 |
0,09 |
5,4 |
И т о г о |
100 |
|
|
|
11,8 |
Тогда =.
Определим среднюю ошибку репрезентативности для доли ( по формуле 10):
или .
Исчислим предельную ошибку выборочной доли с вероятностью 0,954:
или 6,4%.
Расчет предела при установлении доли в общем виде представляется следующим образом:
.
Определим среднюю долю для выборочной совокупности:
, или 86%.
Отсюда: .
Вывод: с вероятностью 0б954 можно утверждать, что доля квалифицированных рабочих на заводе будет находиться в пределах 79,6% .
№ 4. С целью определения среднего эксплуатационного пробега 10000 шин легковых автомобилей, распределенных на партии по 100 шт., проводится серийная 4%-ная бесповторная выборка. Результаты испытания отобранных шин характеризуются следующими данными:
Показатели |
Партии | |||
1 |
2 |
3 |
4 | |
Средний эксплуатационный пробег шин, тыс. км |
40 |
42 |
45 |
48 |
Доля шин с пробегом не менее 42 тыс. км. |
0,80 |
0,85 |
0,90 |
0,95 |
О п р е д е л и т е: 1) средние ошибки репрезентативности:
а) эксплуатационного пробега шин; б) удельного веса шин с пробегом не менее 42 тыс. км; 2) с вероятностью 0,954 пределы, в которых будет находиться: а) средний эксплуатационный пробег всех обследуемых шин; б) доля шин, пробег которых не менее 42 тыс. км в генеральной совокупности.
Решение. 1) При бесповторном отборе серий средняя ошибка репрезентативности определяется по формулам:
для средней –
; (11)
для доли –
, (12)
где R - число серий в генеральной совокупности;
r - число отобранных серий;
- межсерийная дисперсия средних;
- межсерийная дисперсия доли.
Сначала исчислим обобщающие показатели.
Средний эксплуатационный пробег шин:
тыс. км.
Средний удельный вес шин с пробегом не менее 42 тыс.км равен:
(или 87,5%)
для средней –
;
для доли –
Для ее расчета построим вспомогательную расчетную таблицу:
№ партии |
Средний пробег шин, тыс. км, |
Доля шин с пробегом не менее 42 тыс. км, | ||||
1 |
40 |
-3,75 |
14,06 |
0,8 |
-0,075 |
0,005625 |
2 |
42 |
-1,76 |
3,06 |
0,85 |
-0,025 |
0,000625 |
3 |
45 |
1,25 |
1,56 |
0,90 |
0,025 |
0,000625 |
4 |
48 |
4,25 |
18,06 |
0,95 |
0,075 |
0,005625 |
И т о г о |
|
|
36,74 |
|
|
0,012500 |
Тогда
; .
Определим средние ошибки репрезентативности: для средней (по формуле 11) –
тыс. км;
для доли (по формуле 12) –
, или .
2) определим с вероятностью 0,954 предельные ошибки репрезентативности для средней и для доли:
тыс. км;
%
Отсюда средний эксплуатационный пробег всех обследуемых шин будет находиться в пределах:
, или 40,75 тыс. км 46,75 тыс. км.
Средний удельный вес шин с пробегом не менее 42 тыс. км в генеральной совокупности будет находиться в пределах:
, или 82,0% 93,0 %.
№ 5. Используя условие и решение предыдущей задачи, определите вероятность того, что: а) предельная ошибка выборки при установлении среднего эксплуатационного пробега шин не превышает 4,0 тыс. км; б) доля шин с пробегом не менее 42 тыс. км будет находиться в пределах от 83% до 92%.
Решение. При определении вероятности используется формула предельной ошибки:
.
В нашем примере следует использовать формулу предельной ошибки серийного отбора.
а) Дано: ;;тыс. км;=9,185;
тыс. км.
Требуется определить вероятность того, что разница средних величин эксплуатационного пробега шин в выборочной генеральной совокупности не превысит тыс. км, т.е.
тыс.км.
Подставляем данные в формулу:
;
По таблице значений вероятностей находим, что при t = 2,67 вероятность будет 0,992.
Следовательно, с вероятностью 0,992 можно гарантировать, что средний эксплуатационный пробег шин легковых автомобилей в генеральной совокупности будет находиться в пределах 39,75 тыс. км тыс. км;
б) Дано: ; ; ;= 0,003125;%.
Требуется определить:, т.е. вероятность того, что доля шин с пробегом не менее 42 тыс. км в выборочной совокупности не будет отклоняться от доли генеральной совокупности более чем на 4,5%.
Подставив данные в формулу
(см. решение на с.54 ), получим 4,5% =;
тогда Р = 0,899.
Следовательно, вероятность того, что удельный вес шин с пробегом не менее 42 тыс. км будет находиться в пределах от 83% до 92%, равна 0,899.