Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие по статистике.doc
Скачиваний:
48
Добавлен:
15.02.2016
Размер:
3.79 Mб
Скачать

3.4. Внутригрупповая и межгрупповая вариация признака

При составлении сложных таблиц, отражающих результаты статистического наблюдения, мы некоторую совокупность делим на подгруппы. Насколько справедливо такое деление? Позволяет ли такое деление выявить взаимосвязь между признаками? Мерой связи между причиной и следствием, т.е. между признаком и результатом является эмпирическое корреляционное соотношение. Порядок его определения рассмотрим на простейших примерах.

Пример 3. 5.

Сорт озимой пшеницы

Посевная площадь, га

% гибели посевов зимой

1. Одесская

600

10

2. Народная

400

20

Определить средний процент гибели озимой пшеницы и ее дисперсию.

Р е ш е н и е. 1.Средний процент гибели озимой пшеницы рассчитывается по простой средневзвешенной

.

2. Рассчитываем дисперсию гибели озимой пшеницы в каждой группе. Так как случайная величина может принимать только два значения (взошла или погибла), то дисперсия определяется по формулу ,

где

- вероятность того, что событие при одном испытании произошло;

- вероятность того, что событие при одном испытании не произошло;

n

- число независимых испытаний (в нашем случае n=1).

Дисперсия гибели в 1-й группе ,

во 2-й группе .

3. Определим внутригрупповуюдисперсию,как средневзвешенную

.

4. Определим межгрупповуюдисперсию гибели. В первой группе средние потери. во второй-. Средние по двум группам. Межгрупповая дисперсия гибели характеризует отклонение средних значений в каждой группе от среднего для всей совокупности, т.е.

5. Определим общую дисперсию, как сумму внутри групповой и межгрупповой дисперсий:

.

6. Определим эмпирическое корреляционное соотношение η, которое характеризует, какая часть колебания признака, является следствием изучаемого фактора

Вывод. Так как эмпирическое корреляционное соотношение далеко от единицы, то влияние рассматриваемого признака (разные сорта озимых) не велико и, как следствие этого, можно оба сорта объединить в одну группу «озимая пшеница».

Ответ. Средний процент гибели озимой пшеницы 14%, дисперсия .

Пример 3. 6.Исследуется влияние данного вида удобрений на урожайность культуры. Всего засеяно 125 участков, из них на 55 участках удобрение не вносили, а на 70 – вносили.

Обобщенные данные урожайности представлены в таблице.

х, ц/га

195

205

215

225

235

245

255

265

275

Всего

Всего ni

2

5

13

17

18

31

22

12

5

125

Из них А

2

5

12

15

10

7

3

1

-

55

В

-

-

1

2

8

24

19

11

5

70

где А – участки без удобрений, В – участки с удобрениями.

1. Используя общие данные, рассчитываем для всей совокупности:

–среднее значение урожайности:

–общую дисперсию:

2. Определяем те же данные раздельно в каждой подгруппе:

А) (без удобрений):

–среднее значение урожайности

;

– дисперсию

В) (cудобрениями):

–среднее значение урожайности:

;

–дисперсию:

3. Определяем внутригрупповуюдисперсию, как средневзвешенную.

4. Определяем межгрупповуюдисперсию. В первой группе средние значение урожайности. во второй-. Средние по двум группам. Межгрупповая дисперсия характеризует отклонение средних значений в каждой группе от среднего для всей совокупности, т.е.

Мерой изучаемого фактора, т.е. влияния удобрений, является межгрупповаядисперсия. Мерой неучтенных факторов являетсявнутригрупповая(средневзвешенная) дисперсия. Мерой вариации вследствие изучаемого признака является эмпирическое корреляционное отношение.

5. Определяем эмпирическое корреляционное отношение

.

Физический смысл: между причиной (удобрением) и следствием (урожайность) существует связь близкая к линейной. Чем ближе к единице, тем больше влияние фактора на результат, тем более обоснованно наше разделение на подгруппы.

Необходимо отметить, что . Действительно, 191+144=335, т.е. общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий. Следовательно, зная две дисперсии, можно найти третью.