Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпоры мат методы 1-19.doc
Скачиваний:
14
Добавлен:
07.09.2019
Размер:
395.78 Кб
Скачать

15. Определение точности опыта, использование показателя

При исследованиях методического характера необходимо приводить их оценку по показателю точность опыта (р). Его смысл состоит в установлении величины ошибки среднего арифметического (mM) в процентах от величины среднего арифметического (М). Показатель точности опыта можно определить по одной из двух формул:

р = (mM / М100; р = V / , (1.15)

где V – коэффициент вариации.

Опыт считается достаточно точным, если р < 3 %, удовлетворительным – при его величине 3–5 % . Если величина точности опыта более 5 %, к полученным выводам следует относиться осторожно и увеличить число повторностей в опыте. Эти градации обязательны для полевых опытов с растениями. Некоторые приборы для анализа могут давать значительно большую погрешность (р до 15 %).

Ошибка показателя точности опыта вычисляется следующим образом:

mp = ± р

16. Этапы факторного анализа

На конкретном примере рассмотрим один из методов факторного анализа. На основе выборки по 395 ландшафтам в пределах водораздельного пространства была получена исходная информация о восьми параметрах агроландшафта. Они включают: 1) органические удобрения; 2) минеральные удобрения; 3) известь; 4) пестициды; 5) содержание гумуса в пахотном горизонте; 6) реакцию среды; 7) влажность почвы; 8) содержание физической глины. Следует определить, какова роль этих параметров в эволюции агроландшафтов.

Первый этап. Производится вычисление коэффициентов корреляции между всеми изучаемыми параметрами (табл. 7.1). Корреляционная матрица R симметрична, поэтому достаточно заполнить лишь ее половину до линии диагонали. Если параметр коррелирует сам с собой, коэффициент корреляции равен единице.

Второй этап. Для описания параметров используется линейная модель (параметры выражаются через скрытые гипотетические факторы линейно). Основная модель факторного анализа может быть записана в виде формулы:

zj = aj1F1 + aj2F2 + …+ ajmFm + djuji,

где zj – параметр, F1 – фактор; aji – приближение (коэффициент) фак­торного отображения (нагрузки).

Для выражения общей дисперсии определяется факторная дисперсия, или значение общности (σi2) для каждого диагонального параметра. Наиболее простой способ ее установления – вычисление первого центроидного фактора.

Подставив данные в формулу, имеем первую факторную дисперсию. Аналогично проводим расчет дисперсии по остальным столбцам таблицы. Полученные данные помещаем по главной диагонали редуцированной корреляционной матрицы Rх. Если рассчитанные коэффициенты корреляции мало отличаются от исходных, значит, модель хорошо описывает экспериментальные данные.

Третий этап. Проводим группировку параметров с целью определения факторов. Восемь параметров образуют две группы: первые четыре параметра характеризуют химическую мелиорацию почв (первый фактор), остальные – их плодородие (второй фактор).

Четвертый этап. Находим первое приближение факторного отображения. Предполагается, что полученные факторы не коррелируют между собой. Для каждой строки матрицы Rx вычисляем сумму коэффициентов корреляции. Результаты записываем в предпоследний столбец редуцированной корреляционной матрицы. Результаты вносим в последний столбец редуцированной корреляционной матрицы. Эти числа не применяются непосредственно в качестве элементов собственного вектора матрицы.

Пятый этап. Возводим редуцированную матрицу в квадрат. Для этого необходимо каждое число возвести в квадрат в первом столбце матрицы и суммировать результаты.

Получаем первый элемент матрицы R2. Поскольку квадрат симметричной матрицы есть также симметричная матрица, то вычисляем диагональные элементы и элементы выше (или ниже) диагонали. Затем определяем сумму элементов.

Шестой этап. Вычисляем коэффициенты при первом факторе. Далее рассчитываем коэффициенты bi1 при первом факторе F1 , которые учитывают максимально возможную долю суммарной общности.

Седьмой этап. Проводим поиск фактора, который учитывал бы максимум остаточной общности. Для этого после учета F1 необходимо построить матрицу R1 используя коэффициенты первого фактора.

После выполнения необходимых операций по первому фактору и получения соответствующих показателей (табл. 7.9) переходим к вычислению элементов матрицы по второму фактору, сводные сведения по которым приведены в табл. 7.10. В итоге получаем коэффициенты факторного отображения и общности, по которым делаем соответствующие выводы.

17. Графическое представление вариационного ряда. Деление выборки на классы.

Варианты в статистической совокупности подвергаются обработке. Для этого составляется вариационный ряд, т. е. варианты располагают по возрастающим или убывающим величинам. Варианты в выборке, относящиеся к одному и тому же признаку, практически не совпадают между собой, или варьируют. Те варианты, которые резко отличаются от вариантов статистической совокупности и вызывают сомнение у исследователя определяются как артефакт.

Существующие критерии выбраковки основываются, как правило, на допущении, что выборка распределяется по нормальному или близкому к нему закону. В качестве критерия выбраковки может быть использован критерий τ (прил. 3). Если критерий τ вычисленный (фактический) больше или равен критерию τ табличному (τф ≥ τт) при объеме выборки N и уровне значимости α (0,05 или 0,01), то соответствующие значения вариантов выборки (х) допустимо отбросить как артефакт. Значения τ для вызывающей сомнение величины вычисляются по следующим формулам:

τ1 = (х2х1) / (хn1 х1) (1.1)

для наименьшего значения переменной величины в вариационном ряду (х1);

τn = (хn – хn1) / (хn – х2) (1.2)

для максимального значения переменной в вариационном ряду.

Вычисленное значение критерия (τ5 = 0,958) сравнивают с табличным значением (τт), учитывая объем выборки (N = 5). В прил. 3 критическое значение критерия артефакта для N = 5 и уровня значимости α 0,05 и 0,01 соответственно будут равны 0,807 и 0,916, что меньше расчетного значения (τ5 = 0,958). Поэтому варианту 20,2 признают артефактом и исключают из статистической обработки как сомнительную. Затем приступают к вычислению показателей описательной статистики при условии, что тип распределения вариант соответствует нормальному или логнормальному закону распределения. В иных случаях с выборкой работают как с непараметрической, на которые теория вероятности не распространяется.

При установлении типа распределения принимается следующий порядок действий. Сначала определяется величина классового интервала i, которая зависит от принятого числа классов k и объема выборки N:

i = (хmaxxmin) / k. (1.3)

Число классов в зависимости от объема выборки определяется по формуле:

k = 1 + 3,3 lg N. (1.4)

Исходя из формулы (1.4), можно рекомендовать следующее число классов в зависимости от объема выборки:

N

30–50

51–10

101–400

401–1000

1001–2000

k

4–5

6–7

8–9

9–10

11–12

Величина классового интервала должна быть одинаковой на протяжении всего вариационного ряда. Границы классов выбираются такими, чтобы каждая варианта могла быть отнесена только к одному классу. Примеры правильной границы классов: 5–9, 10–14, 15–19 или 5,1–9,1, 9,2–13,2, 13,3–17,3, первый и последний классы могут быть неполными. Границы классов желательно выбирать так, чтобы крайние варианты ряда по возможности оказались ближе к середине интервала своего класса.

Исходя из величины классового интервала и минимального значения в выборке, за начало левой границы первого класса удобно принять величину 100. Прибавляя к 100 классовый интервал 10, получаем левые границы последующих классов: 110, 120, 130, 140, 150, 160, 170 мм. Правые границы классов должны отличаться на единицу точности наблюдения от левой границы следующего класса, чтобы граничные значения вариант были отнесены к определенному классу. В нашем примере точность измерения составляет 1,0 мм, поэтому правые границы классов будут следующими: 109, 119, 129, 139, 149, 159, 169, 179 (табл. 1.1).

Срединное значение класса (х) вычисляем путем сложением границ классов и делением суммы на два. Для первого класса срединное значение равно: (100 + 109) / 2 = 104,5. Срединное значение последующих классов определяется путем последовательного прибавления классового интервала к срединному значению предыдущего класса: 104,5 + 10= =114,5.

Затем производим разноску вариант по классам (подсчитываем количество вариант, вошедших в тот или иной класс в зависимости от их абсолютных величин). Получаем частоту (f) класса (см. табл. 1.1). Сумма частот должна соответствовать объему выборки (64), сумма частостей fч (частота, выраженная в процентах) должна равняться 100 %.

Рис. 1.1. Способы графического представления вариационного ряда:

кривая распределения и гистограмма