4.5. Рациональные вычислительные схемы для табл. 6.10

Запишем суммы квадратов несколько в иной, но бо­лее удоб­ной форме. Для этого получим вспо­мо­га­тель­ные суммы по каждой ячей­ке (индекс j) и по со­от­вет­ству­ющим факторам(Tij., Ti.k, T.jk). Нам будут так­же нужны суммы по двум факторам(Ti.., T.j. , T..k), а также общая сум­ма

.

Правильность подсчета сумм можно кон­тро­ли­ро­вать по вспомогательным равенствам:

.

С учетом сказанного, суммы, приведенные в табл. 6.10, мож­но расписать следующим образом:

;

;

.

Другое главное влияние взаимодействия двух со­от­вет­ст­вующих факторов мож­но получить по аналогии с оцен­кой S1 иS4 . Член S7, соответствующий вза­и­мо­дей­ст­вию трех факторов, можно также выразить с по­мо­щью вспо­мо­га­тельных сумм, но так как в него будут входить уже во­семь членов, то обычно эту сумму по­лу­ча­ют вы­чи­та­ни­ем всех других сумм из общейS. Если все же выражениеS7 нуж­но для про­вер­ки предыдущих ариф­ме­ти­чес­ких вы­кла­док, то его можно вычислить как

.

Как видно из формул, даже при малом количестве дан­ных эти вы­числения ста­но­вят­ся довольно громоздкими и по­­э­то­му такой вид дисперсионного анализа вы­пол­ня­ет­­ся, как правило, с использованием электронныхтаб­лиц.

§ 5. Некоторые вопросы преобразования данных

Довольно часто предполагается, что генеральная со­во­купность рас­пре­де­ле­на нормально. Когда это не так, то все предложенные к рассмотрению и ис­поль­зованию ме­тоды не могут применяться, так как построенные от­но­шения в таблицах дисперсионного анализа будут со­от­ветствовать некоторому неиз­вес­т­ному распределе­нию, а точные кри­те­рии значимости становятся не­при­год­ны­ми. Изучать эф­фект отклонения от нормального закона для опи­санных в ра­боте критериев - дли­тель­ная и утомительная работа. Бо­лее того данных мо­­жет быть достаточно большое раз­но­об­ра­зие, сле­до­ва­­тельно, и подобных критериев должно быть не мень­ше. Зна­чит, самый надежный путь - это пре­об­ра­зо­вать данные та­ким образом, чтобы отклонения от нор­маль­­но­го за­ко­на распределения были бы небольшими1.

Одним из методов приведения данных к нор­мал­ь­но­му ви­ду считается ло­га­риф­ми­рование2. Когда дис­пер­сия пред­ставляет собой некоторую функцию сред­ней, тог­да можно воспользоватьсяметодом стабилизации совокупности.

Предположим, что xиy- переменные, связанные меж­ду собой некоторой фун­кциональной зависимостьюy = f(x)(например,f(x)может быть ре­грес­си­он­нoй зависимостью). Нам надо подобрать функциюg(x) та­ким образом, что­бы дисперсия уyбыла бы более ста­биль­ной, чем дисперсия у х3. Предположим, что пе­ре­мен­­наяxраспределена от­но­си­тель­но среднейmсне­боль­шим стан­дар­­т­ным отклонением, тог­да в первом при­­­бли­жении можно предположить, чтоy = =f(m)+ (x - m) g(x), откуда среднее значениеyравноf(m), адис­­пер­сия y мо­жет быть вычислена как|g(m)|2(дис­пер­сия x).

Если при этом допустить, что дисперсия xможет быть выражена некоторой функцией отm, которую обо­­з­начим какq(m), а дисперсия y при этом должна ос­­таваться ста­биль­ной и постоянной (допустим, равной А), то тогда на ос­но­ва­ниидвух по­след­них вы­ра­же­ний имеем

или ,

что дает подходящую форму для преобразования дан­ных. На­пример, если предложить к рассмотрению рас­пре­де­ле­ние Пуассона, в котором q(m) = m, то тогда по­след­ний ин­те­грал может быть вычислен как

.

Это значит, что подходящим преобразованием для дан­ных, делающих дис­пер­сию независящей от среднего зна­чения, долж­но быть . Это пре­об­ра­зование с из­влечением квадратного корня обычно применяется, ког­да есть данные о том, что исходный ряд может иметь распределение Пу­ас­со­на или быть пре­об­ра­зо­ван­ным к нему. Если это не так, то можно предположить иное преобразование. Довольно полная сводка таких пре­образований приводится в работе [Bartlett, 1947].

1Этот метод приближения линейной комбинацией средних квад­ра­тов с по­­мощью среднего ква­д­рата с некоторым новым числом сте­пе­ней сво­бо­ды принадлежит Саттерсвэйту [Satterthwaite, 1946] и Уэлчу [Welch, 1946].

1 По общему мнению современных авторов при применении ди­спер­си­он­но­го анализа можно допустить умеренные отступления от нормального за­кона распределения.

2 Этот способ преобразования данных применим в случае, когда данные имеют довольно большую дисперсию по сравнению с нормальной.

3Без ограничения общности можно и наоборот. Самое главное при этом до­биться стабилизации дисперсии хотя бы по одной из пе­ре­мен­ных. Здесь предложено стабилизировать дисперсию по у, так как у является не­зависимой переменной.

120

Соседние файлы в папке glava6