Скачиваний:
108
Добавлен:
01.05.2014
Размер:
4.12 Mб
Скачать

4.9.2. Разложение Бахадура - Лазарсфельда

Другое интересное разложение получают введением нормиро­ванных величин

(51)

считая, конечно, что pi не является ни нулем, ни единицей. Эти нор­мированные переменные имеют нулевое среднее и дисперсию, рав­ную единице. Множество полиномов, похожих на полиномы Раде­махера — Уолша, можно получить, систематически образуя раз­личные произведения сомножителей в следующем порядке: ни одного сомножителя, один сомножитель, два и т. д. Так что имеем

Эти полиномы не ортогональны сами по себе, но они ортогональ­ны, если ввести весовую функцию

(53)

т. е.

(54)

Это следует из того, что Р1 (х) является распределением для cлучая с независимыми переменными и что в этом случае моменты E[(x) (x)] являются или нулем, или единицей. Следовательно любую функцию, определенную на единичном d-кубе можно разложить как '

где

В частности, функцию Р(х)/Р1 (х) можно представить в виде

, (55)

где

. (56)

Вспомнив, что (х) есть произведение нормированных перемен­ных =, видим, что -это коэффициенты корреляции. Очевидно, что =1 и =. . . =0. Если определить

(57)

то можно представить соотношение (55) как

(58)

Оно известно как разложение БахадураЛазарсфельда Р(х). В нем содержится 1 коэффициентов, d вероятностей , первого порядка, коэффициентов корреляциивторого порядка, коэффициентов корреляции третьего порядка и т. д. Естествен­ный способ аппроксимироватьР (х) — это игнорировать все корре­ляции свыше определенного порядка. Таким образом,

есть аппроксимация первого порядка Р(х),

есть аппроксимация второго порядка и т. д. Если коэффициенты корреляции высокого порядка невелики и мы используем аппрок­симацию log(1+x)x, то видим, что logP1(x) линейный относитель­но х, logP2(x) добавляет квадратичный член корреляции и т. д. Таким образом, логарифм разложения Бахадура — Лазарсфельда дает интересную последовательность аппроксимаций. Первая ап­проксимация эквивалентна допущению независимости, и она ли­нейна относительно х. Вторая отвечает корреляции второго порядка и квадратична относительно х. Каждая последующая аппроксимация отвечает корреляциям более высокого порядка, но, конечно, тре­бует вычисления большего количества членов.

4.9.3. Разложение Чоу

Другой интересный класс аппроксимаций совместного распре­деления вероятностей Р(х) основан на тождестве

(59)

Если переменные статистически независимы, оно сводится к произ­ведению отдельных вероятностей Р(хi). Предположим, что пере­менные не являются независимыми, но что Р (хii-1, . . .,x1) за­висит только от непосредственно предшествующей переменной хi-1. Тогда имеем марковскую цепь первого порядка и

(60)

Мы увидим, что каждый сомножитель Р(хi| хi-1) можно определить с помощью двух коэффициентов; значит, Р(х) можно определить с помощью 2d1 коэффициентов, что будет менее сложно, чем если бы мы допустили все корреляций второго порядка. Аналогич­ные марковские аппроксимации более высокого порядка можно получить, если допустить, что , зависит только отk непосредственно предшествующих переменных.

Допущение, что заданная переменная , зависит только от оп­ределенных предшествующих переменных, приемлемо, если мы име­ем дело с временным процессом; для более общих случаев это допу­щение выглядит довольно нелепо. Тем не менее есть основание пола­гать, что заданная переменнаяможет в основном зависеть только от нескольких других переменных. Предположим, что мы можем занумеровать переменные так, чтоP(|, . . ., ) целиком за­висит от некоторой предшествующей переменной).

Например, допустим, что

и

Тогда из (59) следует, что можно записать как. Вообще мы получаем разложение в виде произведения

. (61)

Подставляя 0 или 1 вместо ичитатель может проверить, что

(62)

где

(63)

и

(64)

Полагая , подставляя (62) в соотношение (61), беря логарифм и собирая члены, получаем разложение Чоу

(65)

Аналогичные результаты легко можно получить для зависимости более высокого порядка.

Следует сделать несколько замечаний относительно этих результатов. Во-первых, если переменные действительно независимы, мы замечаем, что =и последние две суммы в разложении исчезают, оставляя уже знакомые разложения для случая с независимыми переменными. Когда зависимость имеется, мы получаем дополнительные линейные и квадратичные члены. Конечно, линейные члены можно объединить так, чтобы в разложении содержались константа,d линейных членов и d-1 квадратичных членов.

Сравнивая это разложение с разложением второго порядка Радемахера - Уолша или Бахадура - Лазерсфельда, для каждого из которых требуется d(d—1)/2 квадратичных членов, видим, что преимущества данного разложения могут быть значительными. Конечно, эти преимущества можно реализовать только в том слу­чае, если мы знаем дерево зависимости-функцию j(i), которая показывает ограниченную зависимость одной переменной от преды­дущих переменных. Если дерево зависимости нельзя вывести из физической значимости переменных, то может возникнуть необхо­димость в вычислении всех коэффициентов корреляции просто для того, чтобы найти значимые. Однако следует заметить, что даже в этом случае может быть предпочтительнее использовать разложение Чоу, так как получаемые при этом приближенные вероятности будут всегда неотрицательными и их сумма будет равна единице.

Соседние файлы в папке Анализ и интерпретация данных