Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Анализ и интерпретация данных / Глава_4.doc

Скачиваний:

108

Добавлен:

01.05.2014

Размер:

4.12 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 1411 12 13 14 > Следующая >>>

4.9.2. Разложение Бахадура - Лазарсфельда

Другое интересное разложение получают введением нормированных величин

(51)

считая, конечно, что p_i не является ни нулем, ни единицей. Эти нормированные переменные имеют нулевое среднее и дисперсию, равную единице. Множество полиномов, похожих на полиномы Радемахера — Уолша, можно получить, систематически образуя различные произведения сомножителей в следующем порядке: ни одного сомножителя, один сомножитель, два и т. д. Так что имеем

Эти полиномы не ортогональны сами по себе, но они ортогональны, если ввести весовую функцию

(53)

т. е.

(54)

Это следует из того, что Р₁ (х) является распределением для cлучая с независимыми переменными и что в этом случае моменты E[(x) (x)] являются или нулем, или единицей. Следовательно любую функцию, определенную на единичном d-кубе можно разложить как '

где

В частности, функцию Р(х)/Р₁ (х) можно представить в виде

, (55)

где

. (56)

Вспомнив, что (х) есть произведение нормированных переменных =, видим, что -это коэффициенты корреляции. Очевидно, что =1 и =. . . =0. Если определить

(57)

то можно представить соотношение (55) как

(58)

Оно известно как разложение Бахадура—Лазарсфельда Р(х). В нем содержится —1 коэффициентов, d вероятностей , первого порядка, коэффициентов корреляциивторого порядка, коэффициентов корреляции третьего порядка и т. д. Естественный способ аппроксимироватьР (х) — это игнорировать все корреляции свыше определенного порядка. Таким образом,

есть аппроксимация первого порядка Р(х),

есть аппроксимация второго порядка и т. д. Если коэффициенты корреляции высокого порядка невелики и мы используем аппроксимацию log(1+x)x, то видим, что logP₁(x) линейный относительно х, logP₂(x) добавляет квадратичный член корреляции и т. д. Таким образом, логарифм разложения Бахадура — Лазарсфельда дает интересную последовательность аппроксимаций. Первая аппроксимация эквивалентна допущению независимости, и она линейна относительно х. Вторая отвечает корреляции второго порядка и квадратична относительно х. Каждая последующая аппроксимация отвечает корреляциям более высокого порядка, но, конечно, требует вычисления большего количества членов.

4.9.3. Разложение Чоу

Другой интересный класс аппроксимаций совместного распределения вероятностей Р(х) основан на тождестве

(59)

Если переменные статистически независимы, оно сводится к произведению отдельных вероятностей Р(х_i). Предположим, что переменные не являются независимыми, но что Р (х_i|х_i_-1, . . .,x₁) зависит только от непосредственно предшествующей переменной х_i_-1. Тогда имеем марковскую цепь первого порядка и

(60)

Мы увидим, что каждый сомножитель Р(х_i| х_i_-1) можно определить с помощью двух коэффициентов; значит, Р(х) можно определить с помощью 2d—1 коэффициентов, что будет менее сложно, чем если бы мы допустили все корреляций второго порядка. Аналогичные марковские аппроксимации более высокого порядка можно получить, если допустить, что , зависит только отk непосредственно предшествующих переменных.

Допущение, что заданная переменная , зависит только от определенных предшествующих переменных, приемлемо, если мы имеем дело с временным процессом; для более общих случаев это допущение выглядит довольно нелепо. Тем не менее есть основание полагать, что заданная переменнаяможет в основном зависеть только от нескольких других переменных. Предположим, что мы можем занумеровать переменные так, чтоP(|, . . ., ) целиком зависит от некоторой предшествующей переменной).

Например, допустим, что

Тогда из (59) следует, что можно записать как. Вообще мы получаем разложение в виде произведения

. (61)

Подставляя 0 или 1 вместо ичитатель может проверить, что

(62)

где

(63)

(64)

Полагая , подставляя (62) в соотношение (61), беря логарифм и собирая члены, получаем разложение Чоу

(65)

Аналогичные результаты легко можно получить для зависимости более высокого порядка.

Следует сделать несколько замечаний относительно этих результатов. Во-первых, если переменные действительно независимы, мы замечаем, что =и последние две суммы в разложении исчезают, оставляя уже знакомые разложения для случая с независимыми переменными. Когда зависимость имеется, мы получаем дополнительные линейные и квадратичные члены. Конечно, линейные члены можно объединить так, чтобы в разложении содержались константа,d линейных членов и d-1 квадратичных членов.

Сравнивая это разложение с разложением второго порядка Радемахера - Уолша или Бахадура - Лазерсфельда, для каждого из которых требуется d(d—1)/2 квадратичных членов, видим, что преимущества данного разложения могут быть значительными. Конечно, эти преимущества можно реализовать только в том случае, если мы знаем дерево зависимости-функцию j(i), которая показывает ограниченную зависимость одной переменной от предыдущих переменных. Если дерево зависимости нельзя вывести из физической значимости переменных, то может возникнуть необходимость в вычислении всех коэффициентов корреляции просто для того, чтобы найти значимые. Однако следует заметить, что даже в этом случае может быть предпочтительнее использовать разложение Чоу, так как получаемые при этом приближенные вероятности будут всегда неотрицательными и их сумма будет равна единице.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 1411 12 13 14 > Следующая >>>

Соседние файлы в папке Анализ и интерпретация данных

#
01.05.20142.53 Mб114Глава_3.doc
#
01.05.20144.12 Mб108Глава_4.doc
#
01.05.20142.76 Mб106Глава_5.DOC
#
01.05.201410.78 Mб110Глава_6.DOC