Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Уральский Федеральный университет им. Б.Н. Ельцина «УПИ»

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

konspekt_matematicheskoe_modelirovanie.doc

Скачиваний:

Добавлен:

22.02.2015

Размер:

3.61 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 107 8 9 10 > Следующая >>>

3. Объясняющие переменные и случайные ошибки одномоментно некоррелированы (хотя в разные моменты и зависимы).

Пример: ,

– лаговая объясняющая переменная, ясно, что она зависит от , но не от .

– только асимптотически (в больших выборках) несмещенные.

Адекватность моделирования. Состоятельные методы

Цели моделирования бывают двух видов:

Прогноз (algoritmic modeling): например, нейронные сети.

Знание механизма (data modeling):

Пример: опасность (несостоятельность) упрощённого data modeling.

Система ,

Модель .

По данным оцениваем .

, ; (9)

;

– несмещенная и состоятельная оценка , т.е. ковариации, которая равна 0, значит, (9).

, и может сложиться мнение, что Y вообще не зависит от X₁ и X₂!

Если проверить гипотезу

, то результат H₀ – “да”, т. е. если модель линейна, то β₁ может быть равен 0.

и, казалось бы, оцененная модель хорошо описывает данные! Оговорка: когда , нельзя гарантировать, что .

Таким образом, если не обратить внимания на оговорки, то можно сделать в корне неверные выводы о системе.

Оптимальный предиктор

Пусть и – зависимые случайные величины.

Задача: составить оптимальный прогноз величины Y по известному значению x величины X.

– ошибка прогноза (случайная величина), поэтому точность прогноза целесообразно характеризовать средним квадратом ошибки при данном значении x:

Поставим задачу: .

Видно, что ее решение: . Таким образом, доказана следующая ниже теорема.

Теорема: оптимальным прогнозом величины по данному значению x является прогноз по регрессии.

Замечание: если ставить задачу минимизации средней ошибки прогноза при всевозможных X, т. е. , то ясно, что если регрессия является лучшим прогнозом при каждом , то и в среднем тоже.

Следствие: оптимальным предиктором в смысле минимизации средней ошибки прогноза при всех является функция регрессии .

Пример: Пусть , где , , - все независимые случайные величины. Какой предиктор X₁ или X₂ лучше? (Сравнить корреляционные отношения).

Пусть – результирующая величина. Не будем ограничивать себя только линейными моделями, наоборот, рассмотрим зависимость вида

, (10)

– любые функции: .

Доля дисперсии, не объясненная регрессией (10):

(11)

Определение: назовем оптимальными преобразованиями те , которые минимизируют (11):

Алгоритм чередующихся математических ожиданий – ace-алгоритм (alternating conditional expectations)

Л. Брейман и Дж. Фридман в 1985 г. предложили итеративный алгоритм нахождения оптимальных преобразований [18].

Пусть распределение известно,

. (12)

Рассмотрим случай

. (13)

Минимизируем (13) по при фиксированном при условии (12). Решение, как мы знаем, есть функция регрессии:

, .

Минимизируем (13) по при фиксированном . Решение есть:

Это является базисом алгоритма:

1. Положить .

2. do while уменьшается:

Заменить на ;

Заменить на .

3. end while

4. – решения ()

5. Конец алгоритма.

Этот алгоритм можно обобщить на случай – регрессоров.

При практическом применении алгоритма совместные распределения всех величин известны редко, вместо них – данные в виде выборки.

, и все величины заменяем выборочными оценками:

;

: .

Если один из факторов категоризованный (), то

, где суммы берутся по поднабору, имеющему категоризованное значение Z = z.

Если обе переменные количественные, то

= выборочному среднему

– значений с номерами, соответствующими ближайшим по значению к .

Алгоритм оценивает при всех соответствующих значениях данных .

Замечание: прогноз после ACE можно сделать так:

, где x_j известны.

Пример (заимствован из [18]): исследовалась зависимость стоимости жилья от разнообразных факторов. Прежними исследователями была предложена функциональная зависимость:

(14)

Факторы: RM – число комнат на человека, DIS – расстояние до работы, PTRATIO – отношение числа учеников к числу учителей в школе, B – доля темнокожего населения, LSTAT – доля населения с низким статусом, CRIM – уровень преступности, NOX – концентрация оксидов азота.

Данные по 506 наблюдениям были подвергнуты ACE , где использовались переменные . Если бы модель (14) соответствовала данным, то были бы линейными функциями. Это оказалось не так. В частности:

то есть при малых концентрациях NOX стоимость растет с ростом концентрации, а при больших – падает. Следует отметить, что сам по себе вклад фактора NOX весьма мал по сравнению с важнейшими факторами.

<<< < Предыдущая 1 2 3 4 5 67 / 107 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.08.20191.99 Mб73Konspekty_lektsy1.doc
#
26.04.2019132.04 Кб2Konspekt_Istoria_UrFU.docx
#
11.09.2019441.34 Кб5Konspekt_lektsy (1).doc
#
23.02.20151.33 Mб1074Konspekt_lektsy_10.pdf
#
26.09.2019103.92 Кб3Konspekt_lektsy_po_distsipline_Pravovedenie.docx
#
22.02.20153.61 Mб37konspekt_matematicheskoe_modelirovanie.doc
#
22.02.2015451.07 Кб14Konspekt_po_khimii.doc
#
22.02.20151.32 Mб94Konspektлекций ярчука 5 курс.doc
#
03.05.20151.56 Mб19KonspLektsy.pdf
#
23.02.2015859.94 Кб10Konstitutsionnoe_pravo (1).pdf
#
22.02.201523.45 Кб5KONSTITUTsIONNOE_PRAVO_VOSTOKA.docx