- •Определение цены опциона методом имитационного моделирования
- •Общие принципы имитационного моделирования многокомпонентных систем
- •Организация квазипараллелизма просмотром активностей
- •Два способа изменения (протяжки) системного времени
- •Организация квазипараллелизма транзактным способом
- •Оценка погрешности результирующего показателя имитации из-за различия затравочных чисел генератора псевдослучайных чисел
- •Понижение дисперсии при вычислении интегралов
- •Применение имитационного моделирования (им) к сравнению методов оценивания и анализу их точности
- •Основная литература
- •Дополнительная литература
- •Обобщенный мнк
- •1) Гетероскедастичные ошибки.
- •3. Объясняющие переменные и случайные ошибки одномоментно некоррелированы (хотя в разные моменты и зависимы).
- •Адекватность моделирования. Состоятельные методы
- •Оптимальный предиктор
- •Алгоритм чередующихся математических ожиданий – ace-алгоритм (alternating conditional expectations)
- •Проверка адекватности моделирования
- •Полиномиальная лаговая структура Алмон
- •Геометрическая лаговая структура Койка
- •Модель частичной корректировки
- •Модель адаптивных ожиданий
- •Модель потребления Фридмена
3. Объясняющие переменные и случайные ошибки одномоментно некоррелированы (хотя в разные моменты и зависимы).
Пример: ,
– лаговая объясняющая переменная, ясно, что она зависит от , но не от .
– только асимптотически (в больших выборках) несмещенные.
Адекватность моделирования. Состоятельные методы
Цели моделирования бывают двух видов:
Прогноз (algoritmic modeling): например, нейронные сети.
Знание механизма (data modeling):
Пример: опасность (несостоятельность) упрощённого data modeling.
Система ,
Модель .
По данным оцениваем .
, ; (9)
;
– несмещенная и состоятельная оценка , т.е. ковариации, которая равна 0, значит, (9).
, и может сложиться мнение, что Y вообще не зависит от X1 и X2 !
Если проверить гипотезу
:
, то результат H0 – “да”, т. е. если модель линейна, то β1 может быть равен 0.
и, казалось бы, оцененная модель хорошо описывает данные! Оговорка: когда , нельзя гарантировать, что .
Таким образом, если не обратить внимания на оговорки, то можно сделать в корне неверные выводы о системе.
Оптимальный предиктор
Пусть и – зависимые случайные величины.
Задача: составить оптимальный прогноз величины Y по известному значению x величины X.
– ошибка прогноза (случайная величина), поэтому точность прогноза целесообразно характеризовать средним квадратом ошибки при данном значении x:
.
Поставим задачу: .
Видно, что ее решение: . Таким образом, доказана следующая ниже теорема.
Теорема: оптимальным прогнозом величины по данному значению x является прогноз по регрессии.
Замечание: если ставить задачу минимизации средней ошибки прогноза при всевозможных X, т. е. , то ясно, что если регрессия является лучшим прогнозом при каждом , то и в среднем тоже.
Следствие: оптимальным предиктором в смысле минимизации средней ошибки прогноза при всех является функция регрессии .
Пример: Пусть , где , , - все независимые случайные величины. Какой предиктор X1 или X2 лучше? (Сравнить корреляционные отношения).
Пусть – результирующая величина. Не будем ограничивать себя только линейными моделями, наоборот, рассмотрим зависимость вида
, (10)
– любые функции: .
Доля дисперсии, не объясненная регрессией (10):
(11)
Определение: назовем оптимальными преобразованиями те , которые минимизируют (11):
.
Алгоритм чередующихся математических ожиданий – ace-алгоритм (alternating conditional expectations)
Л. Брейман и Дж. Фридман в 1985 г. предложили итеративный алгоритм нахождения оптимальных преобразований [18].
Пусть распределение известно,
. (12)
Рассмотрим случай
. (13)
Минимизируем (13) по при фиксированном при условии (12). Решение, как мы знаем, есть функция регрессии:
, .
Минимизируем (13) по при фиксированном . Решение есть:
.
Это является базисом алгоритма:
1. Положить .
2. do while уменьшается:
.
Заменить на ;
.
Заменить на .
3. end while
4. – решения ()
5. Конец алгоритма.
Этот алгоритм можно обобщить на случай – регрессоров.
При практическом применении алгоритма совместные распределения всех величин известны редко, вместо них – данные в виде выборки.
, и все величины заменяем выборочными оценками:
;
: .
Если один из факторов категоризованный (), то
, где суммы берутся по поднабору, имеющему категоризованное значение Z = z.
Если обе переменные количественные, то
= выборочному среднему
– значений с номерами, соответствующими ближайшим по значению к .
Алгоритм оценивает при всех соответствующих значениях данных .
Замечание: прогноз после ACE можно сделать так:
, где xj известны.
Пример (заимствован из [18]): исследовалась зависимость стоимости жилья от разнообразных факторов. Прежними исследователями была предложена функциональная зависимость:
(14)
Факторы: RM – число комнат на человека, DIS – расстояние до работы, PTRATIO – отношение числа учеников к числу учителей в школе, B – доля темнокожего населения, LSTAT – доля населения с низким статусом, CRIM – уровень преступности, NOX – концентрация оксидов азота.
Данные по 506 наблюдениям были подвергнуты ACE , где использовались переменные . Если бы модель (14) соответствовала данным, то были бы линейными функциями. Это оказалось не так. В частности:
то есть при малых концентрациях NOX стоимость растет с ростом концентрации, а при больших – падает. Следует отметить, что сам по себе вклад фактора NOX весьма мал по сравнению с важнейшими факторами.