Методичка по лабораторной работе №3 / Непараметрич. оцениване
.docЛабораторная работа №1
«Непараметрическое оценивание монотонных функциональных зависимостей на основе анализа законов распределения случайных величин»
1. Краткие теоретические сведения
В литературе описаны методы оценивания функциональных зависимостей по экспериментальным данным (методы регрессионного анализа, метод линеаризации нелинейностей) [1]. Недостатками этих методов являются.
-
Низкая точность при малом объеме исходных данных.
-
Необходимость наличия таблицы совместно наблюдаемых значений независимой и зависимой величины.
-
Необоснованное постулирование нормальной формы закона распределения наблюдаемых данных.
Целью настоящей работы является разработка и исследование метода восстановления монотонных функциональных зависимостей на основе анализа законов распределения независимой и зависимой случайной величины в случае, когда тип закона распределения заранее неизвестен.
Постановка задачи.
Пусть заданы выборки {x}, {y} входной и выходной величин объем M и N соответственно. Предполагается, что зависимость y=φ(x) нелинейна и монотонна.
Требуется построить график зависимости y=φ(x).
Схема решения задачи.
В основе подхода решения задачи лежит известный подход, основанный на анализе функции распределения функции случайного аргумента, описанный в [2]. Предположим, что функциональная зависимость y=φ(x) является непрерывной, монотонной и однозначной. В этом случае из известного соотношения
(1)
следует, что если известны F(y), F(x), то для заданного значения y можно подобрать такое x, что F(y)=F(x), то есть
(2)
Здесь y[a(y),b(y)]; x[a(x),b(x)], где {a(y),b(y)} и {a(x),b(x)} – границы интервала возможных значений статистических показателей y и x;
Задаваясь различными значениями λp[0;1] при известных F(y), F(x) с учетом условия
F(yp)=F(xp)=λp, p=1,2,.... (3)
Можно получить серию пар чисел {yp, xp}, p=1,2,..., которые характеризуют значение функциональной зависимости yp=φ(xp) в p-й точке. По совокупности значений {yp, xp} в итоге можно построить непараметрическую функциональную модель.
На рис. 1 приведена графическая иллюстрация предлагаемого метода для a(y)=a(x)=0; b(y)=b(x)=∞; p = 1,2,3.
Рис. 1. Графическая схема получения пар чисел на основе интегральных законов распределения случайных величин
Для восстановления законов распределения в случае, когда вид закона распределения заранее неизвестен, предлагается использовать унифицированный метод, описанный в [3]. Отметим, что, задавшись достаточно большим значением p, можно получить практически непрерывную зависимость y=φ(x).
Для исследования статистических свойств непараметрического метода оценивания функциональных взаимосвязей на основе анализа законов распределения случайных величин был проведен статистический эксперимент, схема которого состояла в следующем.
-
Задавался вид нелинейной зависимости y=φ(x).
-
Посредством датчиков случайных чисел генерировались случайные последовательности x1(j), x2(j),…,xN(j) различных объемов N (j – номер испытания).
-
По заданной зависимости y=φ(x) для полученных последовательностей x1(j), x2(j),…,xN(j) рассчитывались соответствующие значения y1(j), y2(j),…,yN(j).
-
Посредством формальной процедуры построения законов распределения по выборочным значениям x1(j), x2(j),…,xN(j) и y1(j), y2(j),…,yN(j), описанного в [3], строились оценки и соответственно.
-
На основе выражения (3) формировались пары чисел , p=1,2,..., соответствующие различным λp[0;1].
-
Рассчитывались значения метрики , характеризующей расхождение между полученными значениями и теоретическим значением ;
Весь эксперимент повторялся η=50 раз, то есть . В качестве метрики выбиралась метрика доминирования. В качестве показателя точности восстановления выступало среднее M[DN], определяемое по множеству {}.
На рис. 2-5 приводятся кривые, характеризующие точность оценок, полученных с помощью предлагаемого метода и известного метода линеаризации, описанного в [2]. Для сглаживания полученных данных использовалось выражение вида
y=exp(a+bN)
На рис. 2 изображена нелинейность y=2x2+x, закон распределения F(x) – нормальный с параметрами – математическим ожиданием (МО) МО=8 и среднеквадратическим отклонением (СКО) СКО=2; на рис. 3 изображена нелинейность y=0,125x2, закон распределения F(x) – Эрланга с параметрами МО=6 и СКО=2; на рис. 4 изображена нелинейность y=2x2+x, закон распределения F(x) – Эрланга с параметрами МО=4 и СКО=2; на рис. 5 изображена нелинейность y=ln(2x+1), закон распределения F(x) – экспоненциальный с параметрами МО=2 и СКО=2
На рис. с 2-5 цифра 1 соответствует методу линеаризации, цифра 2 соответствует предлагаемому методу.
M[DN]
1 N 2
Рис. 2. Нелинейность y=2x2+x
M[DN]
N 2 1
Рис. 3. Нелинейность y=0,125x2
M[DN] N
Рис. 4. Нелинейность y=2x2+x
1 2
M[DN]
N 2
Рис. 5. Нелинейность y=ln(2x+1)
1
Из рис. 2-5 видно, что эффективность статистического метода растет с увеличением объема выборки.
На основании полученных результатов, можно заключить, что предлагаемый метод позволяет получать более точные результаты, нежели известный метод линеаризации нелинейностей.
2. Задание на работу
2.1. По данным, приведенным в таблице 1 и 2, оценить непараметрическую зависимость y=f(x) описанным способом. Непараметрическую зависимость представить в графическом виде.
Для аппроксимации F(x) и F(y) использовать соотношение
при и
,
где – число одинаковых значений .
Здесь ; ; .
2.2. Сопоставить полученную зависимость с результатами, получаемыми при аппроксимации F(x) и F(y) гауссовским и равномерным распределениями.
СПИСОК ЛИТЕРАТУРЫ
1. Демиденко Е.З. Линейная и нелинейная регрессии. – М.: Финансы и статистика, 1981. – 302с.
2. Пугачев В.С. Теория вероятностей и математическая статистика. – М.: ФИЗМАТЛИТ, 2002. – 496с.
3. Алыпов Ю.Е., Гвоздев В.Е. Исследование информационного подхода оценки состояния элементов сложных систем при малом числе наблюдений // Управление сложными техническими системами: Межвуз. науч. сб. – Уфа: УАИ, 1981. – №4. – С 37-44с.