- •Системный анализ и моделирование процессов в техносфере
- •1.1. Понятие системы. Базовые категории систем
- •1.2. Классификация систем
- •1.3. Общее представление о системном анализе
- •1.4. Принципы системного анализа
- •2.1. Этапы анализа и синтеза
- •2.2. Понятие о структурном анализе
- •2.3. Методы декомпозиции
- •2.4. Требования, предъявляемые к декомпозиции
- •2.5. Алгоритм декомпозиции
- •2.5. Программно-целевой подход к решению системных задач
- •1. Область применения и этапы программно-целевого подхода
- •2. Дерево целей
- •3.1. Агрегирование системы и эмерджентность
- •3.2. Виды связей в системе
- •Связи взаимодействия (координации):
- •Связи преобразования:
- •3.3. Виды агрегирования
- •4.1. Общие свойства процесса принятия решений
- •4.2. Участники процесса принятия решения
- •4.3. Схема ппр
- •4.4. Формулирование проблемы
- •4.5. Определение целей
- •4.6. Генерирование альтернатив
- •4.7. Формирование критериев
- •4.8. Физиология принятия решений
- •4.9. Виды и особенности задач принятия решений
- •4.10. Формализация принятия решений
- •Лекция 5. Информационное обеспечение ппр
- •5.1. Понятие информации
- •5.2. Информационная структура процесса принятия решений
- •6.1. Особенности группового выбора
- •6.2. Экспертные методы выбора
- •6.3. Методы типа мозговой атаки или коллективной генерации идей
- •6.4. Методы типа сценариев
- •6.5. Методы типа «Делфи»
- •6.6. Методы типа дерева целей
- •6.7. Морфологические методы
- •7.1 Основные положения теории управления
- •7.2 Аксиомы теории управления
- •7.3 Модели основных функций организационно-технического управления
- •7.4 Описание функций управления
- •Лекция 8. Понятие и классификация моделей
- •8.1 Понятие модели, моделирования
- •8.2 Познавательные и прагматические модели
- •8.3 Статические и динамические модели
- •8.4 Классификация моделей по способу воплощения
- •8.5 Место математического моделирования в системных исследованиях
- •8.6 Типы и виды математических моделей
- •8.7 Процесс построения математической модели
- •8.8 Структура моделирования происшествий в техносфере
- •9.1 Конфликт ‒ предмет рассмотрения теории игр
- •9.2 Понятие игры. Классификация игр. Формальное представление игр
- •9.3 Определение бескоалиционной игры
- •9.4 Приемлемые ситуации и ситуации равновесия
- •9.5 Примеры игровых задач
- •10.1 Граф и его виды
- •10.2 Задача о кратчайшем пути
- •10.3 Задача о максимальном потоке
- •11.1 Поверхность отклика
- •11.2 Этапы планирования эксперимента
- •11.3 Обработка и анализ результатов моделирования
- •12.1 Полный факторный эксперимент
- •12.2 Дробный факторный эксперимент
- •12.3 Метод наименьших квадратов
- •13.1 Основная цель кластерного анализа
- •13.2 Объединение (древовидная кластеризация)
- •13.3 Двувходовое объединение
- •13.4 Метод k средних
- •13.5 Алгоритм нечеткой кластеризации
- •14.1 Понятие когнитивного моделирования
- •14.2 Подсистема представления субъективной информации
- •14.3 Подсистема извлечения предпочтений эксперта
- •14.4 Подсистема обработки
- •14.5 Подсистема представления результатов моделирования
- •14.6 Подсистема поддержки аналитической деятельности эксперта
- •14.7 Моделирование бизнес процессов на основе bpmn-диаграмм
- •14.8 Метод анализа иерархий (маи): введение
- •14.9 Основные принципы маи
- •1. Принцип идентичности и декомпозиции
- •2. Принцип дискриминации и сравнительных суждений
- •3. Принцип синтеза
- •14.10 Общая оценка маи как метода принятия решений
- •15.1 Общий ход решения задачи на основе метода конечных элементов
- •15.2 Сети одномерных конечных элементов
- •15.3 Виды конечных элементов
- •16.1 Основные понятия
- •16.2 Приближенное решение оду при заданных начальных условиях
- •16.3 Метод Эйлера и его модификации
- •16.4 Метод Рунге-Кутта
- •16.5 Приближенное решение ду n-го порядка при заданных начальных условиях
- •16.6 Приближенное решение ду при заданных граничных условиях (краевых задач)
- •16.6.1 Метод начальных параметров
- •16.6.2 Редукция к задаче Коши для линейного ду второго порядка
- •17.1 Основные понятия
- •17.2 Типы элементов
- •17.3 Источники энергии и преобразователи. Аналоги топологических уравнений
- •17.4 Метод получения топологических уравнений
- •18.1 Свойства задач принятия решения со многими критериями
- •18.2. Формирование множества критериев
- •18.3 Методология решения многокритериальных задач
- •18.4 Технологии отыскания эффективных решений
- •18.5 Методы принятия решения при нескольких критериях
12.3 Метод наименьших квадратов
Рассмотрим особенности регрессионного анализа результатов моделирования на примере построения линейной регрессионной модели.
На рис. 3.9 показаны точки (xi, yi), полученные в эксперименте. Делаем предположение, что функция отклика может быть представлена в виде прямой линии
Требуется получить такие значения коэффициентов b0 и b1, при которых сумма квадратов ошибок будет минимальной. На рисунке ошибки ei для каждой экспериментальной точки равны расстояниям по вертикали от этой точки до линии регрессии (рис. 3).
Рис. 3. К построению регрессионной модели
Обозначим (yt)i =b0+ b0xi (здесь (уt)i ‒ величина, предсказываемая регрессионной моделью), тогда выражение для ошибок будет иметь вид а функция ошибки
Для получения коэффициентов b0 и b1 при которых функция F0 будет минимальной, приравняем нулю частные производные dF0 /db0 и dF0 /db1. Будем иметь:
(20)
Таким образом, получена система двух линейных алгебраических уравнений:
(21)
Решая систему этих уравнений, получим
(22)
где N – число реализаций при моделировании.
Мы рассмотрели частный случай для уравнения (22). В более общем случае, когда эмпирическую функцию принимают в виде полинома
(23)
система уравнений типа (22), (23) будет иметь вид
(24)
Для оценки точности совпадения теоретических и экспериментальных данных следует определить среднюю квадратичную ошибку на единицу веса
(25)
или среднее абсолютное отклонение
(26)
где r – число вычисляемых (табличных) значений;
s – число параметров.
Последовательность вычислений при построении уравнения регрессии на основе метода наименьших квадратов рассмотрим на конкретном примере.
Пусть например необходимо подобрать уравнение регрессии по экспериментальным данным, приведенным ниже.
-
x
0
0.5
1.0
1.5
2.0
y
7.0
4.8
2.8
1.4
0
Вначале попытаемся в качестве типа эмпирической формулы принять линейную зависимость, удерживая в формуле два первых члена:
Составим нормальные уравнения, для чего предварительно заполним таблицу В таблице предусмотрим дополнительные столбцы 4, 5 и 8, которые нам могут потребоваться в дальнейшем (таблица 7).
Таблица 7
x0 |
x |
x2 |
x3 |
x4 |
y |
xy |
x2y |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
0 |
0 |
0 |
0 |
7.0 |
0 |
0 |
1 |
0.5 |
0.25 |
0.125 |
0.0625 |
4.8 |
2.4 |
1.2 |
1 |
1.0 |
1 |
1 |
1 |
2.8 |
2.8 |
2.8 |
1 |
1.5 |
2.25 |
3.375 |
5.0625 |
1.4 |
2.1 |
3.15 |
1 |
2.0 |
4 |
8 |
16 |
0 |
0 |
0 |
5 |
5 |
7.5 |
12.5 |
22.125 |
16 |
7.3 |
7.15 |
Пользуясь данными столбцов 1, 2, 3, 6, 7, составим нормальные уравнения (3.26), которые применительно к нашему случаю при удержании только двух первых членов формулы будут иметь вид:
Подставляя табличные данные, получим:
Решая эти уравнения, найдем: b0 =6,68; b1 = -3,48, следовательно,
Оценим точность выполненных построений. Подставив в полученную формулу значения x (табл. 8), определим вычисленные значения уt и отклонения.
Таблица 8
x |
yt |
y-yt |
(y-yt)2 |
0 0.5 1.0 1.5 2.0 |
+6.68 +4.94 +3.20 +1.46 -0.28 |
+0.32 -0.14 -0.40 -0.06 +0.28 |
0.1024 0.0196 0.1600 0.0036 0.0784 |
Суммируя данные последнего столбца, будем иметь:
Средняя квадратическая ошибка на единицу веса
Среднее абсолютное отклонение (5.9) равно
Полученные величины показывают, что формула подобрана неудовлетворительно, так как исходные данные имеют точность до 0,1, а средняя квадратическая ошибка на единицу веса значительно больше 0,1.
Повторим все операции, используя более точное выражение
Для записи нормальных уравнений (7) дополним вспомогательную табл. 3.8 новыми данными, которые приведены в столбцах 4, 5, 8 и выделены курсивом. Составим нормальные уравнения:
После решения этой системы найдем b0=7.00; b1=-4.74; b2=0.63 и запишем искомую зависимость:
Для определения средней квадратической ошибки составим табл. 9.
Таблица 9
x |
yt |
y-yt |
(y-yt)2 |
0 0.5 1.0 1.5 2.0 |
7,0 4.79 2,89 1.30 0.04 |
0 +0.01 -0.09 +0.10 -0.04 |
0 0.0001 0.0081 0.0100 0.0016 |
Суммируя последний столбец, получим
Средняя квадратическая ошибка на единицу веса
Среднее абсолютное отклонение
Следовательно, формула вполне удовлетворительно соответствует экспериментальным данным.
Литература
1. Ильина Н.В. Системный анализ и моделирование процессов в техносфере: Учеб. пособие / Н.В. Ильина, Д.Д. Лапшин, В.И. Федянин. – Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. – 206 с.
Лекция 13. Кластерный анализ