Скачиваний:
119
Добавлен:
01.05.2014
Размер:
415.74 Кб
Скачать

1 Основы обработки данных

ПРЕДИСЛОВИЕ…………………………………………..………………………………………….4

1.ВВВЕДЕНИЕ В АНАЛИЗ ДАННЫХ…………………………..…………………………………5

1.1.Проблема обработки данных………………………………………….…………………………5

1.2.Матрица данных……………………………………………………………….………..………..7

1.3.Гипотезы компактности и скрытых факторов………………………………………………….8

1.4.Структура матрицы данных и задачи обработки…………………………………………..…13

1.5.Матрица объект-объект и признак-признак. Расстояние и близость……………………….15

1.6.Измерение признаков…………………………………….…………………………………….17

1.7.Отношения и их представление……………………….………………………………………19

1.8.Основные проблемы измерений……………………………….………………………………21

1.9.Основные типы шкал……….…………………………………………………………………..22

1.10.Проблема адекватности………….……………………………………………………………23

1.11.Заключение…………………………….………………………………………………………25

1.12.Литература к главе 1………………………….……………………………………………….27

1.13.Вопросы для самопроверки……………………….…………………………………………..27

2.ОСНОВЫ АНАЛИЗА СВЯЗЕЙ…………………………….……………………………………29

2.1.Предположение о природе связей………………………………..……………………………29

2.2.Нормальное распределение…………………………………..………….………………….….29

2.3.Корреляционная матрица и ее основные свойства………………………….…………….….31

2.4.Собственные векторы и собственные числа корреляционной матрицы………….………...33

2.5.Приведение корреляционной матрицы к нормальной форме…………………………….….36

2.6.Геометрическая интерпретация главных компонент на плоскости…………………….……38

2.7.Модель главных компонент……………………………………………………………….…....40

2.8.Приближенное вычисление собственных чисел и векторов корреляционной матрицы……42

2.9.Понятие об измерении связи между качественными признаками. Статистический подход.44

2.10.Теоретико-информационный подход…………………………………………………………48

2.11.Проблема интерпретации значений коэффициентов связи………………………………….53

2.12.Заключение……………………………………………………………………………………..55

2.13.Литература к главе 2…………………………………………………………………………...56

2.14.Вопросы для самопроверки…………………………………………………………………...57

3.ЗАДАЧА ФАКТОРНОГО АНАЛИЗА……………………………………………………………58

2

3.1.Модель факторного анализа…………………………………………………………………….58

3.2.Структура факторных уравнений………………………………………………………………61

3.3.Неоднозначность факторного решения……………………………………………………..….63

3.4.Метод главных факторов………………………………………………………………………..64

3.5.Метод центроидных факторов………………………………………………………………….67

3.6.Проблема оценки значений факторов и виды факторных моделей………………………….71

3.7.Оценки общностей и вращение факторов……………………………………………………...74

3.8.Экстремальная группировка признаков (параметров)…...……………………………………77

3.9.Алгоритмы экстремальной группировки……………………………………………...……….78

3.10.Заключение……………………………………………………………………………………..80

3.11.Литература к главе 3……………………..…………………………………………………….81

3.12.Вопросы для самопроверки……………………………………………………………………81

4.ЗАДАЧА КЛАССИФИКАЦИИ И КЛАСТЕР-АНАЛИЗ………………………………………..83

4.1.Постановка задачи классификации и кластер-анализа……………………………………….83

4.2.Байесовское решающее правило классификации. ……………………………………………85

4.3.Вероятности ошибок байесовского классификатора………………………………………….87

4.4.Формирование решающего правила как обучение распознаванию образов………………..89

4.5.Восстановление плотностей распределения классов…………………………………………92

4.6.Восстановление функций степени достоверности……………………………………………94

4.7.Минимизация среднего риска…………………………………………………………………..96

4.8.Линейные разделяющие функции……………………………………………………………...97

4.9.Область решений линейной разделяющей функции………………………………………...101

4.10.Алгоритмы построения разделяющих гиперплоскостей…………………………………...107

4.11.Алгоритм построения оптимальной разделяющей гиперплоскости………………………110

4.12.Алгоритмы кластер-анализа………………………………………………………………….114

4.13.Заключение……………………………………………………………………………………118

4.14.Литература к главе 4………………………………………………………………………….120

4.15.Вопросы для самопроверки…………………………………………………………………..121

5.ОБУЧЕНИЕ РАСПОЗНАВАНИЮ ОБРАЗОВ НА НЕТРАДИЦИОННЫХ ДАННЫХ……..124

5.1.Нетрадиционные данные и задачи их обработки…………………………………………….124

5.2.Частная постановка задачи обучения…………………………………………………………125

5.3.Разделимость обучающего множества и алгоритмы обучения……………………………..127

3

5.4.Формирование признаков……………………………………………………………………...134

5.5.Обработка экспериментальных кривых в реальном времени………………………………143

5.6.Источник кривых и его некоторые свойства…………………………………………………147

5.7.Граф возможных решений о классах событий………………………………………….……153

5.8.Алгоритм распознавания………………………………………………………………………156

5.9.Заключение………………………………………………………………………………..……158

5.10.Литература к главе 5………………………………………………………………………….160

5.11.Вопросы для самопроверки………………………………………………………………..…162

4

Соседние файлы в папке Основы обработки данных