Скачиваний:
91
Добавлен:
01.05.2014
Размер:
60.93 Кб
Скачать

Двоенко С.Д. Методы анализа БМД

министерство образования рф

тульский государственный университет

кафедра автоматики и телемеханики

С.Д. Двоенко

Конспект лекций

по курсу

«методы анализа больших массивов данных»

дневного обучения

тула 2001

содержание

  1. Введение в анализ данных

    1. Проблема обработки данных

    2. Матрица данных

    3. Гипотезы компактности и скрытых факторов

    4. Структура матрицы данных и задачи обработки

    5. Матрица объект-объект и признак-признак. Расстояние и близость

    6. Измерение признаков

    7. Отношения и их представление

    8. Основные проблемы измерений

    9. Основные типы шкал

    10. Проблема адекватности

  2. Основы анализа связей

    1. Предположение о природе связи

    2. Нормальное распределение

    3. Корреляционная матрица и ее основные свойства

    4. Собственные векторы и собственные числа корреляционной матрицы

    5. Приведение корреляционной матрицы к диагональной форме

    6. Геометрическая интерпретация главных компонент на плоскости

    7. Модель главных компонент

    8. Приближенное вычисление собственных чисел и векторов корреляционной матрицы

    9. Понятие об измерении связи между качественными признаками. Статистический подход

    10. Теоретико-информационный подход

    11. Проблема интерпретации значений коэффициентов связи

  3. Задача факторного анализа

    1. Модель факторного анализа

    2. Структура факторных уравнений

    3. Неоднозначность факторного решения

    4. Метод главных факторов

    5. Метод центроидных факторов

    6. Проблема оценки значений факторов и виды факторных моделей

    7. Оценки общностей и вращение факторов

    8. Экстремальная группировка признаков (параметров)

    9. Алгоритмы экстремальной группировки

  4. Задачи классификации и кластер-анализа

    1. Постановка задач классификации и кластер-анализа

    2. Байесовское решающее правило классификации

    3. Вероятности ошибок байесовского классификатора

    4. Формирование решающего правила как обучение распознаванию образов

    5. Восстановление плотностей распределения классов

    6. Восстановление функций степени достоверности

    7. Минимизация среднего риска

    8. Линейные разделяющие функции

    9. Область решений линейной разделяющей функции

    10. Алгоритмы построения разделяющих гиперплоскостей

    11. Алгоритм построения оптимальной разделяющей гиперплоскости

    12. Алгоритмы кластер-анализа

Соседние файлы в папке Методы анализа больших массивов данных