Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Хранилища данных..pdf
Скачиваний:
81
Добавлен:
05.02.2023
Размер:
1.09 Mб
Скачать

1

ХРАНИЛИЩА ДАННЫХ учебное пособие

Томск – 2015

2

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ СИСТЕМ УПРАВЛЕНИЯ И РАДИОЭЛЕКТРОНИКИ» (ТУСУР)

Кафедра автоматизации обработки информации (АОИ)

УТВЕРЖДАЮ

Зав. Кафедрой АОИ

Д.т.н., профессор

_________________

Ю. П. Ехлаков

«___»

__________________ 2015 г.

УЧЕБНОЕ ПОСОБИЕ

по дисциплине «Хранилища данных» для студентов направления 230102 – Бизнес информатика

Разработчик Доцент каф. АОИ К.т.н., с.н.с.

О.И. Жуковский

Томск 2015

3

Аннотация

«Хранилища данных» (ХД) – учебная дисциплина, в которой изучаются современные технологии, методы и средства проектирования и построения автоматизированных информационных систем, ориентированных на анализ данных. Специалисты в области ХД должны владеть знаниями и умениями, позволяющими принимать обоснованные решения на всех стадиях и этапах проектирования и построения автоматизированных информационных систем, ориентированных на анализ данных.

Пособие подготовлено в соответствии с требованиями Государственного образовательного стандарта высшего профессионального образования.

Учебное пособие предназначено для студентов факультета дистанционного обучения ТУСУР.

4

Оглавление

Введение .............................................................................................................................................

6

1. Системы поддержки принятия решений .....................................................................................

7

1.1. Задачи систем поддержки принятия решений.................................................................

7

1.2 OLTP-системы....................................................................................................................

10

1.3

Неэффективность использования OLTP-систем для анализа данных..........................

20

2 Хранилище данных......................................................................................................................

25

2.1

Концепция хранилища данных.........................................................................................

25

2.2

Организация хранилища данных......................................................................................

32

2.3

Метаданные в хранилищах данных.................................................................................

38

2.4

Очистка данных..................................................................................................................

52

2.5

Концепция хранилища данных и анализ.........................................................................

59

3. Архитектура хранилищ данных..................................................................................................

61

3.1

Факторы, определяющие архитектуру ХД......................................................................

61

3.2

Основные типы программно-аппаратной архитектуры хранилища данных...............

63

3.3

Организация работ по созданию хранилища данных.....................................................

67

3.4

Характеристика решений ведущих производителей......................................................

69

3.5

Типовые программно-аппаратные решения реализации ХД.........................................

72

3.5

Области применения технологии хранилищ данных.....................................................

77

4 Основные бизнес-функции процесса разработки и проектирования хранилища данных.....

87

4.1

Задачи процесса проектирования хранилища данных...................................................

87

4.2

Модель жизненного цикла хранилища данных..............................................................

90

4.2.1 Планирование..................................................................................................................

92

4.2.2 Разработка требований...................................................................................................

96

4.2.3 Анализ............................................................................................................................

100

4.2.4 Проектирование ............................................................................................................

100

4.2.5 Построение хранилища данных...................................................................................

103

4.2.6 Внедрение......................................................................................................................

104

4.2.7 Поддержка .....................................................................................................................

104

5.1. Многомерная модель данных........................................................................................

107

5.2

Двенадцать правил Кодда ...............................................................................................

113

5.3

Дополнительные правила Кодда....................................................................................

115

5.4

Тест FASMI.......................................................................................................................

117

5.5. Архитектура OLAP-систем............................................................................................

119

6. Интеллектуальный анализ данных...........................................................................................

128

6.1. Добыча данных — Data Mining .....................................................................................

128

5

 

6.2. Задачи Data Mining..........................................................................................................

129

6.3. Практическое применение Data Mining........................................................................

139

6.4. Модели Data Mining........................................................................................................

143

6.5. Методы Data Mining........................................................................................................

146

6.6. Процесс обнаружения знаний........................................................................................

153

Заключение.............................................................................................................................

161

Глоссарий................................................................................................................................

163

6

Введение

«Хранилища данных» (ХД) – учебная дисциплина, в которой изучаются современные технологии, методы и средства проектирования и построения автоматизированных информационных систем, ориентированных на анализ данных. Специалисты в области ХД должны владеть знаниями и умениями, позволяющими принимать обоснованные решения на всех стадиях и этапах проектирования и построения автоматизированных информационных систем, ориентированных на анализ данных.

В пособии представлены такие базовые темы, относящиеся к области проектирования и использования Хранилищ Данных как:

Основные принципы построения систем, ориентированных на анализ данных;

Модели данных, используемые для построения хранилищ; Особенности построения систем на основе хранилищ данных;

Основные бизнес-функции процесса разработки и проектирования хранилища данных;

Основные принципы OLAP.

Назначение и область применения методов интеллектуального анализа данных;