Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
informacionnoe_hranilishe.docx
Скачиваний:
463
Добавлен:
09.05.2015
Размер:
881.04 Кб
Скачать

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Чувашский государственный университет имени И.Н. Ульянова»

Экономический факультет

Кафедра информационных систем

КУРСОВАЯ РАБОТА

по дисциплине «Базы данных»

на тему: «Информационные хранилища»

Выполнила:

студентка 2 курса Преподаватель: к.э.н., доцент


Чебоксары

2014

Содержание

Введение……………………………………………………………….…………..3

Глава 1. Общие теоретические сведения об информационных хранилищах…5

1.1. Назначение информационного хранилища………………...……………….5

1.2. Свойства информационного хранилища……………………….…………...6

1.3. Компоненты информационного хранилища………………………………..9

Глава 2. Проблемы, их решение и реализация информационных хранилищ..11

2.1. Проблемы интеграции данных ………………………………………….....11

2.2. Реализация хранилищ и витрин данных……………………….…………..14

2.3. Подходы и имеющиеся решения…...………………..……………………..16

Глава 3. Проектирование реляционной БД «Салона красоты»……………….20

3.1.Анализ предметной области………………………………………………...20

3.2. Проектирование БД методом нормальных форм…………………………21

3.3. Проектирование БД методом «сущность-связь»………………………….24

Глава 4. Реализация БД «Салона красоты» в СУБД MS Access……………. 30

4.1. Таблицы и запросы……………………………………………..…………..30

4.2. Отчеты и формы………………………………………...…………………..33

4.3. Макросы и модули.………………………………………………………….35

Заключение……………………………………………………………………….38

Список использованной литературы…………………………………………...39

Приложение...…………………………………………………………………….41

Введение

Данная тема курсовой является актуальной, так как в наше время необходимы хранилища, которые будут хранить в себе значительное количество информации, обрабатывать ее и предоставлять пользователю в удобном варианте. Информационные хранилища позволяют собрать в едином месте всю информацию, которая может понадобиться управляющему при принятии решения. Источниками данных для информационного хранилища служат в первую очередь данные из разрозненных транзакционных и учетных информационных систем, основанных на различных реляционных СУБД, которые обслуживают повседневную бизнес-деятельность. Источниками необходимой информации могут быть также газеты, радио, телевидение, интернет и любые другие. При этом предполагается, что данные предварительно должны быть приведены к единым стандартам, очищены от противоречий, структурированы и обобщены с требуемым уровнем детализации. Информационные хранилища служат исключительно для обработки и анализа информации, поэтому проектируются они таким образом, чтобы время выполнения запросов было минимальным. Изучением информационных хранилищ занимались многие исследователи. Среди отечественных ученных эту тему затрагивали в своих работах:С. Я. Архипенкова, B.C. Белова, Д. В. Голубева, В. И. Грекула,Г. Н. Денищенко, Н. T. Коровкиной, О. Б. Максименко, Г. Н. Смирновой,Ю. Ф. Тельнова, В. Чадаева, И. Шеметовой. Большой вклад в развитии теории информационных хранилищ внесли зарубежные исследователи: Б. Девлин, У. Инмон, Р. Кимпбалл, М. Росс, Э.Спирли

Объектом данной курсовой работы создание базы данных салона красоты для целей обоснованного принятия решений и построения управленческой и обязательной отчетности. Предметом курсовой работы является автоматизация работы фирмы и ведения бизнеса при помощи СУБД Microsoft Access. Целью теоретической части курсовой работы является раскрытие предназначения информационных хранилищ. В ходе работы в теоретической части мы ставим перед собой такие задачи:

– Изучение общих теоретических сведений об информационных хранилищах.

– Анализ свойств и компонентов информационного хранилища.

– Ознакомление с понятием интеграции данных.

Целью практической части курсовой работы является освоение методов проектирования баз данных в среде СУБД Microsoft Access и реализация проекта.

Задачи практической части курсовой работы:

– Освоение основ работы с Microsoft Access.

– Проектирование базы данных различными методами.

– Реализация базы данных в Microsoft Access.

В этой работе используются такие методы как «сущность–связь» и метод нормальных форм. Для достижения наших целей использовалась литература следующих авторов: Т.С. Карповой, А.Д. Хомоненко, Э.В. Фуфаева, В.И. Швецова и других.

Глава 1. Общие теоретические сведения об информационных хранилищах

1.1.Назначение информационного хранилища

Информационное хранилище (Data Warehousing) — это место хранения данных предприятия, предназначенное для упрощения принятия управленческих решений. Информационное хранилище включает в себя не только данные, но также инструменты, процедуры, обучение, персонал и другие ресурсы, облегчающие доступ к данным и делающие его более осмысленным для лиц, принимающих решения. Назначение информационного хранилища состоит в увеличении ценности информационных активов предприятия [15].Роль информационного хранилища заключается в том, чтобы хранить выдержки из рабочих данных и выдавать их пользователям в удобном формате. Это могут быть как выдержки из базы данных и файлов, так и отсканированные образы документов, записи, фотографии и другие данные. Информационные хранилища служат для хранения, комбинирования, агрегирования, преобразования и доставки данных пользователям с помощью средств анализа и принятия решений, таких как OLAP [10].Информационное хранилище считается новым этапом представления данных в рамках современных бизнес-процессов. Концепция информационных хранилищ предложена в 1990 году Уильямом Инмоном. По-иному информационное хранилище – есть предметно-ориентированный, интегрированный, неизменный, поддерживающий хронологию набор данных, предназначенный для поддержки принятия решений. В этом определении соединены две различные функции:

–сбор, организация, подготовка данных для анализа в виде постоянно наращиваемой базы данных;

–анализ, как элемент принятия решений.

Назначение информационного хранилища заключается в следующем:

–интеграция данных в масштабе бизнес-процессов;

–функционально-стоимостной анализ эффективности бизнес-процессов;

–сложные аналитические запросы в разрезах: виды услуг, клиенты, регионы, технологии;

–анализ данных в динамике и в сравнении с показателями отрасли. Основная цель информационного хранилища – сделать все значимые для управления бизнесом данные доступными в стандартизованной форме, пригодными для анализа и получения необходимых отчетов [7].

1.2.Свойства информационного хранилища

Уильям Инмон дал классическое определение информационного хранилища в 1990 г. Он охарактеризовал его как специальным образом администрируемую базу данных, содержимое которой имеет следующие свойства:

Предметная ориентация

Интегрированность данных

Инвариантность во времени

Неразрушаемость – стабильность информации

Минимизация избыточности информации

Предметная ориентация

В отличие от БД в традиционных OLTP-системах, где данные подобраны в соответствии с конкретными приложениями, информация в DW ориентирована на задачи поддержки принятия решений.. Для системы поддержки принятия решений требуются "исторические" данные - факты продаж за определенные интервалы времени. Хорошо спроектированные структуры данных DW отражают развитие всех направлений бизнеса компании во времени.

Поскольку в DW-технологии объекты данных выходят на первый план, то особые требования предъявляются к структурам БД, используемым для создания информационных хранилищ.. Принципиально отличаются и структуры баз данных для OLTP- и DW-систем. Во втором случае в них помещается только та информация, которая может быть полезной для работы систем поддержки принятия решений (DSS).

Интегрированность данных

Данные в информационное хранилище поступают из различных источников, где они могут иметь разные имена, атрибуты, единицы измерения и способы кодировки. После загрузки в DW данные очищаются от индивидуальных признаков, т. е. как бы приводятся к общему знаменателю. С этого момента они представляются пользователю в виде единого информационного пространства.

Если в четырех разных приложениях пол клиента кодировался четырьмя различными способами, то в информационном хранилище будет использована единая для всех данных схема кодировки (например, f,m).

Инвариантность во времени

В OLTP-системах истинность данных гарантирована только в момент чтения, поскольку уже в следующее мгновение они могут измениться в результате очередной транзакции. Важным отличием DW от OLTP-систем является то, что данные в них сохраняют свою истинность в любой момент процесса чтения.

В OLTP-системах информация часто модифицируется как результат выполнения каких-либо транзакций. Временная инвариантность данных в DW достигается за счет введения полей с атрибутом "время" (день, неделя, месяц) в ключи таблиц. В результате записи в таблицах DW никогда не изменяются, представляя собой снимки данных, сделанные в определенные отрезки времени. В DW содержатся как бы моментальные снимки данных. Каждый элемент в своем ключе явно или косвенно хранит временной параметр, например день, месяц или год.

Неразрушаемость - стабильность информации

В OLTP-системах записи могут регулярно добавляться, удаляться и редактироваться. В DW-системах, как следует из требования временной инвариантности, однажды загруженные данные теоретически никогда не меняются. По отношению к ним возможны только две операции: начальная загрузка и чтение (доступ). Это и определяет специфику проектирования структуры базы данных для DW. Если при создании OLTP-систем разработчики должны учитывать такие моменты, как откаты транзакций после сбоя сервера, борьба с взаимными блокировками процессов (deadlocks), сохранение целостности данных, то для DW данные проблемы не столь актуальны - перед разработчиками стоят другие задачи, связанные, например, с обеспечением высокой скорости доступа к данным.

Минимизация избыточности информации

Поскольку информация в DW загружается из OLTP-систем, возникает вопрос, не ведет ли это к чрезмерной избыточности данных? Нет, утверждает Билл Инмон. На самом деле избыточность минимальна (около 1%!), что объясняется следующими причинами:

  • при загрузке информации из OLTP-cистем в DW данные фильтруются. Многие из них вообще не попадают в DW, поскольку лишены смысла с точки зрения использования в системах поддержки принятия решений;

  • информация в OLTP-системах носит, как правило, оперативный характер, и данные, потеряв актуальность, удаляются. В DW, напротив, хранится историческая информация, и с этой точки зрения перекрытие содержимого DW данными OLTP- систем оказывается весьма незначительным;

  • в DW хранится некая итоговая информация, которая в базах данных OLTP-систем вообще отсутствует;

  • во время загрузки в DW записи сортируются, очищаются от ненужной информации и приводят к единому формату. После такой обработки это уже совсем другие данные.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]