- •Глава 1. Общие теоретические сведения об информационных хранилищах
- •1.1.Назначение информационного хранилища
- •1.2.Свойства информационного хранилища
- •1.3.Компоненты информационного хранилища
- •Глава 2. Проблемы, их решение и реализация информационных хранилищ
- •2.1.Проблемы интеграции данных
- •2.2.Реализация хранилищ и витрин данных
- •2.3.Подходы и имеющиеся решения
- •Informix Software
- •Глава 3. Проектирование реляционной базы данных «Салон красоты»
- •3.1. Анализ предметной области
- •3.2. Проектирование базы данных «Салон красоты» методом нормальных форм
- •2.3. Проектирование базы данных «Салон красоты» в соответствии с методом «сущность-связь»
- •Глава 4. Реализации базы данных «Салон красоты» в среде ms Access
- •4.1 Таблицы и запросы
- •4.2. Отчеты и формы
- •4.3 Макросы и модули
- •Заключение
- •Список использованной литературы:
- •Приложение
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Чувашский государственный университет имени И.Н. Ульянова»
Экономический факультет
Кафедра информационных систем
КУРСОВАЯ РАБОТА
по дисциплине «Базы данных»
на тему: «Информационные хранилища»
Выполнила: студентка 2 курса Преподаватель: к.э.н., доцент
|
Чебоксары
2014
Содержание
Введение……………………………………………………………….…………..3
Глава 1. Общие теоретические сведения об информационных хранилищах…5
1.1. Назначение информационного хранилища………………...……………….5
1.2. Свойства информационного хранилища……………………….…………...6
1.3. Компоненты информационного хранилища………………………………..9
Глава 2. Проблемы, их решение и реализация информационных хранилищ..11
2.1. Проблемы интеграции данных ………………………………………….....11
2.2. Реализация хранилищ и витрин данных……………………….…………..14
2.3. Подходы и имеющиеся решения…...………………..……………………..16
Глава 3. Проектирование реляционной БД «Салона красоты»……………….20
3.1.Анализ предметной области………………………………………………...20
3.2. Проектирование БД методом нормальных форм…………………………21
3.3. Проектирование БД методом «сущность-связь»………………………….24
Глава 4. Реализация БД «Салона красоты» в СУБД MS Access……………. 30
4.1. Таблицы и запросы……………………………………………..…………..30
4.2. Отчеты и формы………………………………………...…………………..33
4.3. Макросы и модули.………………………………………………………….35
Заключение……………………………………………………………………….38
Список использованной литературы…………………………………………...39
Приложение...…………………………………………………………………….41
Введение
Данная тема курсовой является актуальной, так как в наше время необходимы хранилища, которые будут хранить в себе значительное количество информации, обрабатывать ее и предоставлять пользователю в удобном варианте. Информационные хранилища позволяют собрать в едином месте всю информацию, которая может понадобиться управляющему при принятии решения. Источниками данных для информационного хранилища служат в первую очередь данные из разрозненных транзакционных и учетных информационных систем, основанных на различных реляционных СУБД, которые обслуживают повседневную бизнес-деятельность. Источниками необходимой информации могут быть также газеты, радио, телевидение, интернет и любые другие. При этом предполагается, что данные предварительно должны быть приведены к единым стандартам, очищены от противоречий, структурированы и обобщены с требуемым уровнем детализации. Информационные хранилища служат исключительно для обработки и анализа информации, поэтому проектируются они таким образом, чтобы время выполнения запросов было минимальным. Изучением информационных хранилищ занимались многие исследователи. Среди отечественных ученных эту тему затрагивали в своих работах:С. Я. Архипенкова, B.C. Белова, Д. В. Голубева, В. И. Грекула,Г. Н. Денищенко, Н. T. Коровкиной, О. Б. Максименко, Г. Н. Смирновой,Ю. Ф. Тельнова, В. Чадаева, И. Шеметовой. Большой вклад в развитии теории информационных хранилищ внесли зарубежные исследователи: Б. Девлин, У. Инмон, Р. Кимпбалл, М. Росс, Э.Спирли
Объектом данной курсовой работы создание базы данных салона красоты для целей обоснованного принятия решений и построения управленческой и обязательной отчетности. Предметом курсовой работы является автоматизация работы фирмы и ведения бизнеса при помощи СУБД Microsoft Access. Целью теоретической части курсовой работы является раскрытие предназначения информационных хранилищ. В ходе работы в теоретической части мы ставим перед собой такие задачи:
– Изучение общих теоретических сведений об информационных хранилищах.
– Анализ свойств и компонентов информационного хранилища.
– Ознакомление с понятием интеграции данных.
Целью практической части курсовой работы является освоение методов проектирования баз данных в среде СУБД Microsoft Access и реализация проекта.
Задачи практической части курсовой работы:
– Освоение основ работы с Microsoft Access.
– Проектирование базы данных различными методами.
– Реализация базы данных в Microsoft Access.
В этой работе используются такие методы как «сущность–связь» и метод нормальных форм. Для достижения наших целей использовалась литература следующих авторов: Т.С. Карповой, А.Д. Хомоненко, Э.В. Фуфаева, В.И. Швецова и других.
Глава 1. Общие теоретические сведения об информационных хранилищах
1.1.Назначение информационного хранилища
Информационное хранилище (Data Warehousing) — это место хранения данных предприятия, предназначенное для упрощения принятия управленческих решений. Информационное хранилище включает в себя не только данные, но также инструменты, процедуры, обучение, персонал и другие ресурсы, облегчающие доступ к данным и делающие его более осмысленным для лиц, принимающих решения. Назначение информационного хранилища состоит в увеличении ценности информационных активов предприятия [15].Роль информационного хранилища заключается в том, чтобы хранить выдержки из рабочих данных и выдавать их пользователям в удобном формате. Это могут быть как выдержки из базы данных и файлов, так и отсканированные образы документов, записи, фотографии и другие данные. Информационные хранилища служат для хранения, комбинирования, агрегирования, преобразования и доставки данных пользователям с помощью средств анализа и принятия решений, таких как OLAP [10].Информационное хранилище считается новым этапом представления данных в рамках современных бизнес-процессов. Концепция информационных хранилищ предложена в 1990 году Уильямом Инмоном. По-иному информационное хранилище – есть предметно-ориентированный, интегрированный, неизменный, поддерживающий хронологию набор данных, предназначенный для поддержки принятия решений. В этом определении соединены две различные функции:
–сбор, организация, подготовка данных для анализа в виде постоянно наращиваемой базы данных;
–анализ, как элемент принятия решений.
Назначение информационного хранилища заключается в следующем:
–интеграция данных в масштабе бизнес-процессов;
–функционально-стоимостной анализ эффективности бизнес-процессов;
–сложные аналитические запросы в разрезах: виды услуг, клиенты, регионы, технологии;
–анализ данных в динамике и в сравнении с показателями отрасли. Основная цель информационного хранилища – сделать все значимые для управления бизнесом данные доступными в стандартизованной форме, пригодными для анализа и получения необходимых отчетов [7].
1.2.Свойства информационного хранилища
Уильям Инмон дал классическое определение информационного хранилища в 1990 г. Он охарактеризовал его как специальным образом администрируемую базу данных, содержимое которой имеет следующие свойства:
Предметная ориентация
Интегрированность данных
Инвариантность во времени
Неразрушаемость – стабильность информации
Минимизация избыточности информации
Предметная ориентация
В отличие от БД в традиционных OLTP-системах, где данные подобраны в соответствии с конкретными приложениями, информация в DW ориентирована на задачи поддержки принятия решений.. Для системы поддержки принятия решений требуются "исторические" данные - факты продаж за определенные интервалы времени. Хорошо спроектированные структуры данных DW отражают развитие всех направлений бизнеса компании во времени.
Поскольку в DW-технологии объекты данных выходят на первый план, то особые требования предъявляются к структурам БД, используемым для создания информационных хранилищ.. Принципиально отличаются и структуры баз данных для OLTP- и DW-систем. Во втором случае в них помещается только та информация, которая может быть полезной для работы систем поддержки принятия решений (DSS).
Интегрированность данных
Данные в информационное хранилище поступают из различных источников, где они могут иметь разные имена, атрибуты, единицы измерения и способы кодировки. После загрузки в DW данные очищаются от индивидуальных признаков, т. е. как бы приводятся к общему знаменателю. С этого момента они представляются пользователю в виде единого информационного пространства.
Если в четырех разных приложениях пол клиента кодировался четырьмя различными способами, то в информационном хранилище будет использована единая для всех данных схема кодировки (например, f,m).
Инвариантность во времени
В OLTP-системах истинность данных гарантирована только в момент чтения, поскольку уже в следующее мгновение они могут измениться в результате очередной транзакции. Важным отличием DW от OLTP-систем является то, что данные в них сохраняют свою истинность в любой момент процесса чтения.
В OLTP-системах информация часто модифицируется как результат выполнения каких-либо транзакций. Временная инвариантность данных в DW достигается за счет введения полей с атрибутом "время" (день, неделя, месяц) в ключи таблиц. В результате записи в таблицах DW никогда не изменяются, представляя собой снимки данных, сделанные в определенные отрезки времени. В DW содержатся как бы моментальные снимки данных. Каждый элемент в своем ключе явно или косвенно хранит временной параметр, например день, месяц или год.
Неразрушаемость - стабильность информации
В OLTP-системах записи могут регулярно добавляться, удаляться и редактироваться. В DW-системах, как следует из требования временной инвариантности, однажды загруженные данные теоретически никогда не меняются. По отношению к ним возможны только две операции: начальная загрузка и чтение (доступ). Это и определяет специфику проектирования структуры базы данных для DW. Если при создании OLTP-систем разработчики должны учитывать такие моменты, как откаты транзакций после сбоя сервера, борьба с взаимными блокировками процессов (deadlocks), сохранение целостности данных, то для DW данные проблемы не столь актуальны - перед разработчиками стоят другие задачи, связанные, например, с обеспечением высокой скорости доступа к данным.
Минимизация избыточности информации
Поскольку информация в DW загружается из OLTP-систем, возникает вопрос, не ведет ли это к чрезмерной избыточности данных? Нет, утверждает Билл Инмон. На самом деле избыточность минимальна (около 1%!), что объясняется следующими причинами:
при загрузке информации из OLTP-cистем в DW данные фильтруются. Многие из них вообще не попадают в DW, поскольку лишены смысла с точки зрения использования в системах поддержки принятия решений;
информация в OLTP-системах носит, как правило, оперативный характер, и данные, потеряв актуальность, удаляются. В DW, напротив, хранится историческая информация, и с этой точки зрения перекрытие содержимого DW данными OLTP- систем оказывается весьма незначительным;
в DW хранится некая итоговая информация, которая в базах данных OLTP-систем вообще отсутствует;
во время загрузки в DW записи сортируются, очищаются от ненужной информации и приводят к единому формату. После такой обработки это уже совсем другие данные.