- •Тема № 6 базы данных
- •Введение.
- •2. История создания баз данных.
- •Нулевое поколение: менеджеры записей (4000 г. До н.Э. – 1900 г.)
- •Первое поколение: менеджеры записей (1900 г. – 1955 г.).
- •Второе поколение: программируемое оборудование обработки записей (1955 г. – 1970 г.)
- •Архитектура субд.
- •2.3. Третье поколение: оперативные сетевые базы данных (1965 г.–1980 г.)
- •2.3.1. Иерархические субд.
- •2.3.2. Сетевые базы данных.
- •2.4. Четвертое поколение: реляционные базы данных (1980 г. – 1995 г.).
- •2.4.1. Таблицы.
- •Office city region mgr target sales
- •2.4.2. Первичные ключи.
- •2.4.3. Отношения предок/потомок.
- •Office cyti region
- •Empl_num name age rep_office
- •2.4.4. Внешние ключи.
- •Лекция 6.2. Язык aql как стандартный язык базы данных.
- •5.1. Язык sql.
- •5.2. Роль sql.
- •5.3. Достоинства sql,
- •5.3.1. Независимость от конкретных субд.
- •5.3.2. Переносимость с одной вычислительной системы на другие.
- •5.3.3. Стандарты языка sql.
- •5.3.4. Протокол odbc и компания Microsoft.
- •5.3.5. Реляционная основа.
- •5.3.6. Высокоуровневая структура, напоминающая английский язык.
- •5.3.7. Интерактивные запросы.
- •5.3.8. Программный доступ к базе данных.
- •5.3.9. Различные представления данных.
- •5.3.10. Полноценный язык для работы с базами данных.
- •5.3.11. Динамическое определение данных.
- •5.3.12. Архитектура клиент/сервер.
- •5.4. Пятое поколение: мультимедийные базы данных (1995 г. - …)
- •5.5. Основные требования.
- •5.5.1. Расширяемость.
- •5.5.2. Производительность.
- •5.5.3. Сопровождение в оперативном режиме.
- •5.5.4. Устойчивость.
- •5.6. Технология хранения данных. Корпоративные базы данных.
- •5.6.1. Современные требования к корпоративным базам данных.
- •5.6.2. Потребность в анализе данных.
- •5.6.3. Хранилища данных.
- •5.6.4. Хранилища и киоски данных.
- •5.6.5. Анализ данных в корпоративных системах.
- •5.6.6. Размышления и предсказания.
5.6.2. Потребность в анализе данных.
Во всем мире организации накапливают или уже накопили в процессе своей деятельности большие объемы данных. Эти коллекции данных хранят в себе большие потенциальные возможности по извлечению новой, аналитической информации, на основе которой можно и необходимо строить стратегию фирмы, выявлять тенденции развития рынка, находить новые решения, обусловливающие успешное развитие в условиях конкурентной борьбы. Для некоторых фирм такой анализ является неотъемлемой частью их повседневной деятельности, но большинство, очевидно, только начинает приступать к нему всерьез.
Попытки строить системы принятия решений, которые обращались бы непосредственно к базам данных систем оперативной обработки транзакций (OLTP-систем), оказываются в большинстве случаев неудачными. Во-первых, аналитические запросы "конкурируют" с оперативными транзакциями, блокируя данные и вызывая нехватку ресурсов. Во-вторых, структура оперативных данных предназначена для эффективной поддержки коротких и частых транзакций и в силу этого слишком сложна для понимания конечными пользователями и, кроме того, не обеспечивает необходимой скорости выполнения аналитических запросов. В-третьих, в организации, как правило, функционирует несколько оперативных систем; каждая со своей базой данных. В этих базах используются различные структуры данных, единицы измерения, способы кодирования и т.д. Для конечного пользователя (аналитика) задача построения какого-либо сводного запроса по нескольким подобным базам данных практически неразрешима.
5.6.3. Хранилища данных.
Для того чтобы обеспечить возможность анализа накопленных данных, организации стали создавать хранилища данных, которые представляют собой интегрированные коллекции данных, которые собраны из различных систем оперативного доступа к данным. Хранилища данных становятся основой для построения систем принятия решений. Несмотря на различия в подходах и реализациях, всем хранилищам данных свойственны следующие общие черты:
- предметная ориентированность. Информация в хранилище данных организована в соответствии с основными аспектами деятельности предприятия (заказчики, продажи, склад и т.п.); это отличает хранилище данных от оперативной БД, где данные организованы в соответствии с процессами (выписка счетов, отгрузка товаров и т.п.);
- интегрированность. Исходные данные извлекаются из оперативных БД, проверяются, очищаются, приводятся к единому виду, в нужной степени агрегируются (то есть вычисляются суммарные показатели) и загружаются в хранилище. Такие интегрированные данные намного проще анализировать;
- привязка ко времени. Данные в хранилище всегда напрямую связаны с определенным периодом времени. Данные, выбранные из оперативных БД, накапливаются в хранилище в виде "исторических слоев", каждый из которых относится к конкретному периоду времени. Это позволяет анализировать тенденции в развитии бизнеса;
- неизменяемость. Попав в определенный "исторический слой" хранилища, данные уже никогда не будут изменены. Это также отличает хранилище от оперативной БД, в которой данные все время меняются, "дышат", и один и тот же запрос, выполненный дважды с интервалом в 10 минут, может дать разные результаты. стабильность данных также облегчает их анализ.