- •1. Распределённые базы данных: основные понятия.
- •2. Аспекты сетевого взаимодействия (необходимые условия функционирования сурбд).
- •3. Свойства ddb: локальная автономия, независимость узлов, непрерывные операции, обработка распределённых транзакций.
- •4. Свойства ddb: обработка распределённых запросов, прозрачность расположения, прозрачная фрагментация, прозрачное тиражирование.
- •5. Свойства ddb: независимость от оборудования, независимость от операционных систем, прозрачность сети, независимость от баз данных.
- •6. Обработка и оптимизация запросов.
- •7. Управление одновременным доступом.
- •8. Целостность данных и протоколы обеспечения надежности.
- •9. Технология тиражирования данных
- •10. Масштабируемость (расширяемость)
- •11. Производительность
- •12. Cмешанная загрузка субд (olcp). Развитие архитектуры серверов бд
- •13. Постоянная доступность данных.
- •14. Параллельные системы баз данных: общее понятие.
- •15. Цели и параметры параллелизма: ускорение и расширяемость.
- •16. Аппаратная архитектура.
- •17. Параллелизм внутри реляционных операторов.
12. Cмешанная загрузка субд (olcp). Развитие архитектуры серверов бд
До недавнего времени выдеялось 3 класса задач:
- задачи оперативной обработки транзакции (OLTP – Online Translation Processing).
- задачи пакетной обработки (Batch processing).
- задачи принятия решений (DSS – Decision Support System).
Для каждого из этих классов задач предполагается своя настройка сервера, но эволюция движется в направлении объединения всех 3х классов задач. Одновременное их выполнение носит название Оперативной Сложной Обработки Данных (OLCP).
Основными критическими факторами в платформе OLCP являются архитектура сервера БД. К архитектурам современной СУБД предъявляют 4 требования:
1) Масштабируемость.
Это свойство системы, допускающее предсказуемую поддержку дополнительных пользователей, более высокую производительность и пропускную способность путем добавления вычислительных ресурсов без применения приложений и административного сопровождения.
2) Производительность.
Существует 2 основных метода повышения производительности:
Многопроцессорная обработка с помощью процессов типа “thread”(тредов или нитей).
Поддержка параллелизма.
3) Обеспечение постоянной доступности данных.
Основными характеристиками доступности являются:
Оперативное администрирование в режиме онлайн.
Функциональная насыщенность (устойчивость) СУБД.
Это множество механизмов используемых серверами БД для уменьшения последствий системного сбоя и повышения прозрачности доступа к дублированным данным в программных условиях.
4) Возможность смешанной загрузки различными типами задач.
Управление ресурсами, оптимизации и администрирование гибридной системы (OLCP) гораздо сложнее, чем в системе, ориентированной на решение задач одного класса.
Сервер оперативной обработки транзакций строится предположениями:
OLTP операции поддерживают большое число пользователей.
Наиболее часто используются короткие простые транзакции.
Обычно транзакции не используют одинаковые данные.
Операторы обычно затрагивают небольшое число строк.
Время отклика – доли секунды.
Только несколько таблиц имеют большие размеры или могут быть изменены.
Реализация такого сервера опирается на:
Физические методики сохранения операций с дисками.
Обработку небольших объемов данных в памяти.
Примитивный оптимизатор запросов.
Требование к приложениям – исключить конкуренцию запросов в использовании ресурсов и данных.
Для сервера системы принятия решений (DSS) выдвигают требования:
Небольшое число пользователей.
Большие и сверхбольшие размеры таблиц.
Часто требуется просмотр всех строк таблицы.
Число таблиц, участвующих в транзакции может быть велико.
Обычно транзакции не модифицируют данные.
Высокая вероятность разделения ресурсов разными задачами.
Процесс запроса может быть интерактивным, т.е. ответ на вопрос может использоваться при формировании следующего запроса.
В результате необходимо:
Мощный оптимизатор.
Эффективные методики сканирования и соединения таблиц.
Совершенные механизмы обеспечения параллельного доступа к данным.
Сервер, ориентированный на пакетную обработку основывают на предположениях:
Небольшое число пользователей.
Большие и сверхбольшие размеры таблиц.
Продолжительность транзакций может быть велика.
Часто требуется просмотр и модификация всех строк таблицы.
Высокая загрузка процессора и заполнения оперативной памяти.
Одновременный запуск небольшого числа задач.
Основные факторы, обеспечивающие эффективную реализацию системы (OLCP):
Оптимизация запросов.
Параллельная обработка запросов.
Эффективное управление ресурсами.