Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
бд / Лекции 1-2.docx
Скачиваний:
65
Добавлен:
14.05.2015
Размер:
89.33 Кб
Скачать

Xml-серверы

Используя технологии XML, можно производить обмен данными между различными приложениями на различных платформах. Поэтому организации переходят на хранение своих данных в формате XML, чтобы пользоваться преимуществами XML-технологий. Хранение данных в этом формате улучшает доставку и масштабируемость Ваших приложений при низких управленческих и эксплуатационных расходах.

В традиционных реляционных базах данных данные хранятся в виде строк и столбцов, что может быть слишком сложным. Но в случае XML сервера эта сложность устранена и здесь можно хранить любые данные, включая мультимедийные файлы и даже реляционные данные. XML-сервер – это любой сервер, выходным продуктом для которого является документ XML, который может использоваться другими приложениями для обработки.

Мультимедийные БД - Мультимедиа — это взаимодействие визуальных и аудиоэффектов под управлением интерактивного программного обеспечения с использованием современных технических и программных средств, они объединяют текст, звук, графику, фото, видео в одном цифровом представлении.

Коммерческие базы данных представляют собой базы данных, специально предназначенные для продажи пользователям. Эти БД могут передаваться пользователям на машинных носителях либо к ним может обеспечиваться доступ в режиме «он-лайн».  С некоторой степенью условности рынок электронной информации можно разделить на три крупных сектора:

• сектор деловой информации;

• сектор профессиональной (патентной, научно-технической и т. п.) информации;

• сектор массовой потребительской информации.

Каждый из секторов имеет своих потребителей, предъявляет специфические требования к актуальности и точности информации и, как следствие, к языковым, программным и техническим средствам поддержки данных.

Тематический охват коммерческих баз данных практически безграничен, а их пользователем может быть практически каждый: в процессе своей профессиональной деятельности каждый индивид может быть потребителем или поставщиком информации первых двух секторов, а в повседневной жизни — пользователем информации третьего сектора.

Классификация моделей баз данных

В классической теории баз данных, модель данных есть формальная теория представления и обработки данных в системе управления базами данных (СУБД), которая включает, по меньшей мере, три аспекта:

1) аспект структуры: методы описания типов и логических структур данных в базе данных;

2) аспект манипуляции: методы манипулирования данными;

3) аспект целостности: методы описания и поддержки целостности базы данных.

Аспект структуры определяет, что из себя логически представляет база данных, аспект манипуляции определяет способы перехода между состояниями базы данных (то есть способы модификацииданных) и способы извлечения данных из базы данных, аспект целостности определяет средства описаний корректных состояний базы данных.

  1. Иерархические базы данных могут быть представлены как дерево, состоящее из объектов различных уровней. Верхний уровень занимает один объект, второй — объекты второго уровня и т. д.

Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении предка (объект более близкий к корню) к потомку (объект более низкого уровня), при этом возможна ситуация, когда объект-предок не имеет потомков или имеет их несколько, тогда как у объекта-потомка обязательно только один предок.

  1. Сетевая модель данных По сути, это расширение иерархической структуры. Все то же самое, но существует связь "многие ко многим". Сетевая структура базы данных позволяет нам добавить группы в наш пример. Недостатком сетевой модели является сложность разработки серьезных приложений.

  1. Реляционная модель данных

Реляционная модель была разработана в конце 1960-х годов Эдгаром Франком Коддом (сотрудник IBM) и опубликована в 1970 г. Она определяет способ представления данных (структуру данных), методы защиты данных (целостность данных), и операции, которые можно выполнять с данными (манипулирование данными).

Основные принципы реляционных баз данных:

·        все данные на концептуальном уровне представляются в виде отношений (relation) - таблиц.

·        все значения являются скалярами. Это значит, что для любой строки и столбца любого отношения существует одно и только одно значение;

·        все операции выполняются над таблицами и результатом этих операций также является таблица. Этот принцип называется замыканием. Поэтому результаты одной операции (например, запроса), можно использовать в качестве исходных данных для выполнения другой операции (подзапроса).

Основные термины:

·        отношение (relation) - это вся структура целиком, набор записей (в обычном понимании - таблица).

·        кортеж - это каждая строка, содержащая данные. Более распространенный, но менее формальный термин - запись.

·        мощность - число кортежей в отношении (проще говоря, число записей);

·        атрибут - это столбец в отношении;

·        размерность - это число атрибутов в отношении;

·        каждое отношение можно разделить на две части - заголовок и тело. На простом языке заголовок отношения - это список столбцов, а тело - это сами записи (кортежи).

Схема отношения (заголовок отношения)Представляет собой список имен атрибутов. Пример схемы отношения Сотрудники(ИД_Код, ФИО, Отдел, Должность)

·        тело отношения состоит из неупорядоченного набора кортежей (его число может быть любым - от 0 до бесконечно большого).

Ключом отношения или ключевым атрибутом называется атрибут отношения, однозначно идентифицирующий каждый из его кортежей.

Ключ может состоять из нескольких атрибутов, тогда такой ключ называется сложным составным.

Свойства отношения:

  1. В таблице нет двух одинаковых строк;

  2. Все кортежи в одном отношении должны иметь одну структуру, соответствующую именам и типам атрибутов;

  3. Каждый атрибут в отношении имеет уникальное имя;

  4. Порядок следования кортежей в отношении произволен.

  1. Объектно-ориентированная база данных (ООБД) —база данных, в которой данные моделируются в виде объектов, их атрибутов, методов и классов.

Появление объектно-ориентированных СУБД вызвано потребностями программистов на ОО-языках, которым были необходимы средства для хранения объектов, не помещавшихся в оперативной памяти компьютера. Также важна была задача сохранения состояния объектов между повторными запусками прикладной программы. Поэтому, большинство ООСУБД представляют собой библиотеку, процедуры управления данными которой включаются в прикладную программу. Примеры реализации ООСУБД как выделеного сервера базы данных крайне редки. Пример – СУБД ObjectStore.

Эволюция концепции баз данных

Базы данных в своем развитии прошли шесть поколений. Вначале данные обрабатывались вручную. Затем появилось оборудование с перфокартами и электромеханические машины для сортировки и табулирования миллионов записей. Позже данные стали хранить на магнитных лентах, и сохраняемые программы выполняли пакетную обработку последовательных файлов. На следующем этапе развития появилось понятие «схемы» базы данных и оперативного навигационного доступа к данным. Затем был обеспечен автоматический доступ к реляционным базам данных и внедрены распределенная и клиент-серверная обработки.

Сегодня перед нами шестое поколение информационных систем (баз данных), которые хранят большие массивы данных - документы, графические, звуковые и видеообразы. Эти системы шестого поколения представляют со-бой базовые средства хранения для приложений Internet и intranet.

Первое поколение - менеджеры записей (с IV тысячелетия до н. э.), например учет царской казны и налогов в Шумере.

Второе поколение - менеджеры записей (1800-1955 гг.). Автоматизированная обработка информации началась С появлением технологии записи информации на перфокартах и впервые была широко использована при переписи населения в США в 1890 г. Тогда-то появилась и компания по производству оборудования для записи информации на перфокарты, которая впоследствии получила название IBM.

Третье поколение - программируемое оборудование обработки записей (1955-1970 гг.). Электронные компьютеры могли обрабатывать сотни записей в секунду. Ключевым компонентом в этой новой технологии стало программное обеспечение. Стали появляться стандартные пакеты для таких общеупотребительных бизнес-приложений, как общая бухгалтерия, расчет заработной платы.

Четвертое поколение - оперативные сетевые базы данных (1965-1980 гг.). Для таких приложений, как ведение операций на фондовой бирже или резервирование билетов, требуется знание текущей информации и немедленный доступ к ней.

Пятое поколение - реляционные базы данных и архитектура «клиент-сервер» (1980-1995 гг.). Реляционная модель данных, когда все данные хранятся в таблицах, связанных между собой по ключевому полю, обладает унифицированным языком для определения данных, навигации по данным и манипулирования ими, а не отдельными языками для каждой из этих задач. Эта реляционная модель имеет много других преимуществ.

Шестое поколение - мультимедийные базы данных (с 1995 г.). До появления этого поколения существовало четкое разделение программ и данных. И этот подход хорошо работал, пока речь шла о таких данных, как числа, символы, списки. Но скоро данные стали представлять сложные объекты типа «графический образ», «звук», их обработка потребовала новых подходов и программ. Произошел переход от традиционных баз данных, хранящих числа и символы, к базам данных, в которых каждая запись может содержать данные со сложным поведением.

Основные этапы проектирования БД:

Концептуальное (инфологическое) проектирование — построение семантической модели предметной области, то есть информационной модели наиболее высокого уровня абстракции. Такая модель создаётся без ориентации на какую-либо конкретную СУБДимодель данных. Термины «семантическая модель», «концептуальная модель» и «инфологическая модель» являются синонимами. Кроме того, в этом контексте равноправно могут использоваться слова «модель базы данных» и «модель предметной области» (например, «концептуальная модель базы данных» и «концептуальная модель предметной области»), поскольку такая модель является как образом реальности, так и образом проектируемой базы данных для этой реальности.

Конкретный вид и содержание концептуальной модели базы данных определяется выбранным для этого формальным аппаратом. Обычно используются графические нотации, подобные ER-диаграммам.

Чаще всего концептуальная модель базы данных включает в себя:

описание информационных объектов, или понятий предметной области и связей между ними.

описание ограничений целостности, т.е. требований к допустимым значениям данных и к связям между ними.

Логическое (даталогическое) проектирование— создание схемы базы данныхна основе конкретноймодели данных, например,реляционной модели данных. Для реляционной модели данных даталогическая модель — набор схемотношений, обычно с указаниемпервичных ключей, а также «связей» между отношениями, представляющих собойвнешние ключи.

Преобразование концептуальной модели в логическую модель, как правило, осуществляется по формальным правилам. Этот этап может быть в значительной степени автоматизирован.

На этапе логического проектирования учитывается специфика конкретной модели данных, но может не учитываться специфика конкретной СУБД.

Физическое проектирование—создание схемы базы данныхдля конкретнойСУБД. Специфика конкретной СУБД может включать в себя ограничения на именование объектов базы данных, ограничения на поддерживаемые типы данных и т.п. Кроме того, специфика конкретной СУБД при физическом проектировании включает выбор решений, связанных с физической средой хранения данных (выбор методов управления дисковой памятью, разделение БД по файлам и устройствам, методов доступа к данным), создание индексов и т.д.

Жизненный цикл БД

1. Исследование и анализ проблемы, для решения которой создаётся база данных.

2. Построение Инфологической и Даталогической модели.

3. Нормализация полученных Инфологических и Даталогических моделей. По окончании этого этапа, как правило получают заготовки таблиц БД и набор связей между ними (первичные и вторичные ключи)

4. Проверка целостности БД

5. Выбор физического способа хранения и эксплуатации (тех. средства) базы данных.

6. Проектирование входных и выходных форм.

7. Разработка интерфейса приложения.

8. Функциональное наполнение приложения

9. Отладка: проверка на корректность работы функционального наполнения системы

10. Тестирование: тест на корректность ввода вывода данных, тест на максимальное количество активных сессий и т. д.

11. Ввод в эксплуатацию: отладка ИТ-инфраструктуры, обучение пользователей и ИТ-персонала.

12. При необходимости добавления выходных форм и дополнительной функциональности. В случае если необходимы более серьёзные изменения, следует повторить все шаги с первого.

13. Вывод из эксплуатации: перенос данных в новую СУБД.

Лекция 2. Работа с SQL сервером и его компонентами

Microsoft SQL Server — система управления реляционными базами данных (СУБД), разработанная корпорацией Microsoft. Основной используемый язык запросов — Transact-SQL, создан совместно Microsoft и Sybase. Используется для работы с базами данных размером от персональных до крупных баз данных масштаба предприятия; конкурирует с другими СУБД в этом сегменте рынка.

SQL Server 2008 распространяется в 4 основных версиях:

Workgroup – Standard –Enterpise – Developer

Compact Edition - для использования на мобильных устройствах.

Express Edition – для небольших серверных приложений. Бесплатна, может распространяться с приложениями независимых разработчиков. Используется в приложениях, при проектировании или для самостоятельного изучения. Нет никаких препятствий для дальнейшего развёртывания накопленной базы данных на MS SQL Server неэкспрессной версии.

Ограничения:

- 1 поддерживаемый процессор

- 1 Гб ОЗУ

- 4 Гб максимальный размер базы

СУБД может поддерживать одну или одновременно несколько БД. Приложение может работать либо с одной БД либо одновременно с несколькими. Разработчики разрешают использование одновременно нескольких версий SQL Server на одном компьютере.

Основные компоненты

Все компоненты Microsoft SQL Server 2008 запускаются из меню "Пуск \ Программы \ Microsoft SQL Server 2008. В Microsoft SQL Server 2008 входят следующие компоненты:

Компоненты сервера

Описание

SQL Server Database Engine 

В состав компонента SQL Server Database Engine входит компонент Database Engine, основная служба для хранения, обработки и обеспечения безопасности данных, репликации, полнотекстового поиска и средств управления реляционными и XML-данными.

Службы Analysis Services 

Службы Службы Analysis Services содержат средства создания и управления приложениями оперативной аналитической обработки (OLAP) и приложениями интеллектуального анализа данных.

Службы Reporting Services

Службы Службы Reporting Services включают в себя серверные и клиентские компоненты для создания, управления и развертывания табличных, матричных и графических отчетов, а также отчетов в свободной форме. Службы Службы Reporting Services являются расширяемой платформой, которую можно использовать для разработки приложений отчетов.

Integration Services 

Службы Integration Services представляют собой набор графических средств и программируемых объектов для перемещения, копирования и преобразования данных.

Средства управления

Описание

Среда SQL Server Management Studio

Среда Среда SQL Server Management Studio — это интегрированная среда для доступа, настройки, управления, администрирования и разработки всех компонентов SQL Server. Среда Management Studio позволяет разработчикам и администраторам, обладающим различными уровнями навыков, использовать SQL Server. Обозреватель Internet Explorer 6 с пакетом обновления 1 или более поздней версии необходим для любой установки среды Management Studio.

Диспетчер конфигурации SQL Server

Диспетчер конфигурации SQL Server обеспечивает базовые возможности управления конфигурациями для служб, серверных протоколов, клиентских протоколов и псевдонимов клиентов SQL Server.

Приложение SQL Server Profiler

Приложение Приложение SQL Server Profiler предоставляет графический пользовательский интерфейс для наблюдения за экземпляром компонента Database Engine или служб Службы Analysis Services.

Помощник по настройке ядра СУБД (Database Engine)

Помощник по настройке ядра СУБД (Database Engine) помогает создавать оптимальные наборы индексов, индексированных представлений и секций.

Business Intelligence Development Studio

Среда Business Intelligence Development Studio представляет собой интегрированную среду разработки для решений служб Службы Analysis Services, Службы Reporting Services и Integration Services. Обозреватель Internet Explorer 6 с пакетом обновления 1 или более поздней версии необходим для любой установки среды BI Development Studio.

Компоненты связи

Устанавливает компоненты для связи между клиентами и серверами и сетевые библиотеки для DB-библиотеки, ODBC и OLE DB.

SQL Server Management Studio - графическая оболочка для управления сервером и разработки баз данных. Включает в себя редактор скрипта и графическую программу, которая работает с объектами и настройками сервера. Главным инструментом SQL Server Management Studio является Object Explorer, который позволяет пользователю просматривать, извлекать, и полностью управлять объектами сервера. Также есть SQL Server Management Studio Express для Express версии сервера.

Работа СУБД обеспечивается с помощью системных БД.

Системная база данных

Описание

База данных master

В этой базе данных хранятся все данные системного уровня для экземпляра SQL Server.

База данных msdb

Используется агентом SQL Server для планирования предупреждений и задач.

База данных model

Используется в качестве шаблона для всех баз данных, создаваемых в экземпляре SQL Server. Изменение размера, параметров сортировки, модели восстановления и других параметров базы данных model приводит к изменению соответствующих параметров всех баз данных, создаваемых после изменения.

База данных resource

База данных только для чтения. Содержит системные объекты, которые входят в состав SQL Server. Системные объекты физически хранятся в базе данных Resource, но логически отображаются в схеме sys любой базы данных.

База данных tempdb

Рабочее пространство для временных объектов или взаимодействия результирующих наборов.

Каждая база данных SQL Server имеет как минимум два рабочих системных файла: файл данных и файл журнала. Файлы данных содержат данные и объекты, такие как таблицы, индексы, хранимые процедуры и представления. Файлы журнала содержат сведения, необходимые для восстановления всех транзакций в базе данных. Файлы данных могут быть объединены в файловые группы для удобства распределения и администрирования.