Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практическое_занятие_БД.doc
Скачиваний:
11
Добавлен:
07.09.2019
Размер:
97.79 Кб
Скачать

Базы данных и системы управления базами данных

Базы данных в структуре информационных систем

Информационная система представляет собой аппаратно-программный комплекс, обеспечивающий выполнение следующих функций:

  1. Ввод данных об объектах некоторой предметной области;

  2. Хранение и защита данных во внешней памяти вычислительной системы;

  3. Дополнение, удаление, изменение, сортировка и выборка введенных данных;

  4. Обобщение данных и составление нужных отчетов с предоставлением пользователю удобного интерфейса.

Структура данных – совокупность взаимосвязанных данных. Если эта структурированная совокупность данных относится к одной предметной области, то говорят о базе данных (БД).

Итак, база данных – это реализованная с помощью компьютера информационная структура (модель), отражающая состояние данных и их отношения между собой.

Характеристики баз данных:

  • Полнота – чем полнее БД, тем вероятнее, что она содержит нужную информацию.

  • Правильная организация – чем лучше структурирована БД, тем легче в ней найти необходимые сведения.

  • Актуальность – БД должна постоянно обновляться, т.е. в каждый момент соответствовать состоянию отражаемого ею объекта.

  • Удобство для использования – БД должна быть проста и удобна и иметь развитые методы доступа к любой части информации.

Жизненный цикл БД включает в себя следующие основные этапы:

  • Планирование разработки БД;

  • Определение требований к системе;

  • Сбор и анализ требований пользователей;

  • Проектирование базы данных: концептуальное проектирование БД (рассматривается предметная область, данных, их свойства и связи между ними); логическое проектирование БД; физическое проектирование БД;

  • Разработка приложений;

  • Реализация;

  • Загрузка данных и тестирование;

  • Эксплуатация и сопровождение.

СУБД – это комплекс программных средств и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.

Классификация баз данных и виды моделей данных

По технологии обработки данных базы подразделяются на централизованные и распределенные. Централизованная БД хранится в памяти одной вычислительной системы (машины). Распределенная база состоит из нескольких, возможно пересекающихся и даже дублирующих друг друга частей, хранимых в различных ЭВМ сети.

По способу доступа базы разделяются на базы данных с локальным доступом и базы данных с сетевым (удаленным) доступом.

На этапе концептуального проектирования применяются 2 методологии моделирования: семантическая (внимание уделяется структуре данных) и объектно-ориентированная (нацелена на описание поведения объектов данных и способов манипулирования ими). Сближение этих двух подходов привело к понятию объектно-ориентированных баз банных. Большинство существующих БД используют понятии и идеи объектно-ориентированных БД.

Основные составляющие предметной области баз данных:

  • Объект;

  • Средство;

  • Время;

  • Связь.

Объект – это то, о чем накапливается информация в БД и что может быть однозначно идентифицировано. Объекты могут быть атомарными и составными. Для составного объекта определяется его внутренняя структура.

Атрибут – это поименованная характеристика объекта, с помощью которой моделируется какое-то свойство объекта. Каждый объект имеет свои атрибуты, которые могут быть простыми и составными. Простые атрибуты не могут быть разделены на более мелкие.

Атрибуты, с помощью которых можно идентифицировать экземпляр объекта, называются ключами. В качестве ключей иногда можно использовать несколько атрибутов, один из которых выбирается в качестве первичного ключа. Идентификацию некоторых объектов приходится осуществлять с помощью составных ключей, которые включают несколько атрибутов.

Объекты могут быть связаны между собой. Существуют несколько типов связей.

Структурными элементами наиболее распространенных БД являются поля, записи и файлы.

Поле – элементарная единица логической организации данных, которая имеет имя, тип, длину, точность и соответствует неделимой единице информации – реквизиту.

Запись – совокупность логически связанных полей.

Файл – совокупность экземпляров записей одной структуры.

Другими словами, файл – это таблица, поле – столбец, запись – строка этой таблицы.

Имя поля1

Имя поля2

Имя поля3

Имя поля4

Основой СУБД являются два языка – язык описания данных (с его помощью программисты описывают структуру и содержимое баз данных) и язык манипулирования данными (средство, которое применяется пользователями для выполнения операций над данными, хранящимися в базе).

В основе любой БД лежит модель данных, т.е. информационная структура. Итак, модель данных – это некоторая абстракция, в которой отражаются самые важные аспекты функционирования выделенной предметной области. Основные модели баз данных: объектные, модели данных на основе записей, физические модели данных.

Наибольшее распространение получили модели на основе записей фиксированного формата и разных типов. Их подразделяют на: иерархические (упорядоченность элементов в записи, подчиненность объектов нижнего уровня объектам верхнего уровня, пример – каталог файлов, хранимых на диске, основные информационные единицы – сегмент (образуется из значений полей данных) и поле (наименьшая неделимая единица данных, доступная пользователю)), сетевые (отличаются большей гибкостью, сетевая структура представляет собой произвольный граф, каждый элемент может быть связан с любым другим элементом, произвольный граф состоит из вершин (узлов), соединенных ребрами, потомок в графе может иметь любое число предков) и реляционные (БД, содержащие информацию, организованную в виде прямоугольных таблиц, их отличает простота структуры данных, создатель реляционной модели – сотрудник фирмы IBM, английский математик Эдгар Франк Кодд, наиболее распространенная).

В целом иерархическая БД состоит из упорядоченного набора нескольких экземпляров одного типа дерево (ориентированный граф). При этом дерево обладает следующими свойствами:

  • Имеется только одна вершина графа – корень, в которую не заходит ни одно ребро;

  • В вершины н-ного уровня заходит одно ребро (н-1)-го уровня, исходят из этих вершин ноль, один или несколько порожденных вершин, называемых потомками;

  • Единственный проход к порожденной вершине лежит через ее исходную вершину;

  • Каждый потомок имеет только одного предка;

  • Нет замкнутых петель и циклов;

  • Сегмент, у которого нет потомков, называется листовым сегментом.

Основные типы структур данных в сетевых моделях – элементы данных, агрегаты данных, записи и наборы. Элемент данных – это наименьшая поименованная информационная единица данных, доступная пользователю. Агрегат – совокупность элементов данных внутри записи. Запись – конечный уровень композиции элементов данных. Тип записи – совокупность логически связанных экземпляров записей. Наборы выражают связи между типами записей.

Свойства сетевого графа БД:

  • БД может содержать любое количество наборов и записей;

  • Между двумя типами записей может быть любое количество наборов.

Недостаток сетевой модели – сложность ее реализации.

К настоящему времени основными недостатками реляционной технологии являются:

  • Ограниченность реляционных БД при использовании в системах автоматического проектирования (САПР), в которых используются очень сложные структуры.

  • Ограниченные возможности адекватного отражения семантики предметной области.

Итак, реляционная БД – это конечный набор отношений. Каждое отношение – это двумерная таблица, состоящая из строк и столбцов, причем строки соответствуют записям, а столбцы атрибутам. Атрибут – поименованный столбец отношения. Свойства объекта, его характеристики определяются значениями атрибутов. Отношение – не любая таблица, а лишь та, которая обладает определенными свойствами.

Свойства реляционной таблицы:

  • Каждый элемент таблицы – один элемент данных;

  • Все столбцы однородны, т.е. все элементы в столбце имеют одинаковый тип и длину;

  • Каждый столбец имеет уникальное имя;

  • Одинаковые строки в таблице отсутствуют;

  • Порядок следования строк и столбцов произвольный.

Основные свойства полей БД на примере реляционной CУБД Microsoft Access:

  • Имя поля – определяет обращение к данным этого поля, используется в качестве заголовков столбцов таблиц;

  • Тип поля – определяет тип данных, содержащихся в данном поле;

  • Размер поля – задает предельную длину поля (в символах);

  • Формат поля – определяет способ форматирования данных в адресах памяти, принадлежащих полю;

  • Значение по умолчанию – это значение вводится в адрес поля автоматически и является средством автоматизации ввода данных;

  • Условие на значение – ограничение, используемое для проверки правильности ввода данных;

  • Сообщение об ошибке – текстовое сообщение, выдаваемое при попытке ввода в поле ошибочных данных;

  • Обязательное поле – свойство, определяющее обязательность заполнения данных этого поля;

  • Индексированное поле – свойство, ускоряющее операции по поиску и сортировке записей и проверяющее записи на наличие дублирования данных.

Основные типы данных: текстовый, поле MEMO (для хранения больших объемов текста), числовой, дата/время, денежный, счетчик (для порядковой нумерации записей), логический (для хранения логических величин), поле объекта OLE (для хранения мультимедийных объектов, гиперссылка (для хранения адресов Web-объектов Интернета).

Нормализация отношений в реляционных БД

Простой ключ (ключевое поле) – поле, каждое значение которого однозначно определяет соответствующую запись. Если записи однозначно определяются значениями нескольких полей, то такая таблица БД имеет составной ключ. Чтобы связать 2 реляционные таблицы, необходимо ключ первой ввести в состав ключа второй таблицы.

БД, состоящая из трех связанных таблиц:

СТУДЕНТ (номер зачетной книжки, Ф., И., О., дата рождения, группа)

СЕССИЯ (номер зачетной книжки, оценка 1, оценка 2, оценка 3, оценка 4, результаты сдачи сессии)

СТИПЕНДИЯ (результаты сдачи сессии, размер стипендии)

В реляционных БД определены три типа связей:

Один к одному (1:1) – любая запись в таблице может быть связана только с одной записью второй таблицы и наоборот.

Один ко многим (1:М) – любая запись первой таблицы связана с несколькими записями второй, но любая запись во второй таблице связана только с одной записью первой таблицы.

Многие ко многим (М:М) – каждой записи первой таблицы соответствуют несколько записей второй и наоборот.

Нормализация отношений – формальный аппарат ограничений на формирование таблиц, который позволяет устранить дублирование, обеспечивает непротиворечивость хранимых в базе данных, уменьшает трудозатраты на ведение БД.

Различают 6 нормальных форм:

1НФ – первая нормальная форма;

2НФ – вторая нормальная форма;

3НФ – третья нормальная форма;

Первые три формы ограничивают зависимость не первичных атрибутов от ключей.

НФБК – нормальная форма Бойса-Кодда – ограничивает зависимость первичных атрибутов;

4НФ – четвертая нормальная форма – формирует ограничения на виды многозначных зависимостей;

5НФ – пятая нормальная форма – вводит другие типы зависимостей: зависимости соединения.

Отношение называется нормализованным или приведенным к первой нормальной форме, если все его атрибуты простые, т.е. неделимы.

Отношение, у которого первичный ключ включает только один атрибут, всегда находится во 2НФ.

Функциональная зависимость – это зависимость, при которо1 в экземпляре информационного объекта определенному значению ключевого поля соответствует только одно значение не ключевого поля.

Функционально полная зависимость – каждое не ключевое поле функционально зависит от ключа, но не зависит ни от какой части составного ключа.

Транзитивная зависимость – наблюдается, если одно из двух описательных полей зависит от ключа, а другое описательное зависит от первого поля.

Этапы проектирования БД:

  • Анализ предметной области;

  • Проектирование и кодирование БД;

  • Тестирование и сопровождение.

Примеры СУБД: Microsoft Visual FoxPro, Microsoft SQL Server, Microsoft Access.

Впервые Microsoft Access 1.0 была представлена в ноябре 1992 года.

Всю базу данных Microsoft Access хранит на диске в виде одного файла с расширением mbd. Данные хранятся в виде таблиц-отношений.

Типичными операциями в СУБД Microsoft Access являются:

  • Работа с таблицами (создание, модификация, удаление таблиц, модификация схем взаимодействия таблиц);

  • Ввод данных в таблицы непосредственно или с помощью форм, проверка вводимых данных;

  • Поиск данных в таблицах по определенным критериям (выполнение запросов);

  • Создание отчетов о содержимом базы данных.

При создании новой БД появляется окно базы данных. С помощью вкладки Объекты можно выбрать тип нужного объекта (Таблицы, Запросы, Формы, Отчеты, Макросы, Модули).

Таблицы – это объекты, которые определяются и используются для хранения данных. Новую таблицу можно создать тремя способами:

  • В режиме конструктора;

  • С помощью мастера;

  • Путем ввода данных.

Запрос – это объект, позволяющий пользователю получить нужные данные из одной или нескольких таблиц. Запросы являются главным инструментом управления базами данных.

Форма – объект, предназначенный для удобного отображения данных из одной или нескольких таблиц – это формат (бланк) показа данных на экране компьютера. В форму могут быть внедрены рисунки, диаграммы, аудио (звук) и видео (изображение).

Отчет – это объект, предназначенный для создания документа, который впоследствии может быть распечатан или включен в документ другого приложения.

Макрос – это объект, представляющий собой структурированное описание одного или нескольких действий, которые выполняет Access в ответ на определенное событие.

Модуль – это объект, содержащий программы на языке MS Access Basic. Эти программы выполняют мелкие вспомогательные действия, из которых состоит процесс работы в базе данных.