Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика Учебник НГТУ Семестр 2.docx
Скачиваний:
87
Добавлен:
27.03.2015
Размер:
4.01 Mб
Скачать

36.1. Основные понятия бд

35.2. Классификация БД

36.2. Основные понятия реляционной модели БД

Понятие об информации как о знании, сложилось уже давно. Человек создал естественные ИС, позволяющие снабжать информацией процессы производства, планирования, принятия решений. Мы будем понимать под информацией любые сведения о каком-либо событии, сущности, процессе. Наряду с понятием информации часто употребляют понятие «Данные».

Понятие «данные» в концепции баз данных – это набор конкретных значений, параметров, характеризующих объект, условие, ситуацию или любые другие факторы в числовой, текстовой, графической, звуковой форме.

Например, «Петров Николай 1989 СТ-91». Сказать, что эти данные представляют собой информацию, нельзя, т.к. непонятно, что, например, означает в этих данных «1989». Но, если придать этим данным определенную форму и вписать их в некоторую структуру, то все станет ясно:

Таблица 36.1

Ф.И.О. студента

Год рождения

Группа

Петров Николай

1989

СТ-91

Вывод: Данные не обладают определенной структурой, данные становятся информацией тогда, когда пользователь задает им определенную структуру, т.е. осознает их смысловое содержание. Поэтому центральным понятием в концепции баз данных является понятие модели данных. Модель данных – схема (порядок, совокупность принципов, система) организации данных в единое целое для создания, накопления, обработки и управления. Это некоторая абстракция, которая, будучи приложена к конкретным данным, позволяет пользователям и разработчикам трактовать их уже как информацию, т.е. сведения, содержащие не только данные, но и взаимосвязи между ними. Следовательно, данные, вписанные в определенную модель, можно назвать информацией. Модель данных – совокупность структур данных и операций по их обработке. В теории баз данных рассматриваются модели данных трех уровней – уровень представлений пользователя (внешний), концептуальные модели, физические (внутренние) модели.

Совокупность данных, представленных предметной областью и предназначенных для совместного применения, называется БД. С позиций моделирования источник информации называют предметной областью, а используемую знаковую систему (способ абстрагирования предметной области) – моделью данных (МД). Описание предметной области в терминах выбранной модели данных называют концептуальной схемой предметной области. Модели данных бывают разных видов. При проектировании БД традиционно используются концептуальные модели трех видов: иерархическая, сетевая и реляционная. В современных СУБД наиболее часто используется реляционная модель. Рассмотрим ее основные понятия.

35.2. Классификация БД

36.2. Основные понятия реляционной модели БД

36.2. Основные понятия реляционной модели бд

36.1. Основные понятия БД

36.3. Предпроектное обследование предметной...

Для понимания того, как выглядит концептуальная модель в случае использования реляционной модели данных, рассмотрим основных понятия реляционной модели данных.

Любую структуру данных можно преобразовать в двумерную таблицу. Такое представление данных является наиболее удобным и для пользователя, и для ЭВМ – подавляющее число современных ИС работает именно с такими таблицами. БД, состоящие из двумерных таблиц, называются реляционными (от английского слова relation – отношение).

Основная идея реляционного подхода состоит в том, чтобы представить произвольную структуру данных в виде простой двумерной таблицы. Теория реляционных БД – это сложная математическая дисциплина. Основная терминология БД зависит от уровня описания, конкретного класса системы и категории пользователей. В таблице … приведены основные термины, характерные для всех вышеперечисленных уровней.

Таблица 36.2

Теория БД

Реляционные БД

Термины конкретной СУБД (например, ACCESS)

Отношение

Таблица

Таблица

Кортеж

Строка

Строка

Атрибут

Столбец

Поле

Совместно с термином «атрибут» часто употребляется термин «Домен».

Домен – определяется заданием некоторого базового типа данных, к которому относятся элементы домена, и произвольного логического выражения применяемого к типу данных. Другими словами, домен – допустимое потенциальное множество значений данного типа. Другими словами, домен – это множество допустимых значений данного атрибута.

Кортеж – это множество пар {имя атрибута, значение}, которое содержит одно вхождение данного имени атрибута, принадлежащего схеме отношения. «значение» является допустимым значением домена данного атрибута (или типа данных, если понятие домена не поддерживается). Иначе, кортеж – набор именованных значений заданного типа (строка в отношении).

Строку таблицы так же часто называют записью. Далее будем использовать следующие понятия реляционных БД:

Так как отношения являются множествами кортежей, то в них не должны встречаться одинаковые кортежи, и порядок кортежей в отношении несущественен. Обычным представлением отношения является таблица, заголовком которой является схема отношения, а строками – кортежи отношения-экземпляра; в этом случае имена атрибутов именуют столбцы этой таблицы. Поэтому иногда говорят «столбец таблицы», имея ввиду «атрибут отношения».

Схема отношения - (совокупность наименований атрибутов, представленная в виде заголовка таблицы):

Тип данных. Это понятие в реляционной модели данных полностью адекватно понятию типа данных в языках программирования. Обычно в современных реляционных БД допускается хранение символьных, числовых данных, битовых строк, специализированных числовых данных («денежные»), а так же специальных временных данных, которые так же являются числовыми (дата, время, временной интервал).

Рисунок 36.1 Пример схемы отношения

Итак,

  1. В реляционных БД любые совокупности данных представляются в виде двумерных таблиц.

  2. Каждая таблица состоит из фиксированного числа столбцов и некоторого переменного количества строк. Описание столбцов, которое составляет разработчик, принято называть макетом таблицы.

  3. Каждый столбец представляет собой конкретное данное (например, код изделия, цена изделия и т.д.). Столбцы таблицы так же называются полями, причем для каждого поля разработчик должен определить:

  • имя поля,

  • тип поля,

  • некоторые дополнительные характеристики (длину, формат и т.д.).

  • Каждая строка так же называется записью. Система нумерует записи по порядку: 1, 2,3,…, n, где n – общее число записей (строк) в таблице в данный момент. В отличие от количества полей в таблице , количество записей в процессе эксплуатации БД может как угодно меняться. Количество и номенклатуру полей можно изменить, но это уже особая операция, которая называется изменением макета таблицы.

  • Каждое поле может входить в несколько таблиц.

    Каждая запись в таблице должна иметь первичный ключ – идентификатор, значение которого однозначно определяет эту и только эту запись.

    Ключ может состоять из одного или нескольких полей. Первичный ключ должен обладать двумя свойствами:

    1. Однозначная идентификация записи: запись должна однозначно определяться значением ключа.

    2. Отсутствие избыточности: никакое поле нельзя удалить из ключа, не нарушая при этом свойства однозначной идентификации.

    Каждое значение первичного ключа в пределах таблицы должно быть уникальным ( в противном случае нельзя отличить одну запись от другой). Например, если объявить в таблице с данными о студентах ключом фамилию студента, может оказаться, что таблица содержит данные об однофамильцах. В этом случае фамилия не будет однозначно идентифицировать запись, поэтому нужно добавить в определение ключа еще и имя и отчество (ключ получится сцепленным). Таким образом, указание первичного ключа – это и есть единственный способ отличить один экземпляр объекта от другого.

    Процесс проектирования БД включает несколько этапов. На рисунке 36.2 представлена общая схема проектирования БД.

    Рисунок 36.2 Этапы проектирования БД

    Концептуальная схема представляет собой абстрагированное описание предметной области (модель предметной области), заданное в терминах выбранной модели данных. При этом каждая запись модели находится в 3-й нормальной форме.

    Под физической БД подразумевается схема распределения данных по физическим носителям информации.

    36.1. Основные понятия БД

    36.3. Предпроектное обследование предметной...