Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Pogorelov_umen.doc
Скачиваний:
47
Добавлен:
22.04.2019
Размер:
587.78 Кб
Скачать
  1. Геоинформационные структуры данных. Субд

В коммерческих ГИС-продуктах предусмотрена связь напрямую с множеством статистических программ и баз данных, что позволяет выполнять анализ атрибутивных характеристик отдельно от карты. Другие используют специальные форматы для передачи данных для самостоятельного анализа. Все это происходит в процессе интеграции компьютерных методов.

База данных не зависит от прикладных программ и доступна пользователям по их запросам. Следующий уровень организации управления множественными файлами реализуется системой управления базами данных (СУБД). СУБД – это совокупность программных и языковых средств для создания, ведения и совместного использования базы данных многими пользователями. Для осуществления этих функций используется СУБД, способная поддерживать манипуляцию данными различных типов (сетевого, реляционного, иерархического). СУБД включает пакет прикладных программ, расширяющих возможности операционной системы по обработке данных.

Существует всего три основных типа структур баз данных: иерархическая, сетевая и реляционная.

Иерархическая (древовидная) структура данных

Во многих случаях устанавливается взаимосвязь между данными, называемая отношением «один ко многим» (1:n) или даже «один к одному» (1:1). Это подразумевает, что каждый элемент данных имеет прямую связь с некоторым числом так называемых «потомков», те в свою очередь, также напрямую связаны с некоторым количеством и т.д. При этом доступ к данным в результате прямой связи прост и эффективен. Так строится система соподчиненных таксономических единиц – классификация растений, управленческий аппарат, генеалогическое древо и пр. Может легко расширяться путем «ветвления», которое основано на формальных ключевых признаках.

В действительности природа этой структуры требует явного определения каждого элемента. Если ваша информация о ключевом признаке недостаточна, вы не сможете осуществлять поиск и манипуляции, а сам поиск определяется самой структурой. Поэтому необходимо предусмотреть все возможные вопросы к элементу, которые могут задаваться. Атрибутивные и графические данные могут храниться в разных местах, что потребует установления большого числа связей между графической и атрибутивной частями БД. Потенциальное число ветвей может стать очень большим.

Одной из интересных особенностей ГИС является возможность поиска и установления связей, не предполагаемых до реализации системы. Иерархический принцип организации накладывает на это жесткие ограничения – связи заранее заданы.

Достоинства модели

  1. высокая скорость манипулирования данными,

2) низкие затраты на реализацию.

Недостатки

  1. отсутствие математической основы построения модели,

2) неполнота модели, т.к. не каждая предметная область может быть представлена этой моделью,

3) неравнозначность данных, т.к. данные на низших уровнях подчинены данным на верхних уровнях,

4) возможность представления связей только 1:1 или 1: n,

5) сложность обновления БД.

Сетевые структуры

Рассматриваются обычно как усовершенствованные иерархические структуры. Используют отношения «многие ко многим» (m : n), при котором один элемент может иметь многие атрибуты, а каждый атрибут связан со многими элементами. Сетевая модель похожа на иерархическую, но связи между структурными элементами имеются не только по вертикали, но и в некоторых горизонтальных направлениях.

Например, исследуемая площадка может иметь много участков, с каждым из которых могут быть связаны один или несколько видов растений. Но при этом каждый вид может присутствовать более чем в одном участке.

Благодаря используемому отношению «многие ко многим», сетевые структуры допускают гораздо большую гибкость поиска, нежели иерархические. Кроме того, они уменьшают избыточность данных. Их главный недостаток в том, что в крупных БД количество указателей связей может стать очень большим, требуя затрат памяти. Это влечет за собой некоторую путаницу, потерянным и ошибочным связям.

Достоинства модели

  1. более высокий уровень полноты модели,

2) более высокий уровень равнозначности данных,

3) сравнительно невысокие затраты на реализацию БД.

Недостатки

  1. отсутствие математической теории построения модели,

2) представление связей типа 1:1 или 1: n, связи типа m : n организуются только среди некоторых групп структурных элементов,

3) сложность обновления БД.

Реляционные базы данных (РСУБД)

Большое количество указателей (связей) можно избежать используя реляционную структуру. Основана на математическом понятии отношение (relation) – реляционной алгебре, основанной на теории множеств. Начиная с 1970-х годов, занимают доминирующее положение на рынке СУБД. Является удобной и наиболее привычной формой представления данных в виде таблицы. Все данные рассматриваются как хранимые в таблицах, в которых каждая строка имеет один формат.

Принцип: несмотря на многомерность отношений, все данные сводимы к двухмерным таблицам. В 1970 г. Е.Кодд сформулировал концепцию реляционной модели баз данных. Основные требования модели:

  1. Данные в ячейках таблицы должны быть структурно неделимы. Каждая ячейка может содержать только одну порцию данных. Это свойство определяется как принцип информационной неделимости.

  2. Данные в одном столбце (поле) должны быть одного типа.

  3. Каждый столбец должен быть уникальным и иметь уникальное наименование.

  4. Столбцы размещаются в произвольном порядке.

  5. Строки (записи) также размещаются в произвольном порядке.

Основными понятиями реляционных БД являются: «первичный ключ» (primary key), «тип данных», «отношение», «схема отношения». Первичный столбец (поле) – это столбец или некоторое подмножество столбцов, которое уникально, т.е. единственным образом определяют строки. Тип данных определяет хранение символьных, числовых данных, битовых строк, денежный формат, «темпоральных» данных (дата, время, временной интервал).

Всякая строка таблицы должна иметь уникальное значение в колонке (поле) первичного ключа, в противном случае мы не сможем однозначно идентифицировать объекты.

При необходимости мы можем стыковать строки из одной таблицы с соответствующими строками из другой таблицы, используя связующий механизм, называемый реляционным соединением (relational join). Любое количество таблиц может быть связано. Соединение происходит по равенству колонки ключевого поля одной таблицы с другой колонкой второй таблицы. Колонка второй таблицы называется внешним ключом (foreign key). Этот прием позволяет соединять многие таблицы и создавать новые.

Для определения вида, который таблица должна иметь, установлен набор правил, названных Коддом нормальными формами:

Первое правило: таблица должна состоять из строк и колонок, и, поскольку колонки будут использоваться в качестве ключей поиска, в каждой из них на каждой строке должно находиться только одно значение.

Вторе правило: каждая колонка, не являющаяся первичным ключом, полностью должна зависеть от первичного ключа. Это упрощает таблицы и уменьшает избыточность данных.

Третье правило: колонки, не являющиеся первичным ключом, не должны зависеть от первичного ключа, в то время как первичный ключ не зависит от какого-то не первичного ключа. Иными словами, вы должны использовать первичный ключ для поиска значений в других колонках, но вам не нужно использовать другие значения для поиска значений в колонке первичного ключа. Цель – уменьшение избыточности.

Достоинства модели -

  • однородность,

  • наличие строгой математической теории построения модели (языком т.н. реляционной алгебры),

  • полнота модели,

  • возможность представления всех типов связей от 1:1 до m : n.

  • легкость обновления БД.

Недостатки – большие затраты на реализацию модели.

Реляционную модель данных поддерживают различные СУБД: dBase, FoxBASE, R:Base, ORACLE, Informix, Clipper, Paradox, MS Access, SQL.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]