Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ГИТ лекционный курс / Тема 7 текст

.pdf
Скачиваний:
60
Добавлен:
10.02.2015
Размер:
446.5 Кб
Скачать

иметь кардинальность один-к-одному, один-ко-многим, многие-к-одному и многие-ко- многим.

Общие отношения позволяют явным образом моделировать такие отношения между объектами, которые не могут быть однозначно или автоматически выведены из их геометрии или топологии.

Слайд 12. Управление атрибутами с помощью доменов.

Цель каждого пользователя, когда он добавляет или редактирует объекты в базе данных ГИС, состоит в том, чтобы избежать ошибок ввода или хотя бы сократить их. Для многих разработчиков и пользователей это является самым главным аспектом проектирования базы геоданных.

Простейший способ «научить» объекты поддерживать свою «правильность», или (в терминах ГИС) целостность БД состоит в том, что нужно:

1.Внести ограничения на возможные изменения атрибутов.

2.Задать правила проверки корректности того, как пространственные объекты указывают или располагаются по отношению друг к другу.

Вбазе геоданных первое положение реализовано через атрибутивные домены. Атрибутивный домен — это ограничение на значения атрибутов в классах пространственных объектов и таблицах. Это ограничение может быть числовым интервалом или списком допустимых значений.

В базе геоданных атрибутивные домены представлены двумя типами: интервальные домены и домены кодированных значений.

Интервальный домен ограничивает значения любого числового атрибута в любом объектном классе или классе пространственных объектов заданием минимального и максимального допустимых значений. Это сокращает ошибки при вводе данных. Пример интервального домена: давление в трубе ожидается между 2000 и 14000.

Интервальный домен может применяться к атрибутам с числовыми типами данных. Редактируя объекты в АгсМар, вы можете ввести объекты с некорректными

значениями атрибутов, но в любой момент корректность ввода можно проверить. Некорректные значения атрибутов высвечиваются для редактирования.

Домены кодированных значений. Во многих случаях атрибуты представляют категории пространственных объектов. Например, тип горной породы может ограничиваться таким списком значений: «глина», «песчаник», «алевролит». Список допустимых значений в домене кодированных значений можно изменить в любой момент. Домены кодированных значений могут применяться к атрибутам с и числовым, и текстовым типом данных. Использование домена кодированных значений гарантирует, что атрибут будет иметь одно из ожидаемых значений.

Значения по умолчанию. При вводе данных можно использовать тот факт, что для некоторого атрибута одно значение наиболее часто встречается. Значения по умолчанию используются при создании, разделении или объединении пространственных объектов. Например, значение "жилой" может использоваться по умолчанию для атрибута типа землепользования при создании и разделении земельных участков.

Правила разделения и объединения объектов. Установив интервальный домен или домен кодированных значений, вы можете уточнить его, объявляя, что должно происходить при разбиении пространственных объектов.

Частый случай — это разбиение участка земли. Когда один участок разделяют на два, некоторые атрибуты получившихся новых участков должны меняться пропорционально размерам этих участков. Другим атрибутам должно присваиваться одно и то же значите. Третьим нужно присваивать значение по умолчанию.

При разделении объектов к их атрибутам могут применяться следующие правила разделения (split policies):

o Значение по умолчанию — атрибуту обоих получившихся объектов присваивается значение по умолчанию.

o Дублирование — оба получившиеся объекта наследуют значение атрибута исходного объекта.

o Геометрическая пропорция — значение атрибута исходного объекта делится между получившимися объектами пропорционально их площади или длине.

При объединении объектов к их атрибутам могут применяться следующие правила объединения (merge policies):

oЗначение по умолчанию — атрибуту объединенного объекта присваивается значение по умолчанию.

oСуммарное значение – атрибуту объединенного объекта присваивается сумма значений атрибута исходных объектов.

oВзвешенное среднее – атрибуту объединенного объекта присваивается взвешенное среднее значений атрибута исходных объектов.

Слайд 13. Простое поведение с использованием подтипов.

Имеется и более тонкий контроль корректности, дифференцирующий поведение групп пространственных объектов в пределах класса, которые называются подтипами.

Подтип — это специальный атрибут, позволяющий назначить свой вариант простого поведения для разных категорий объектов класса. Все подтипы объектов класса имеют один и тот же набор атрибутов.

Правила проверки корректности. Правила проверки корректности контролируют целостность пространственных объектов и атрибутов. Типами правил проверки корректности являются: атрибутивные правила, правила связности и правила отношений.

Атрибутивное правило — это атрибутивный домен, применяемый по отношению к подтипу класса. Примером атрибутивного правила может быть такое, что допустимая ширина - 35, 40, 45, а допустимое число рядов- 1,2,4.

Правила объединения/разделения определяют, как будут изменяться атрибуты при разбиении и объединении объектов: асфальтовая дорога при объединении получает число рядов по умолчанию.

Значения по умолчанию определяет, какое значение атрибута будет присвоено вновь создаваемому объекту: новой асфальтовой дороге по умолчанию дается ширина 35 футов.

Правило связности задает допустимые сочетания значений атрибутов соединяемых сетевых объектов. Двухрядная асфальтовая дорога может соединяться только с другой двухрядной дорогой.

Правило отношений ограничивает число элементов в отношении между классомисточником и классом-адресатом. Например, асфальтовая дорога может быть связана с пересечениями в виде эстакад или тоннелей.

Для реализации простого поведения объектов класс не обязательно должен иметь подтипы. Если ни один подтип не задан, вы, тем не менее, можете задавать атрибутивные домены, значения по умолчанию и правила, при этом они будут действовать по отношению ко всем объектам класса.

Основная причина использования подтипов– повышение быстродействия БГД. База геоданных с десятком–другим классов объектов обладает большим быстродействием, чем база геоданных со многими десятками или сотнями классов.

Слайд 14. Общая характеристика персональных и многопользовательских баз геоданных.

Выше изложенное свидетельствует о том, что формат базы геоданных является в настоящее время наиболее развитым ГИС-форматом векторных данных, позволяющие более точно моделировать сложное поведение и разнообразные свойства объектов реального мира. У формата базы геоданных есть еще одно важное и полезное свойство, существование которого в других форматах векторных данных невозможно. Эта особенность заключается в возможности использования одной базы геоданных многими пользователями одновременно.

База геоданных представляет объектно-ориентированную модель данных. Вся информация о данных (пространственная, атрибутивная, отношения и т.д.) хранится в таблицах реляционных СУБД.

Базы геоданных работают со многими платформами СУБД, могут быть разного размера и обслуживать разное количество пользователей. Они варьируют от маленьких однопользовательских баз данных на основе Microsoft Jet Engine до крупных многопользовательских баз данных для рабочих групп, отделов и предприятий. По своей архитектуре база геоданных может быть персональной или многопользовательской.

Персональные базы геоданных, напрямую использовать которые могут все пользователи ArcGIS, используют файловую структуру базы данных Microsoft Jet Engine для хранения ГИС-данных в базах данных небольшого размера. Персональные базы геоданных во многом похожи на файловые рабочие области и поддерживают базы данных размером до 2 Гб. Для работы с атрибутивными таблицами в персональных базах геоданных используется Microsoft Access.

Персональные базы геоданных оптимальны для работы с небольшими наборами данных отдельных ГИС-проектов и малочисленных рабочих групп. Обычно пользователи применяют несколько персональных баз геоданных для сбора своих данных и одновременно используют их при работе с ГИС. Персональные базы геоданных поддерживают только однопользовательское редактирование. Не предусмотрен механизм поддержки версий.

Для работы с многопользовательскими базами геоданных необходимы серверное приложение ArcSDE и возможность работы с разными моделями хранения данных в СУБД (IBM DB2, Informix®, Oracle(с или без Oracle Spatial) и SQL Server).

Многопользовательские базы геоданных в первую очередь используются на уровне рабочих групп, отделов или всей организации. Они используют все преимущества архитектуры соответствующих СУБД для поддержки:

очень больших, непрерывных баз ГИС-данных;

одновременной работы многих пользователей;

длинных транзакций и работы с версиями.

Многопользовательские базы геоданных могут иметь очень большие размеры и обеспечивают многопользовательский режим работы. Массовый опыт использования крупных баз геоданных свидетельствует об эффективности СУБД для перемещения больших двоичных объектов, например растровых изображений, в/из таблиц ГИС-данных. Кроме того, размеры базы данных ГИС и количество поддерживаемых пользователей могут быть гораздо большими, чем в случае ГИС на основе файловых баз.

Слайд 15. Хранение объектов базы геоданных.

При просмотре базы геоданных в ArcCatalog вы видите таблицы базы геоданных как совокупности наборов классов или просто как отдельные классы объектов.

Каждый класс пространственных объектов базы геоданных содержит объекты одного геометрического типа. Классы объектов можно объединять в наборы классов объектов. Наборы классов объектов удобны для организации классов объектов с совместной топологией. Их можно также использовать для организации классов объектов по тематическому признаку. Например, можно объединить в один набор классов три класса водных объектов: точки – родники; линииреки; полигоныозера. Внутри набора классов объектов все классы объектов имеют единую систему координат.

В файловой системе (просмотр через Проводник Windows) персональные базы геоданных представлены файлом Microsoft Access (.mdb). Если открыть этот файл в Access то вы увидите совокупность взаимосвязанных таблиц.

Слайд 16. Таблицы.

Таблица (table) состоит из строк и столбцов.

Строка (raw) — это фундаментальная единица информации в таблице и заключает в себе набор свойств объекта. Все строки в таблице должны иметь одинаковый набор свойств.

Столбец (column) представляет один и тот же атрибут для всех объектов-строк. Определение столбца — его имя и формат, обеспечивающий хранение идентификатора или геометрии объекта, действительного или целого числа, или символьной строки - называют полем.

Виды таблиц. В базе геоданных, таблицы могут хранить непространственные объекты, пространственные объекты и отношения.

Таблицу, содержащую непространственные объекты, называют объектным классом. Эти таблицы обычно содержат дополнительные атрибуты, расшифровки кодов или значения координат. Они могут быть получены из других приложений.

Таблицу, содержащую пространственные объекты, называют классом пространственных объектов. В таблице есть два набора полей: предопределенные поля (predefined fields) — для однозначной идентификации объектов и хранения формы пространственных объектов, — и пользовательские поля (custom fields) — для определения дополнительных атрибутов пространственных объектов. Для каждого класса, поля обоих видов располагаются в одной и той же таблице.

Например, класс пространственных объектов с линейной геометрией имеет ряд предопределенных полей: уникальный идентификатор пространственного объекта, попе слежения за геометрией для записи длины пространственного объекта, поле геометрии для представления формы пространственного объекта. Предопределенные поля управляются ArcGIS ArcInfo, их нельзя модифицировать какими-либо иными программами, осуществляющими доступ к базе данных.

Остальные показанные поляпользовательские. В качестве примера различных типов атрибутов приведены кодированные значения для типа дороги, описательная строка для типа покрытия, непрерывное числовое значение для ширины дороги, дискретное числовое значение для числа рядов и текст для названий дороги.

Слайд 17. Типы полей.

Все атрибуты базируются на одном из следующих типов: с плавающей точкой

(float), с двойной точностью (double), короткие целые (short integer), длинные целые (long integer), текст (text), дата (date), идентификатор объекта (object ID) и большие двоичные объекты (binary large object, BLOB).

Числовые поля могут относиться к одному из четырех числовых типов данных: короткое целое (short integer), длинное целое (long integer), число с плавающей точкой одинарной точности (float) и число с плавающей точкой двойной точности (double). Эти числовые тины данных различаются размером и методом хранения числовых значений.

Числовые значения, которые можно представлять с помощью короткого целого, находятся в диапазоне от-32,000 до+32,000. Диапазон значений, представляемых длинным целым, составляет приблизительно от —2 млн. до +2 млн. Короткие и длинные целые не могут использоваться для хранения дробных значений, то есть чисел, имеющих

знаки после десятичной точки — для хранения таких значений нужно использовать типы данных с плавающей точкой.

Число типа float может иметь до семи значащих цифр и кодирует значения в диапазоне от -3.4Е38 до 3.4Е 38. Число типа double может иметь до 15 значащих цифр и кодирует значения в диапазоне от -2.2Е-308 до 2.2Е-308.

Важно отметить, что числа с плавающей точкой имеют по природе своей приблизительное представление. Это обусловлено двумя факторами. Во-первых, количество значащих цифр ограничено. Например, вы не можете сохранить число 1234567.8 как float, поскольку в нем содержится более семи допустимых значащих цифр. При попытке записи этого числа в поле данного формата оно будет округлено до семи значащих цифр, то есть 1234568. Это число легко можно ('охранить в поле double, так как в нем содержится менее 15 допустимых этим форматом значащих цифр. Во-вторых, существуют ограничения на представление десятичных чисел с помощью двоичной системы. Здесь можно провести аналогию с использованием простых и десятичных дробей. Так, например, дробь 1 /3 не может быть выражена десятичной дробью конечной длины. В этом случае используется конечное количество знаков, например, 0.3333333, то есть исходная дробь имеет приблизительное представление. Точно гак же, как простые дроби не всегда могут быть точно представ лены десятичными, некоторые числа не могут быть точно представлены с помощью двоичного кода, и эти числа заменяются приблизительными значениями. Примером такого числа является 0.1— для этого числа нет точного двоичного представления, а ближайшим к нему допустимым значением является 0.099999, которое и сохраняется в памяти вместо 0.1.

При выборе числового типа данных следует принимать во внимание две вещи. Вопервых, всегда лучше использовать наиболее короткий тип данных, имеющий необходимый диапазон значений. Это не только уменьшает объем памяти, необходимой для хранения вашей базы геоданных, но и повышает ее быстродействие. Во-вторых, вы должны также выбирать между точным и приблизительным представлением чисел. Например, если вам нужно представлять дробные значения и достаточно семи значащих цифр, используйте формат float. Но если требуется более точное представление чисел, используйте double. Если в поле не будут храниться дробные числа, то используйте короткое или длинное целое (long или short integer).

Текстовое поле хранит последовательность букв, цифр и символов. Это могут быть названия улиц, атрибутивные свойства и любые текстовые описания. Для хранения повторяющихся текстовых строк можно использовать кодированные значения. При этом каждое текстовое значение заменяется в таблице соответствующим числовым кодом.

Например, вы можете использовать код 1 для обозначения типа дороги "грунтовая", код 2

— для типа "с твердым покрытием" и т. д. Данный метод позволяет сэкономить место для хранения базы геоданных, но при этом пользователь должен знать, что обозначают используемые вами коды. Если вы зададите соответствие между кодами и строками в домене кодированных значений базы геоданных и свяжете этот домен с целочисленным полем, хранящим коды типов дорог, то при просмотре таблицы в АгсМар или ArcCatalog вместо кодов будут отображаться соответствующие им текстовые строки.

ПОЛЯ дат. Тип данных дат позволяет записывать дату, время или дату и время вместе. По умолчанию используется формат mm/dd/yyyy hh:mm:ss (месяц/день/год час/минута/секунда) с указанием AM или РМ. При вводе данных в поля этого типа эти данные конвертируются в данный формат.

ПОЛЯ BLOB. Большой двоичный объект (BLOB) — это последовательность двоичных чисел, хранимых как единое целое в базе геоданных. Этот тип данных обычно используется для хранения таких видов информации, как изображения, звук, видео и двоичные коды программ.

Слайд 18. Структура растровых данных.

Другим способом представления географического пространства является растровый способ. В настоящее время разработано множество форматов растровых данных. Но все они имеют одинаковую структуру.

Набор растровых данных хранит двухмерную матрицу, в каждой ячейке которой хранится измеренное, интерполированное или иначе вычисленное значение. Все ячейки имеют одинаковые ширину и высоту.

Географические координаты верхнего левого угла сетки вместе с размерами ячейки и количеством их строк и столбцов однозначно определяют пространственный экстент набора растровых данных.

Слайд 19. Глубина цвета.

Изображения хранятся в файлах изображений, называемых также image-файлами, и содержат только числа. Такое представление данных преобразуется в изображение, когда они отображаются на экране монитора или выводятся на печать. При этом программа каждому значению пикселя (или нескольким значениям пикселя, если это многоканальный растр) ставит в соответствие один цвет и с помощью этого цвета отображает пиксель на экране монитора. Цвет каждого пикселя (красный, чёрный, белый

или любой другой) хранится в компьютере как комбинация битов. Бит (двоичный разряд) является наименьшей единицей информации, которая может принимать лишь одно из двух значений (да/нет, плюс/минус, чёрное/белое, включено/выключено и т.д.). Чем больше битов используется для пикселя, тем больше оттенков цветов можно получить. Число битов, используемых компьютером для каждого пикселя, называется битовой глубиной, или глубиной цвета. В зависимости от различной глубины цвета выделяют следующие типы растровых изображений:

o чёрно-белые штриховые (монохромные); o полутоновые (в оттенках серого);

o с индексированным цветом;

oполноцветные.

Вчёрно-белых штриховых (монохромных) изображениях для хранения каждого пикселя используется лишь один бит информации. Одним битом кодируются два состояния, т.е. два цвета: черный или белый. Глубина цвета в этом случае - один бит, и такой тип изображения называется 1-битовым.

Вполутоновых изображениях каждый пиксель кодируется 8 битами (8 бит составляют 1 байт). Глубина цвета такого изображения составляет 8 бит, а каждый его пиксель может принимать одно из 256 различных значений (28=256). Серая шкала имеет 256 градаций серого цвета, каждая из которых характеризуется значением яркости в диапазоне от 0 (черный) до 255 (белый). К полутоновым изображениям относятся аэрофотоснимки и панхроматические космические снимки (SPOT, Ikonos и т.п.). На них информация о земной поверхности представлена 256 оттенками серого цвета.

Изображения с индексированным цветом имеют ограниченную цветовую гамму. Пиксели таких изображений кодируются 4 битами (24=16 цветов) или 8 битами (28=256 цветов). Такие цвета называются индексированными (indexed color). Разумеется, 16 (и даже 256) цветами невозможно полностью передать цветовую гамму фотоизображений. Однако иногда изображения с индексированным цветом можно использовать вместо полноцветных, так как для хранения таких изображений требуется гораздо меньше ресурсов памяти компьютера. Например, топографическая карта имеет всего 8 цветов, и нет смысла хранить её в полноцветном или даже в 256-цветном режиме.

Кполноцветным относятся изображения с глубиной цвета не менее 24 бит, что даёт возможность отобразить 16,7 млн цветов (224). Поэтому иногда полноцветные изображения называют true color (истинный цвет). Примером таких изображений могут служить высококачественные цветные фотографии, многозональные космические снимки

ит.п.

Слайд 20. Способы представления изображений.

На этом слайде представлено одно и то же изображение, но с разной глубиной цвета. Необходимо отметить, что глубину цвета растрового изображения всегда можно уменьшить, а вот снова увеличить нельзя. Например, из 24-битного растра можно сделать 4- или 8-битный, но из 4- или 8-битного восстановить 24-битный цвет невозможно. Особенно надо быть внимательным при превращении цветного изображения (полноцветного или с индексированным цветом) в полутоновое или чёрно-белое, поскольку информация о цвете будет утеряна.

От глубины цвета зависит размер файла растрового изображения. Чем больше глубина цвета, тем больший объём компьютерной памяти требуется для хранения изображения. Самый большой размер файла имеют полноцветные 32-битные и 48-битные изображения, а самый маленький - 1-битовые (чёрно-белые). Если изменить глубину цвета растрового изображения с 24 бит до 8 бит, то размер файла изображения уменьшится в 3 раза. Каждый пиксель растра теперь потребует в 3 раза меньше памяти, чем ранее (24/8=3), и, следовательно, весь файл будет в 3 раза меньше.

Слайд 21. Отображение одноканальных растров.

Резюмируем выше сказанное. Итак, растр может иметь один или несколько каналов. Значения ячеек могут отображаться различными способами. Значения ячеек в одноканальных растрах могут быть отображены следующими тремя базовыми способами (на слайде приведены некоторые из способов отображения одноканальных растров на основе значения ячеек).

oВ бинарном изображении каждая ячейка имеет значение 0 или 1. Такие изображения часто используются для сканирования карт с простым линейным рисунком, типа карт земельных участков.

oВ полутоновом изображении каждая ячейка имеет значение от 0 до 255. Такие изображения часто используются для черно-белых аэрофотоснимков.

oЦветовая таблица. Один из способов представить цвета на изображении - это использовать таблицу цветов. Значениям ячеек произвольно сопоставляются тройки значений компонент цвета - красной, зеленой и синей. В данном случае речь идет о цветовой модели RGB.

Соседние файлы в папке ГИТ лекционный курс