Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Chto_takoe_geoinformatsionnaya_sistema.docx
Скачиваний:
79
Добавлен:
25.04.2019
Размер:
13.87 Mб
Скачать

Тема 5. Форматы данных гис

Форматы данных ГИС.

Современные геоинформационные системы работают с множеством форматов данных. Эта множественность объясняется разнообразием задач, решаемых с помощью ГИС и использованием в ГИС специфических данных, таких как, например, результаты переписи населения или материалы космической съемки.

Кроме того ГИС возникли и развивались на стыке разных предметных областей (география, экономика, природные ресурсы, прикладная математика и т.д.), каждая из которых использует свои специфические базы данных и свои форматы данных. Со временем информационные ресурсы и технологии развивались, совершенствовались, форматы данных менялись и в том или ином виде наследовались геоинформационными системами.

С другой стороны современные ГИС способны по-разному представлять географическое пространство:

-как собрание отдельных объектов в векторной модели

-как сетку ячеек растра

-как набор точек триангуляции.

Соответственно существуют три основные группы форматов данных:

Векторные (шейп-файлы, покрытия ARC/INFO, чертежи САПР и др.)

Растровые изображения и гриды (BMP, TIFF, JPG, ERDAS IMAGINE, ESRI ARC GRID, GIF, MrSID и др.)

Триангуляционные (TIN)

Триангуляционные модели предназначены для представления поверхностей. Таблицы и текстовые файлы также важны в ГИС, так большая часть атрибутивной информации записывается в виде таблиц или текстов.

Многообразие форматов порождает трудности в обмене данными между разными системами. Многие ГИС имеют специальные трансляторы для преобразования данных, либо развивают собственное программное обеспечения таким образом, чтобы оно напрямую читало и работало с несколькими форматами данных.

В ArcGIS, например, есть специальный модуль Data Interoperability, предназначенный для конвертации данных из различных ГИС-форматов. Data Interoperability добавляет возможность прямого чтения и использования данных в более чем 60 распространенных векторных ГИС-форматах. Например, можно обращаться, отображать и напрямую использовать в ArcGIS такие источники данных, как наборы навигационных данных S57, наборы данных САПР с атрибутами, наборы данных MapInfo и др. Этот модуль позволяет обмениваться ГИС-данными, используя разнообразные форматы экспорта векторных данных (более 50 поддерживаемых форматов).

Шейп-файл: типы пространственных объектов.

Наибольшее распространение имеют векторные форматы данных. Как вы уже знаете, векторные данные лучше всего подходят для описания дискретных объектов с определенными формами и границами. Однородные географические объекты объединяются в однородные наборы данных или классы

.

Классы простых пространственных объектов представляют объекты с помощью точек, линий и полигонов, но не содержат топологических связей. Преимущество такой структуры состоит в простоте и высокой скорости отображения. Все недостатки модели вытекают из отсутствия топологии. Кроме того, классы простых пространственных объектов не пригодны для описания отношений и сложного поведения объектов.

Тем не менее, простые пространственные объекты составляют значительную часть существующих географических данных, т.к. они легко создаются и достаточны для географических данных, образующих фоновые слои карт.

Простые пространственные объекты очень часто создаются и распространяются в форматах шейп-файла или чертежа САПР (Система автоматизированного проектирования).

Шейп-файлы удобны для картопостроения и некоторых видов анализа. Этот формат был разработан компанией ESRI в начале 1990-х годов, для того, чтобы удовлетворить потребность в использовании наборов данных с простыми пространственными объектами.

Шейп-файлы представляют собой нетопологическую векторную структуру данных. В каждом шейп-файле хранятся объекты только с одним видом геометрии: точки, многоточечные объекты, линии, полигоны.

Точечные формы – это просто объекты- отдельные точки, например скважины.

Мультиточка – это набор точек, составляющих один объект. Несмотря на то, что мы видим несколько графических элементов, программа будет воспринимать их как один объект, и в атрибутивной таблице ему будет соответствовать одна запись. Примером многоточечного объекта может быть группа маленьких островов или несколько отдельно стоящих деревьев.

Линейные формы могут быть простыми непрерывными линиями, как, например, линия разлома на карте. Они могут быть также составными: состоящими из связанных частей (разветвляющиеся полилинии, как, например, река). Или состоять из несвязанных частей. Составные полилинии, как и мультиточка, являются единым объектом.

Полигональные формы могут представлять собой простые области (простой полигон), например, территорию государства. Они могут состоять из нескольких частей (составные полигоны), например, несколько участков леса, разделенных полями. Полигональные формы могут пересекаться друг с другом, но в шейп-файле не содержится информация об этом. Примером налагающихся полигонов могут служить сферы обслуживания магазинов.

Составные полигоны (несвязанные или пересекающиеся) также являются единым объектом.

Хранение шейп-файлов.

Если мы в Проводнике Windows откроем папку, в которой хранятся шейп-файлы, то каждый шейп-файл предстанет в виде списка, по крайней мере, 3-х файлов:

<имя>.shp

<имя>.dbf

<имя>.shх

Все компоненты шейп-файла имеют одно имя. Файл с расширением .shp содержит пространственные данные в двоичном коде, файл с расширением .dbf - атрибутивные данные в таблице в формате dBASE. Файл с расширением .shх представляет собой пространственный индекс, в котором в сжатом виде описана структура файла .shp. Другими словами, файл с расширением .shх является ключом к пространственным данным, благодаря которому осуществляется быстрое чтение шейп-файла, а следовательно, все операции поиска и выборочного отображения объектов.

Шейп-файл может включать четыре дополнительных файла с индексной информацией. Файлы с расширениями .sbn и .sbx образуются, когда мы обращаемся к шейп-файлу с пространственным запросом (т.е. ищем объекты на основе их местоположения). Два атрибутивных индексных файла ( .ain и . aix ) создаются операцией реляционного связывания таблиц. Данные файлы позволяют быстрее осуществлять поиск атрибутов. Все эти файлы записываются в каталог источника данных.

В папке, где хранится шейп-файл вы можете увидеть еще два файла :

<имя>.prj - файл пространственной привязки, содержащий информацию о системе координат шейп-файла.

<имя>.shp.xml - файл метаданных. Метаданные – это информация, которая характеризует ваши данные, подобно тому, как карточка в библиотечном каталоге описывает книгу. Метаданные могут содержать различную информацию: кто автор или владелец этих данных, какова точность данных, в какой системе координат они находятся, дата последнего обновления и др.

В ArcCatalog все файлы, образующие шейп-файл, представлены как один класс пространственных объектов. При перемещении, переименовании, копировании или удалении шейп-файла ArcCatalog сам позаботится о том, чтобы все файлы, составляющие шейп-файл, участвовали в операции. Если пользователь работает в обычной файловой системе, он должен сам позаботиться об изменении или переносе всех файлов, составляющих шейп-файл.

Рисунки и наборы данных САПР.

К настоящему времени в файлах чертежей САПР собран значительный объем географических данных. САПР (Система автоматизированного проектирования) является системой компьютерного черчения и собственно ГИС- продукты не создает. Особенность файлов САПР состоит в том, что пространственные объекты в них обычно подразделены на множество слоев: например, здание может быть представлено и полигоном, и линейным объектом, представляющим границу этого полигона. С точки зрения ГИС этот формат данных имеет переизбыток информации.

Рисунок САПР является аналогом карты, на котором отображены все картографируемые элементы, используя символы, хранящиеся в самом рисунке.

Каждому рисунку САПР на диске в дереве Каталога соответствуют два элемента: набор данных САПР и рисунок САПР.

Набор данных САПР (слой САПР) это нечто иное, нежели слой на карте. Если набор данных САПР имеет 17 слоев – 3 точечных, восемь линейных, четыре полигональных, и два из подписей – то они будут объединены в класс точечных объектов САПР, класс линейных объектов САПР, класс полигональных объектов САПР и класс подписей САПР. Таким образом, класс пространственных объектов САПР содержит все точки, или все линии, или все полигоны или все аннотации рисунка, а также их атрибуты. Дополнительные атрибуты пространственных объектов могут храниться в отдельных таблицах.

Покрытия ARC/INFO: типы объектов.

Следующий формат данных существенно отличается от вышеописанных, он основан на топологической векторной структуре данных.

Формат покрытия ARC/INFO был разработан компанией ESRI очень давно и многие годы использовался как стандарт представления векторных данных. Формат покрытия нашел успешное и широкое применение в государственных учреждениях, частных копаниях и независимых организациях всего мира благодаря эффективному хранению пространственных и топологических данных; при этом атрибутивные данные хранятся в реляционных таблицах, которые можно дополнять пользовательскими полями и соединять с другими базами данных.

Покрытия объединяют пространственные и атрибутивные данные, а также хранят топологические связи между пространственными объектами. Пространственные данные хранятся в двоичных файлах. Топологические и атрибутивные данные хранятся в таблицах INFO.

Покрытия, в отличие от шейп-файла, могут содержать внутри себя пространственные объекта разного типа и разной геометрии.

Первичными типами пространственных объектов являются точки (points), дуги (arcs), полигоны (polygons) и узлы (nodes). Эти пространственные объекты обладают топологическими связями: дуги образуют периметры полигонов, узлы являются концевыми точками дуг. Точечные пространственные объекты имеют двойное значение: они могут представлять собственно точечные объекты, они могут так же отмечать внутреннюю область полигонов.

Производными типами пространственных объектов являются тики (ticks), векторы смещений (links), подписи (annotations). Тики используются для пространственной привязки данных, векторы смещений – для геометрической корректировки пространственных объектов (исправления формы), подписи (аннотации) - для подписывания пространственных объектов на карте.

Покрытия могут также содержать составные пространственные объекты. Маршрут представляет собой цепочку дуг с определенной на ней линейной системой координат. Маршруты обычно используются для моделирования транспортных систем. Регионы представляют собой собрание полигонов, которые могут быть смежными, перекрывающимися, или не имеющими общих точек. Регионы обычно используются в приложениях по землепользованию и окружающей среде.

Для крупных наборов данных, покрытия разбиваются на листы в библиотеки карт.

Хранение покрытий: рабочие области.

Покрытия ARC/INFO хранятся не в любом, а в специально отведенном месте дискового пространства, называемом Рабочая область ARC/INFO.

Рабочая область ARC/INFO – это особая папка в файловой системе. Папка рабочей области содержит папку info и папки с именами покрытий для каждого покрытия в рабочей области. Здесь рабочая область называется a_workspace, покрытия - a_coverage, b_coverage. Папка покрытия содержит набор файлов, в которых хранится информация об объектах покрытия (координаты, топология и т.д.). Атрибуты объектов покрытия хранятся в таблицах атрибутов объектов, управляемых базой данных INFO™. Папка info содержит файлы данных INFO и параметры таблиц для каждого покрытия.

В ArcCatalog рабочая область представлена иначе. Мы видим рабочую область покрытия в виде папки с данными. По иконке покрытия мы можем узнать его геометрический тип (точечный, линейный, полигональный). Можно также видеть классы объектов покрытия.

На рисунке показаны две рабочие области National_Park_Coverages и Maplewood. Рабочая область Maplewood содержит покрытие floodcov с полигональной топологией. Покрытие floodcov содержит:

Класс дуг покрытия - линейные пространственные объекты

Класс точек меток покрытия - точки меток, которыми отмечены полигоны. Каждый полигон имеет одну метку.

Класс полигональных пространственных объектов покрытия содержит простые площадные объекты.

Класс регионов покрытия содержит сложные площадные объекты.

Класс тиков покрытия содержит точки, используемые для регистрации карт в географическом пространстве.

В рабочей области покрытия могут также находиться дополнительные файлы, если в базе данных INFO хранятся другие таблицы, например, связанные таблицы данных или справочные таблицы символов. Все таблицы управляются через подпапку info, в ArcCatalog невидимую. При выполнении в ArcCatalog операций по созданию, перемещению и удалению элементов рабочей области ARC/INFO, ее целостность поддерживается автоматически. Нельзя использовать Проводник Windows для управления покрытиями, в противном случае будет нарушена синхронизация между покрытиями и подпапкой info, и данные будут испорчены.

База геоданных: геометрия пространственных объектов.

“В 1999 году компания ESRI выпустила в свет свою последнюю разработку – новый формат географических данных, - который называется база геоданных.

Базы геоданных реализуют объектно-ориентированную модель данных ГИС. В базе геоданных каждый пространственный объект хранится в виде строки таблицы. Векторная форма объекта хранится в поле формы объекта, а атрибуты - в других полях. В каждой таблице хранится класс объектов.

В дополнение к пространственным объектам базы геоданных могут хранить растры, таблицы данных и ссылки на другие таблицы. Базы геоданных - это хранилища, позволяющие держать все пространственные данные в одном месте. Их можно определить как СУБД с добавлением покрытий, шейп-файлов и растров. Однако, в них имеются также важные новые возможности, отсутствующие в файловой модели данных.

Одно из преимуществ базы геоданных в том, что в ней можно задавать поведение объектов; все пространственные объекты базы геоданных хранятся в одной базе данных, при этом большие классы объектов базы геоданных можно хранить, не разделяя на части.

Помимо общих объектов, таких как точки линии, полигоны, можно создавать пользовательские объекты, например, трансформаторы, трубопроводы или участки. Для пользовательских объектов можно определить специальное поведение, что позволяет лучше представить объекты реального мира. Поведение объектов можно использовать для поддержки сложного моделирования сетей, предотвращения ошибок при вводе данных, особого способа визуализации объектов, создания собственных форм для проверки или ввода атрибутов объектов.

Поскольку возможно создание собственных пользовательских классов объектов, количество классов объектов неограниченно. Класс пространственных объектов имеет специальное поле, хранящее форму и положение пространственных объектов. Это поле называется shape (форма), и оно является полем типа геометрия (geometry). Все пространственные объекты в пределах одного класса пространственных объектов обладают одним типом геометрии. Базовыми геометрическими классами объектов (формами) являются точки, мультиточки, линии и полигоны. Вы можете также создавать объекты с новой геометрической формой.

Поле shape класса пространственных объектов может относится к одному из следующих типов геометрии: точка, мультиточка, полилиния или полигон.

Пространственный объект с формой точки (point) имеет единственную пару координат (x,y) или тройку координат (x,y,z). Пространственный объект с формой мультиточки (multipoint) обладает неупорядоченным набором из нескольких пар или троек координат. Геометрия базы геоданных принципиально двухмерная, но вы можете задать свое z-значение каждой формообразующей точке точечного, мультиточечного, линейного или полигонального объекта. Z-значения обычно представляют высоты, но они могут также представлять и другие показатели, например, количество осадков.

Пространственный объект с формой полилинии (polyline) имеет один или несколько путей. Путь – это цепочка сегментов, каждый из которых может быть одного из следующих типов параметрических кривых: прямая линия, дуга окружности, дуга эллипса или кривая Безье. С полилинией может ассоциироваться необязательное z-значение или m-значение (линейная мера). Z-значения могут применяться к таким линейным пространственным объектам как реки или гребни. Линия гребня, например, образует некоторый профиль поверхности, и вы можете задать конкретные высоты в каждой промежуточной точке этой линии.

m-значение: некоторые приложения используют линейную систему измерения, которая основана на расстояниях вдоль путей. Вы можете задать свое m-значение каждой формообразующей точке линейного объекта. Примером линейной системы измерений являются километровые столбы или пикеты вдоль дорог или каналов.

Пространственный объект с формой полигона (polygon) имеет одно или более колец. Кольцо – это замкнутая цепочка сегментов. Каждый сегмент может быть типа прямой линии, дуги окружности, дуги эллипса или кривой Безье. Кольцо не может иметь самопересечений, но может пересекать другие кольца в полигоне. Кольца в полигоне могут соприкасаться в любом числе точек. С полигоном может быть ассоциироваться необязательное z-значение.

В формате базы геоданных (в отличии от покрытий) одночастные и много частные объекты находятся в одном классе объектов. Другое важное отличие состоит в поддержке параметрических кривых: дуг окружностей, дуг эллипсов, кривых Безье. Эти типы линий позволяют точнее представлять форму пространственных объектов, и особенно важны в строительных приложениях.

База геоданных: пространственная привязка.

Геометрия пространственных объектов хранится как упорядоченный набор координат x и y, который может дополняться z- и m-значениями. Эти координаты соотносятся с точками на поверхности Земли посредством пространственной привязки, состоящей из нескольких частей.

Одна часть привязки- это система координат. Другая часть пространственной привязки определяет представление координат в базе геоданных. Чтобы избежать неоднозначности при сравнении местоположений и применении пространственных операторов, внутри базы геоданных для хранения координат используются целые числа.

При отображении карты на мониторе эти целочисленные значения преобразуются в единицы карты и обратно, и вам не приходится думать о них , за исключением случая, когда определяется координатный домен и масштаб пространственной привязки.

Координатный домен состоит из минимальных и максимальных значений для x и y, и возможно, z- и m. Масштаб определяет, сколько целочисленных единиц соответствует одной единице карты. Если масштаб равен 1000, то максимальная точность представления координат равна 1/1000 единицы карты.

Существует определенная связь между масштабом и координатным доменом. Очень большое значение масштаба сужает пространственный домен. Практическое правило таково: произведение масштаба и наибольшего интервала координат в домене не должно превышать 231.

Пространственная привязка ассоциируется с классом пространственных объектов. Если классы пространственных объектов организованы внутри набора классов объектов, то все эти классы пространственных объектов совместно используют одну и ту же пространственную привязку. База геоданных может иметь множество пространственных привязок, - по одной на каждый набор классов объектов и каждый автономный класс пространственных объектов.

После того, как пространственная привязка ассоциирована с классом пространственных объектов или набором классов объектов, вы можете менять систему координат, но не координатный домен или масштаб.

База геоданных: отношения между объектами.

Объекты в реальном мире имеют отношения с другими объектами. Одни объекты имеют фиксированный пространственный экстент (на пример, леса), другие – не имеют (например, люди).Одним из примеров отношений между объектами является связь земельного участка с владельцем, зоной землепользования, учетной записью или зданием.

Желательно отслеживать эти отношения так, чтобы, когда один объект меняется, связанные с ним объекты могли реагировать. Например, когда удаляется инженерная опора, должны удаляться и все прикрепленные к ней трансформаторы и другое оборудование. Формат базы геоданных имеет средства явного определения отношений среди пространственных и непространственных объектов.

Различают три вида отношений: топологические, пространственные и общие.

Топологические отношения встраиваются в данные в момент создания геометрической сети или плоской топологии (внутри одного класса). Топология базы геоданных аналогична топологии покрытия Arc/Info. Эти отношения позволяют быстро находить соседние полигоны или пересекающиеся линии. В базе геоданных кроме плоской топологии реализован еще один топологический механизм, позволяющий отслеживать пространственные отношения между объектами разных классов пространственных объектов (между объектами разных слоев), осуществляя, таким образом, межслойную или трехмерную топологию. Например, если граница между государствами подходит по реке, то объекты линейного класса реки должны совпадать с объектами линейного класса граница. Или изолиния с нулевой отметкой должна точно соответствовать границе полигона, представляющего акваторию моря.

Пространственные связи. ArcGIS ArcInfo реализует богатый набор пространственных операций, которые позволяют определить такие пространственные отношения между объектами как касание, совпадение, пересечение, размещение внутри или вовне. Например, может быть решена такая задача: «Определить общую протяженность автомобильных дорог Республики Татарстан» или «Найти все автомобильные дороги, пересекающие железнодорожную».

Общие отношения – формируют явную постоянную связь между пространственным или непространственным объектом из класса- источника с пространственным или непространственным объектом из класса- адресата.

База геоданных: кардинальность общих отношений.

Отношения имеют определенный набор характеристик. Одной из характеристик является понятие кардинальности отношений. Кардинальность определяет, сколько объектов типа А связано со сколькими объектами типа Б. В целом, отношения могут иметь кардинальность один-к-одному, один-ко-многим, многие-к-одному и многие-ко-многим.

Общие отношения позволяют явным образом моделировать такие отношения между объектами, которые не могут быть однозначно или автоматически выведены из их геометрии или топологии.

Управление атрибутами с помощью доменов.

Цель каждого пользователя, когда он добавляет или редактирует объекты в базе данных ГИС, состоит в том, чтобы избежать ошибок ввода или хотя бы сократить их. Для многих разработчиков и пользователей это является самым главным аспектом проектирования базы геоданных.

Простейший способ «научить» объекты поддерживать свою «правильность», или (в терминах ГИС) целостность БД состоит в том, что нужно:

Внести ограничения на возможные изменения атрибутов.

Задать правила проверки корректности того, как пространственные объекты указывают или располагаются по отношению друг к другу.

В базе геоданных первое положение реализовано через атрибутивные домены. Атрибутивный домен — это ограничение на значения атрибутов в классах пространственных объектов и таблицах. Это ограничение может быть числовым интервалом или списком допустимых значений.

В базе геоданных атрибутивные домены представлены двумя типами: интервальные домены и домены кодированных значений

Интервальный домен ограничивает значения любого числового атрибута в любом объектном классе или классе пространственных объектов заданием минимального и максимального допустимых значений. Это сокращает ошибки при вводе данных. Пример интервального домена: давление в трубе ожидается между 2000 и 14000.

Интервальный домен может применяться к атрибутам с числовыми типами данных.

Редактируя объекты в АгсМар, вы можете ввести объекты с некорректными значениями атрибутов, но в любой момент корректность ввода можно проверить. Некорректные значения атрибутов высвечиваются для редактирования.

Домены кодированных значений. Во многих случаях атрибуты представляют категории пространственных объектов. Например, тип горной породы может ограничиваться таким списком значений: «глина», «песчаник», «алевролит». Список допустимых значений в домене кодированных значений можно изменить в любой момент.

Домены кодированных значений могут применяться к атрибутам с и числовым, и текстовым типом данных. Использование домена кодированных значений гарантирует, что атрибут будет иметь одно из ожидаемых значений.

Значения по умолчанию. При вводе данных можно использовать тот факт, что для некоторого атрибута одно значение наиболее часто встречается. Значения по умолчанию используются при создании, разделении или объединении пространственных объектов. Например, значение "жилой" может использоваться по умолчанию для атрибута типа землепользования при создании и разделении земельных участков.

Правила разделения и объединения объектов. Установив интервальный домен или домен кодированных значений, вы можете уточнить его, объявляя, что должно происходить при разбиении пространственных объектов.

Частый случай — это разбиение участка земли. Когда один участок разделяют на два, некоторые атрибуты получившихся новых участков должны меняться пропорционально размерам этих участков. Другим атрибутам должно присваиваться одно и то же значите. Третьим нужно присваивать значение по умолчанию.

При разделении объектов к их атрибутам могут применяться следующие правила разделения (split policies):

Значение по умолчанию — атрибуту обоих получившихся объектов присваивается значение по умолчанию.

Дублирование — оба получившиеся объекта наследуют значение атрибута исходного объекта.

Геометрическая пропорция — значение атрибута исходного объекта делится между получившимися объектами пропорционально их площади или длине.

При объединении объектов к их атрибутам могут применяться следующие правила объединения (merge policies):

Значение по умолчанию — атрибуту объединенного объекта присваивается значение по умолчанию.

Суммарное значение – атрибуту объединенного объекта присваивается сумма значений атрибута исходных объектов.

Взвешенное среднее – атрибуту объединенного объекта присваивается взвешенное среднее значений атрибута исходных объектов.

Простое поведение с использованием подтипов.

Имеется и более тонкий контроль корректности, дифференцирующий поведение групп пространственных объектов в пределах класса, которые называются подтипами.

Подтип — это специальный атрибут, позволяющий назначить свой вариант простого поведения для разных категорий объектов класса. Все подтипы объектов класса имеют один и тот же набор атрибутов.

Правила проверки корректности. Правила проверки корректности контролируют целостность пространственных объектов и атрибутов. Типами правил проверки корректности являются: атрибутивные правила, правила связности и правила отношений.

Атрибутивное правило — это атрибутивный домен, применяемый по отношению к подтипу класса. Примером атрибутивного правила может быть такое, что допустимая ширина - 35, 40, 45, а допустимое число рядов- 1,2,4.

Правила объединения/разделения определяют, как будут изменяться атрибуты при разбиении и объединении объектов: асфальтовая дорога при объединении получает число рядов по умолчанию.

Значения по умолчанию определяет, какое значение атрибута будет присвоено вновь создаваемому объекту: новой асфальтовой дороге по умолчанию дается ширина 35 футов.

Правило связности задает допустимые сочетания значений атрибутов соединяемых сетевых объектов. Двухрядная асфальтовая дорога может соединяться только с другой двухрядной дорогой.

Правило отношений ограничивает число элементов в отношении между классом-источником и классом-адресатом. Например, асфальтовая дорога может быть связана с пересечениями в виде эстакад или тоннелей.

Для реализации простого поведения объектов класс не обязательно должен иметь подтипы. Если ни один подтип не задан, вы, тем не менее, можете задавать атрибутивные домены, значения по умолчанию и правила, при этом они будут действовать по отношению ко всем объектам класса.

Основная причина использования подтипов– повышение быстродействия БГД. База геоданных с десятком–другим классов объектов обладает большим быстродействием, чем база геоданных со многими десятками или сотнями классов.

Общая характеристика персональных и многопользовательских баз геоданных.

Выше изложенное свидетельствует о том, что формат базы геоданных является в настоящее время наиболее развитым ГИС-форматом векторных данных, позволяющие более точно моделировать сложное поведение и разнообразные свойства объектов реального мира. У формата базы геоданных есть еще одно важное и полезное свойство, существование которого в других форматах векторных данных невозможно. Эта особенность заключается в возможности использования одной базы геоданных многими пользователями одновременно.

База геоданных представляет объектно-ориентированную модель данных. Вся информация о данных (пространственная, атрибутивная, отношения и т.д.) хранится в таблицах реляционных СУБД.

Базы геоданных работают со многими платформами СУБД, могут быть разного размера и обслуживать разное количество пользователей. Они варьируют от маленьких однопользовательских баз данных на основе Microsoft Jet Engine до крупных многопользовательских баз данных для рабочих групп, отделов и предприятий. По своей архитектуре база геоданных может быть персональной или многопользовательской.

Персональные базы геоданных, напрямую использовать которые могут все пользователи ArcGIS, используют файловую структуру базы данных Microsoft Jet Engine для хранения ГИС-данных в базах данных небольшого размера. Персональные базы геоданных во многом похожи на файловые рабочие области и поддерживают базы данных размером до 2 Гб. Для работы с атрибутивными таблицами в персональных базах геоданных используется Microsoft Access.

Персональные базы геоданных оптимальны для работы с небольшими наборами данных отдельных ГИС-проектов и малочисленных рабочих групп. Обычно пользователи применяют несколько персональных баз геоданных для сбора своих данных и одновременно используют их при работе с ГИС. Персональные базы геоданных поддерживают только однопользовательское редактирование. Не предусмотрен механизм поддержки версий.

Для работы с многопользовательскими базами геоданных необходимы серверное приложение ArcSDE и возможность работы с разными моделями хранения данных в СУБД (IBM DB2, Informix®, Oracle(с или без Oracle Spatial) и SQL Server). Многопользовательские базы геоданных в первую очередь используются на уровне рабочих групп, отделов или всей организации. Они используют все преимущества архитектуры соответствующих СУБД для поддержки:

очень больших, непрерывных баз ГИС-данных;

одновременной работы многих пользователей;

длинных транзакций и работы с версиями.

Многопользовательские базы геоданных могут иметь очень большие размеры и обеспечивают многопользовательский режим работы. Массовый опыт использования крупных баз геоданных свидетельствует об эффективности СУБД для перемещения больших двоичных объектов, например растровых изображений, в/из таблиц ГИС-данных. Кроме того, размеры базы данных ГИС и количество поддерживаемых пользователей могут быть гораздо большими, чем в случае ГИС на основе файловых баз.

Хранение объектов базы геоданных.

При просмотре базы геоданных в ArcCatalog вы видите таблицы базы геоданных как совокупности наборов классов или просто как отдельные классы объектов.

Каждый класс пространственных объектов базы геоданных содержит объекты одного геометрического типа. Классы объектов можно объединять в наборы классов объектов. Наборы классов объектов удобны для организации классов объектов с совместной топологией. Их можно также использовать для организации классов объектов по тематическому признаку. Например, можно объединить в один набор классов три класса водных объектов: точки – родники; линии- реки; полигоны- озера. Внутри набора классов объектов все классы объектов имеют единую систему координат.

В файловой системе (просмотр через Проводник Windows) персональные базы геоданных представлены файлом Microsoft Access (.mdb). Если открыть этот файл в Access то вы увидите совокупность взаимосвязанных таблиц.

Таблицы.

Таблица (table) состоит из строк и столбцов.

Строка (raw) — это фундаментальная единица информации в таблице и заключает в себе набор свойств объекта. Все строки в таблице должны иметь одинаковый набор свойств.

Столбец (column) представляет один и тот же атрибут для всех объектов-строк. Определение столбца — его имя и формат, обеспечивающий хранение идентификатора или геометрии объекта, действительного или целого числа, или символьной строки - называют полем.

Виды таблиц. В базе геоданных, таблицы могут хранить непространственные объекты, пространственные объекты и отношения.

Таблицу, содержащую непространственные объекты, называют объектным классом. Эти таблицы обычно содержат дополнительные атрибуты, расшифровки кодов или значения координат. Они могут быть получены из других приложений.

Таблицу, содержащую пространственные объекты, называют классом пространственных объектов. В таблице есть два набора полей: предопределенные поля (predefined fields) — для однозначной идентификации объектов и хранения формы пространственных объектов, — и пользовательские поля (custom fields) — для определения дополнительных атрибутов пространственных объектов. Для каждого класса, поля обоих видов располагаются в одной и той же таблице.

Например, класс пространственных объектов с линейной геометрией имеет ряд предопределенных полей: уникальный идентификатор пространственного объекта, попе слежения за геометрией для записи длины пространственного объекта, поле геометрии для представления формы пространственного объекта. Предопределенные поля управляются ArcGIS ArcInfo, их нельзя модифицировать какими-либо иными программами, осуществляющими доступ к базе данных.

Остальные показанные поля- пользовательские. В качестве примера различных типов атрибутов приведены кодированные значения для типа дороги, описательная строка для типа покрытия, непрерывное числовое значение для ширины дороги, дискретное числовое значение для числа рядов и текст для названий дороги.

Структура растровых данных.

Другим способом представления географического пространства является растровый способ. В настоящее время разработано множество форматов растровых данных. Но все они имеют одинаковую структуру.

Набор растровых данных хранит двухмерную матрицу, в каждой ячейке которой хранится измеренное, интерполированное или иначе вычисленное значение. Все ячейки имеют одинаковые ширину и высоту.

Географические координаты верхнего левого угла сетки вместе с размерами ячейки и количеством их строк и столбцов однозначно определяют пространственный экстент набора растровых данных.

Глубина цвета.

Изображения хранятся в файлах изображений, называемых также image-файлами, и содержат только числа. Такое представление данных преобразуется в изображение, когда они отображаются на экране монитора или выводятся на печать. При этом программа каждому значению пикселя (или нескольким значениям пикселя, если это многоканальный растр) ставит в соответствие один цвет и с помощью этого цвета отображает пиксель на экране монитора. Цвет каждого пикселя (красный, чёрный, белый или любой другой) хранится в компьютере как комбинация битов. Бит (двоичный разряд) является наименьшей единицей информации, которая может принимать лишь одно из двух значений (да/нет, плюс/минус, чёрное/белое, включено/выключено и т.д.). Чем больше битов используется для пикселя, тем больше оттенков цветов можно получить. Число битов, используемых компьютером для каждого пикселя, называется битовой глубиной, или глубиной цвета. В зависимости от различной глубины цвета выделяют следующие типы растровых изображений:

чёрно-белые штриховые (монохромные);

полутоновые (в оттенках серого);

с индексированным цветом;

полноцветные.

В чёрно-белых штриховых (монохромных) изображениях для хранения каждого пикселя используется лишь один бит информации. Одним битом кодируются два состояния, т.е. два цвета: черный или белый. Глубина цвета в этом случае - один бит, и такой тип изображения называется 1-битовым.

В полутоновых изображениях каждый пиксель кодируется 8 битами (8 бит составляют 1 байт). Глубина цвета такого изображения составляет 8 бит, а каждый его пиксель может принимать одно из 256 различных значений (28=256). Серая шкала имеет 256 градаций серого цвета, каждая из которых характеризуется значением яркости в диапазоне от 0 (черный) до 255 (белый). К полутоновым изображениям относятся аэрофотоснимки и панхроматические космические снимки (SPOT, Ikonos и т.п.). На них информация о земной поверхности представлена 256 оттенками серого цвета.

Изображения с индексированным цветом имеют ограниченную цветовую гамму. Пиксели таких изображений кодируются 4 битами (24=16 цветов) или 8 битами (28=256 цветов). Такие цвета называются индексированными (indexed color). Разумеется, 16 (и даже 256) цветами невозможно полностью передать цветовую гамму фото­изображений. Однако иногда изображения с индексированным цветом можно использовать вместо полноцветных, так как для хранения таких изображений требуется гораздо меньше ресурсов памяти компьютера. Например, топографическая карта имеет всего 8 цветов, и нет смысла хранить её в полноцветном или даже в 256-цветном режиме.

К полноцветным относятся изображения с глубиной цвета не менее 24 бит, что даёт возможность отобразить 16,7 млн цветов (224). Поэтому иногда полноцветные изображения называют true color (истинный цвет). Примером таких изображений могут служить высококачественные цветные фотографии, многозональные кос­мические снимки и т.п.

Способы представления изображений.

На рисунке представлено одно и то же изображение, но с разной глубиной цвета. Необходимо отметить, что глубину цвета растрового изображения всегда можно уменьшить, а вот снова увеличить нельзя. Например, из 24-битного растра можно сделать 4- или 8-битный, но из 4- или 8-битного восстановить 24-битный цвет невозможно. Особенно надо быть внимательным при превращении цветного изображения (полноцветного или с индексированным цветом) в полутоновое или чёрно-белое, поскольку информация о цвете будет утеряна.

От глубины цвета зависит размер файла растрового изображения. Чем больше глубина цвета, тем больший объём компьютерной памяти требуется для хранения изоб­ражения. Самый большой размер файла имеют полноцветные 32-битные и 48-битные изображения, а самый маленький - 1-битовые (чёрно-белые). Если изменить глубину цвета растрового изображения с 24 бит до 8 бит, то размер файла изображения уменьшится в 3 раза. Каждый пиксель растра теперь потребует в 3 раза меньше памяти, чем ранее (24/8=3), и, следовательно, весь файл будет в 3 раза меньше.

Отображение одноканальных растров.

,Растр может иметь один или несколько каналов. Значения ячеек могут отображаться различными способами. Значения ячеек в одноканальных растрах могут быть отображены следующими тремя базовыми способами (на слайде приведены некоторые из способов отображения одноканальных растров на основе значения ячеек).

В бинарном изображении каждая ячейка имеет значение 0 или 1. Такие изображения часто используются для сканирования карт с простым линейным рисунком, типа карт земельных участков.

В полутоновом изображении каждая ячейка имеет значение от 0 до 255. Такие изображения часто используются для черно-белых аэрофотоснимков.

Цветовая таблица. Один из способов представить цвета на изображении - это использовать таблицу цветов. Значениям ячеек произвольно сопоставляются тройки значений компонент цвета - красной, зеленой и синей. В данном случае речь идет о цветовой модели RGB.

Цветовые модели – это способы разделения цветового оттенка на составляющие компоненты. В компьютерной графике в основном применяют цветовые модели RGB, CMYK, HSB и др.

Цветовая модель RGB описывает способ получения цвета на экране монитора или телевизора. Название происходит от трёх базовых цветов, используемых в модели - Red, Green, Blue (красный, зелёный, синий). Базовые цвета иначе называются каналами. Следовательно, RGB - трёхканальная цветовая модель. Смешав три базовых цвета в разных пропорциях, можно получить всё многообразие оттенков.

Яркость каждого базового цвета может принимать значения от 0 до 255 (256 значений). Для кодирования всех возможных значений яркости одного базового цвета (канала) достаточно 8 бит (28=256), а для всей модели (3 канала) - 24 бит (224=2563=16 777 216). Таким образом, модель RGB описывает более 16 млн цветов.

Если значения яркости трёх базовых цветов равны нулю (R: 0, G: 0, В: 0), то получается чёрный цвет. Если яркость всех трёх базовых цветов максимальна (R: 255, G: 255, В: 255), при их сложении получается белый цвет. Если яркость каждого базового цвета одинакова, но находится в промежутке от 0 до 255 (например, R: 204, G: 204, В: 204 - см. фоновый цвет табл. 5), получается серый цвет. При этом, чем больше значения яркостей, тем серый цвет светлее. Чтобы получить один из базовых цветов модели, необходимо установить яркость этого цвета максимальной, а остальных каналов - минимальной. Например, R: 255, G: 0, В: 0 - красный цвет, R: 0, G: 255, В: 0 - зелёный, R: 0, G: 0, В: 255 - синий.

Отображение многоканальных растров.

Набор растровых данных может иметь несколько каналов. Каналы набора растровых данных используют одну и ту же сетку, но значения ячеек в них — разные. Многоканальные растры чаще всего используются для хранения многозональных космоснимков и фотографий. В этих случаях один канал представляет определенный участок спектра электромагнитных волн, зафиксированный сенсором, включая диапазоны, не видимые глазом – инфракрасные или ультрафиолетовые области спектра.

Каналы растра часто сопоставляются красной, зеленой и синей компонентам. Для каждой компоненты («красной», «зеленой», «синей») значения ячеек лежат в пределах от 0 до 255. Такая комбинация может быть непосредственно отображена на мониторе компьютера, который использует эти компоненты для воспроизведения всевозможных цветов.

Формат TIN.

Нерегулярная триангуляционная сеть (TIN) (triangulated irregular network) служит эффективной и точной моделью для описания непрерывных поверхностей. Программное обеспечение по работе с TIN включает многие функции анализа поверхностей.

Упрощенно, набор данных TIN формируется следующим образом: из набора точек с координатами х, у, z программное обеспечение ГИС создает оптимальную сеть треугольников, называемую триангуляцией Делоне, при которой грани в TIN создаются как можно более похожими на равносторонние треугольники.

Грань TIN представляет собой треугольник, расположенный в трехмерном пространстве. Грань определяет плоскость, ее уклон и направление уклона.

Для любой точки с координатами (х, у) с помощью TIN можно рассчитать высоту (а точнее координату z), сначала находя содержащую эту точку грань, и затем интерполируя значение высоты в ее пределах.

TIN является эффективным методом представления поверхностей, так как плотность точек в любой части поверхности может быть пропорциональна пересеченности рельефа. Для плоской равнины достаточно малой плотности точек. Гористый рельеф требует высокой плотности точек, особенно на участках быстрых перепадов высот. С помощью TIN можно представлять не только рельеф, но и любую другую измеряемую поверхность, а также цифровые модели местности, включающие трехмерные географические объекты (здания, промышленные объекты и др. ).

Хранение растровых данных и наборов TIN в ArcCatalog.

ArcCatalog позволяет вам напрямую обращаться к растровым данным, хранящимся в разных форматах. Все растровые данные в ArcCatalog отображаются одинаково, независимо от их формата. Поддерживаемые растровые форматы перечислены в диалоговом окне Опции в ArcCatalog. Однако вы можете сделать видимыми расширения растровых файлов, отключив опцию Скрыть расширения файлов в диалоговом окне Опции. Поддерживаемые растровые форматы перечислены в диалоговом окне Опции в ArcCatalog.

Наборы растровых данных состоят из одного или нескольких диапазонов (каналов). Отдельные гриды, такие как цифровые модели высот (DEM), или изображения с одним диапазоном отображаются в ArcCatalog как растровые наборы данных с одним каналом. Многозональные изображения отображаются как растровые наборы данных, содержащие несколько каналов.

Несколько наборов растров могут быть объединены в каталоги растров. Каталоги растров содержат или ссылаются на многие связанные растры, которые могут быть представлены в различных форматах и с различным разрешением.

Вы можете работать с множеством типов изображений, гридов ESRI и растрами, хранящимися в базах геоданных.

Наборы данных TIN отображаются желтой пиктограммой с символом пирамиды, TIN используются в качестве альтернативы растрам для представления поверхностей.

Хранение растровых данных и наборов TIN в файловой системе.

В файловой системе растровые наборы данных отображаются в виде совокупности нескольких файлов- файла содержащего собственно изображение и вспомогательных файлов. Названия файлов имеет единую основу, но разные расширения.

Вспомогательный файл (.aux) – это файл, связанный с набором растровых данных и расположенный в той же папке и содержащий любую дополнительную информацию, которая не может быть сохранена внутри набора растровых данных.

Так, если статистическая информация не может быть сохранена внутри растрового формата, она будет сохранена во вспомогательном файле. Этот файл создается автоматически при первой попытке выполнить задание с вашим растровым слоем, если это задание требует наличия статистики. Однажды созданный этот файл будет использоваться во всех дальнейших процедурах, требующих статистической информации. В .aux-файле также хранится указатель на файл пирамидных слоев (.rrd), конечно, если пирамидные слои для набора растровых данных строились. Если вы используете операционную систему для перемещения набора растровых файлов, для которых ранее строились пирамидные слои, программное обеспечение будет искать файлы .rrd в указанном месте. Если .rrd файлы там найдены не будут, программа стать искать их в той папке, в которую вы переместили набор растровых данных. Рекомендуется использовать приложение ArcCatalog для копирования или перемещения наборов растровых данных, в таком случае вы можете быть уверены, что будут скопированы и все вспомогательные файлы.

Файлы пирамидных слоев .rrd. Для несжатых наборов растровых данных размер файла .rrd составляет примерно 8 процентов от исходного размера набора растровых данных. Тем не менее, в зависимости от способа сжатия исходного растра, несжатый файл .rrd может быть больше, чем исходный файл.

Еще одним видом вспомогательного файла является так называемый файл привязки (world file). Файл привязки является текстовым файлом и содержит информацию о преобразовании внутренних координат изображения к реальным земным координатам. Файл привязки изображения использует то же самое имя, что и само изображение, но с добавлением "w". Например, файл привязки изображения с именем karta_3_1.bmp будет назван karta_3_1.bmpw.

Файлы с дополнительным расширением .xml являются файлами метаданных.

Изображения в формате ESRI ARC GRID имею более сложную организацию. Файлы грида объединяются в специальную папку с названием этого грида и управляются через папку info подобно покрытиям ArcInfo. Также как и другие изображений, они могут иметь вспомогательные файлы .aux и .rrd

TINы в файловой системе представлены в виде папок с наборами файлов, обеспечивающих структуру T

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]