Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ГИТ лекционный курс / Тема 7 текст

.pdf
Скачиваний:
60
Добавлен:
10.02.2015
Размер:
446.5 Кб
Скачать

Тема № 7. Форматы данных ГИС.

Слайд 2. Форматы данных ГИС.

Современные геоинформационные системы работают с множеством форматов данных. Эта множественность объясняется разнообразием задач, решаемых с помощью ГИС и использованием в ГИС специфических данных, таких как, например, результаты переписи населения или материалы космической съемки.

Кроме того ГИС возникли и развивались на стыке разных предметных областей (география, экономика, природные ресурсы, прикладная математика и т.д.), каждая из которых использует свои специфические базы данных и свои форматы данных. Со временем информационные ресурсы и технологии развивались, совершенствовались, форматы данных менялись и в том или ином виде наследовались геоинформационными системами.

С другой стороны современные ГИС способны по-разному представлять географическое пространство:

o как собрание отдельных объектов в векторной модели o как сетку ячеек растра

o как набор точек триангуляции.

Соответственно существуют три основные группы форматов данных:

Векторные (шейп-файлы, покрытия ARC/INFO, чертежи САПР и др.)

Растровые изображения и гриды (BMP, TIFF, JPG, ERDAS IMAGINE, ESRI ARC GRID, GIF, MrSID и др.)

Триангуляционные (TIN)

Увас уже есть некоторое представление о векторных и растровых моделях данных. Триангуляционные модели предназначены для представления поверхностей. Таблицы и текстовые файлы также важны в ГИС, так большая часть атрибутивной информации записывается в виде таблиц или текстов.

Многообразие форматов порождает трудности в обмене данными между разными системами. Многие ГИС имеют специальные трансляторы для преобразования данных, либо развивают собственное программное обеспечения таким образом, чтобы оно напрямую читало и работало с несколькими форматами данных.

В ArcGIS, например, есть специальный модуль

Data Interoperability,

предназначенный для конвертации данных из различных ГИС-форматов. Data

Interoperability добавляет возможность прямого чтения и использования данных в более чем 60 распространенных векторных ГИС-форматах. Например, можно обращаться, отображать и напрямую использовать в ArcGIS такие источники данных, как наборы навигационных данных S57, наборы данных САПР с атрибутами, наборы данных MapInfo и др. Этот модуль позволяет обмениваться ГИС-данными, используя разнообразные форматы экспорта векторных данных (более 50 поддерживаемых форматов).

Слайд 3. Шейп-файл: типы пространственных объектов.

Наибольшее распространение имеют векторные форматы данных. Как вы уже знаете, векторные данные лучше всего подходят для описания дискретных объектов с определенными формами и границами. Однородные географические объекты объединяются в однородные наборы данных или классы.

Классы простых пространственных объектов представляют объекты с помощью точек, линий и полигонов, но не содержат топологических связей.

Преимущество такой структуры состоит в простоте и высокой скорости отображения. Все недостатки модели вытекают из отсутствия топологии. Кроме того, классы простых пространственных объектов не пригодны для описания отношений и сложного поведения объектов.

Тем не менее, простые пространственные объекты составляют значительную часть существующих географических данных, т.к. они легко создаются и достаточны для географических данных, образующих фоновые слои карт.

Простые пространственные объекты очень часто создаются и распространяются в форматах шейп-файла или чертежа САПР (Система автоматизированного проектирования).

Шейп-файлы удобны для картопостроения и некоторых видов анализа. Этот формат был разработан компанией ESRI в начале 1990-х годов, для того, чтобы удовлетворить потребность в использовании наборов данных с простыми пространственными объектами.

Шейп-файлы представляют собой нетопологическую векторную структуру данных. В каждом шейп-файле хранятся объекты только с одним видом геометрии: точки, многоточечные объекты, линии, полигоны.

Точечные формы – это просто объектыотдельные точки, например скважины. Мультиточка – это набор точек, составляющих один объект. Несмотря на то, что

мы видим несколько графических элементов, программа будет воспринимать их как один объект, и в атрибутивной таблице ему будет соответствовать одна запись. Примером

многоточечного объекта может быть группа маленьких островов или несколько отдельно стоящих деревьев.

Линейные формы могут быть простыми непрерывными линиями, как, например, линия разлома на карте. Они могут быть также составными: состоящими из связанных частей (разветвляющиеся полилинии, как, например, река). Или состоять из несвязанных частей. Составные полилинии, как и мультиточка, являются единым объектом.

Полигональные формы могут представлять собой простые области (простой полигон), например, территорию государства. Они могут состоять из нескольких частей (составные полигоны), например, несколько участков леса, разделенных полями. Полигональные формы могут пересекаться друг с другом, но в шейп-файле не содержится информация об этом. Примером налагающихся полигонов могут служить сферы обслуживания магазинов.

Составные полигоны (несвязанные или пересекающиеся) также являются единым объектом.

Слайд 4. Хранение шейп-файлов.

Если мы в Проводнике Windows откроем папку, в которой хранятся шейп-файлы, то каждый шейп-файл предстанет в виде списка, по крайней мере, 3-х файлов:

o <имя>.shp o <имя>.dbf

o<имя>.shх

Все компоненты шейп-файла имеют одно имя. Файл с расширением .shp содержит

пространственные данные в двоичном коде, файл с расширением .dbf - атрибутивные данные в таблице в формате dBASE. Файл с расширением .shх представляет собой пространственный индекс, в котором в сжатом виде описана структура файла .shp. Другими словами, файл с расширением .shх является ключом к пространственным данным, благодаря которому осуществляется быстрое чтение шейп-файла, а следовательно, все операции поиска и выборочного отображения объектов.

Шейп-файл может включать четыре дополнительных файла с индексной информацией. Файлы с расширениями .sbn и .sbx образуются, когда мы обращаемся к шейп-файлу с пространственным запросом (т.е. ищем объекты на основе их местоположения). Два атрибутивных индексных файла ( .ain и . aix ) создаются операцией реляционного связывания таблиц. Данные файлы позволяют быстрее осуществлять поиск атрибутов. Все эти файлы записываются в каталог источника данных.

В папке, где хранится шейп-файл вы можете увидеть еще два файла :

o<имя>.prj - файл пространственной привязки, содержащий информацию о системе координат шейп-файла.

o <имя>.shp.xml - файл метаданных. Метаданные – это информация, которая характеризует ваши данные, подобно тому, как карточка в библиотечном каталоге описывает книгу. Метаданные могут содержать различную информацию: кто автор или владелец этих данных, какова точность данных, в какой системе координат они находятся, дата последнего обновления и др.

В ArcCatalog все файлы, образующие шейп-файл, представлены как один класс пространственных объектов. При перемещении, переименовании, копировании или удалении шейп-файла ArcCatalog сам позаботится о том, чтобы все файлы, составляющие шейп-файл, участвовали в операции. Если пользователь работает в обычной файловой системе, он должен сам позаботиться об изменении или переносе всех файлов, составляющих шейп-файл.

Слайд 5. Рисунки и наборы данных САПР.

К настоящему времени в файлах чертежей САПР собран значительный объем географических данных. САПР (Система автоматизированного проектирования) является системой компьютерного черчения и собственно ГИСпродукты не создает. Особенность файлов САПР состоит в том, что пространственные объекты в них обычно подразделены на множество слоев: например, здание может быть представлено и полигоном, и линейным объектом, представляющим границу этого полигона. С точки зрения ГИС этот формат данных имеет переизбыток информации.

Рисунок САПР является аналогом карты, на котором отображены все картографируемые элементы, используя символы, хранящиеся в самом рисунке.

Каждому рисунку САПР на диске в дереве Каталога соответствуют два элемента: набор данных САПР и рисунок САПР.

Набор данных САПР (слой САПР) это нечто иное, нежели слой на карте. Если набор данных САПР имеет 17 слоев – 3 точечных, восемь линейных, четыре полигональных, и два из подписей – то они будут объединены в класс точечных объектов САПР, класс линейных объектов САПР, класс полигональных объектов САПР и класс подписей САПР. Таким образом, класс пространственных объектов САПР содержит все точки, или все линии, или все полигоны или все аннотации рисунка, а также их атрибуты.

Дополнительные атрибуты пространственных объектов могут храниться в отдельных таблицах.

Слайд 6. Покрытия ARC/INFO: типы объектов.

Следующий формат данных существенно отличается от вышеописанных, он основан на топологической векторной структуре данных.

Формат покрытия ARC/INFO был разработан компанией ESRI очень давно и многие годы использовался как стандарт представления векторных данных. Формат покрытия нашел успешное и широкое применение в государственных учреждениях, частных копаниях и независимых организациях всего мира благодаря эффективному хранению пространственных и топологических данных; при этом атрибутивные данные хранятся в реляционных таблицах, которые можно дополнять пользовательскими полями и соединять с другими базами данных.

Покрытия объединяют пространственные и атрибутивные данные, а также хранят топологические связи между пространственными объектами. Пространственные данные хранятся в двоичных файлах. Топологические и атрибутивные данные хранятся в таблицах INFO.

Покрытия, в отличие от шейп-файла, могут содержать внутри себя пространственные объекта разного типа и разной геометрии.

Первичными типами пространственных объектов являются точки (points), дуги

(arcs), полигоны (polygons) и узлы (nodes). Эти пространственные объекты обладают топологическими связями: дуги образуют периметры полигонов, узлы являются концевыми точками дуг. Точечные пространственные объекты имеют двойное значение: они могут представлять собственно точечные объекты, они могут так же отмечать внутреннюю область полигонов.

Производными типами пространственных объектов являются тики (ticks), векторы смещений (links), подписи (annotations). Тики используются для пространственной привязки данных, векторы смещений – для геометрической корректировки пространственных объектов (исправления формы), подписи (аннотации) - для подписывания пространственных объектов на карте.

Покрытия могут также содержать составные пространственные объекты. Маршрут представляет собой цепочку дуг с определенной на ней линейной системой координат. Маршруты обычно используются для моделирования транспортных систем. Регионы представляют собой собрание полигонов, которые могут быть смежными,

перекрывающимися, или не имеющими общих точек. Регионы обычно используются в приложениях по землепользованию и окружающей среде.

Для крупных наборов данных, покрытия разбиваются на листы в библиотеки карт.

Слайд 7. Хранение покрытий: рабочие области.

Покрытия ARC/INFO хранятся не в любом, а в специально отведенном месте дискового пространства, называемом Рабочая область ARC/INFO.

Рабочая область ARC/INFO – это особая папка в файловой системе. Папка рабочей области содержит папку info и папки с именами покрытий для каждого покрытия в рабочей области. Здесь рабочая область называется a_workspace, покрытия - a_coverage, b_coverage. Папка покрытия содержит набор файлов, в которых хранится информация об объектах покрытия (координаты, топология и т.д.). Атрибуты объектов покрытия хранятся

втаблицах атрибутов объектов, управляемых базой данных INFO™. Папка info содержит файлы данных INFO и параметры таблиц для каждого покрытия.

ВArcCatalog рабочая область представлена иначе. Мы видим рабочую область покрытия в виде папки с данными. По иконке покрытия мы можем узнать его геометрический тип (точечный, линейный, полигональный). Можно также видеть классы объектов покрытия.

На слайде показаны две рабочие области National_Park_Coverages и Maplewood. Рабочая область Maplewood содержит покрытие floodcov с полигональной топологией. Покрытие floodcov содержит:

Класс дуг покрытия - линейные пространственные объекты Класс точек меток покрытия - точки меток, которыми отмечены полигоны. Каждый полигон имеет одну метку.

Класс полигональных пространственных объектов покрытия содержит простые площадные объекты.

Класс регионов покрытия содержит сложные площадные объекты.

Класс тиков покрытия содержит точки, используемые для регистрации карт в географическом пространстве.

Врабочей области покрытия могут также находиться дополнительные файлы, если

вбазе данных INFO хранятся другие таблицы, например, связанные таблицы данных или справочные таблицы символов. Все таблицы управляются через подпапку info, в ArcCatalog невидимую. При выполнении в ArcCatalog операций по созданию, перемещению и удалению элементов рабочей области ARC/INFO, ее целостность

поддерживается автоматически. Нельзя использовать Проводник Windows для управления покрытиями, в противном случае будет нарушена синхронизация между покрытиями и подпапкой info, и данные будут испорчены.

Слайд 8. База геоданных: геометрия пространственных объектов.

В1999 году компания ESRI выпустила в свет свою последнюю разработку – новый формат географических данных, - который называется база геоданных.

Базы геоданных реализуют объектно-ориентированную модель данных ГИС. В базе геоданных каждый пространственный объект хранится в виде строки таблицы. Векторная форма объекта хранится в поле формы объекта, а атрибуты - в других полях. В каждой таблице хранится класс объектов.

Вдополнение к пространственным объектам базы геоданных могут хранить растры, таблицы данных и ссылки на другие таблицы. Базы геоданных - это хранилища, позволяющие держать все пространственные данные в одном месте. Их можно определить как СУБД с добавлением покрытий, шейп-файлов и растров. Однако, в них имеются также важные новые возможности, отсутствующие в файловой модели данных.

Одно из преимуществ базы геоданных в том, что в ней можно задавать поведение объектов; все пространственные объекты базы геоданных хранятся в одной базе данных, при этом большие классы объектов базы геоданных можно хранить, не разделяя на части.

Помимо общих объектов, таких как точки линии, полигоны, можно создавать пользовательские объекты, например, трансформаторы, трубопроводы или участки. Для пользовательских объектов можно определить специальное поведение, что позволяет лучше представить объекты реального мира. Поведение объектов можно использовать для поддержки сложного моделирования сетей, предотвращения ошибок при вводе данных, особого способа визуализации объектов, создания собственных форм для проверки или ввода атрибутов объектов.

Поскольку возможно создание собственных пользовательских классов объектов, количество классов объектов неограниченно. Класс пространственных объектов имеет специальное поле, хранящее форму и положение пространственных объектов. Это поле называется shape (форма), и оно является полем типа геометрия (geometry). Все

пространственные объекты в пределах одного класса пространственных объектов обладают одним типом геометрии. Базовыми геометрическими классами объектов

(формами) являются точки, мультиточки, линии и полигоны. Вы можете также создавать объекты с новой геометрической формой.

Поле shape класса пространственных объектов может относится к одному из следующих типов геометрии: точка, мультиточка, полилиния или полигон.

Пространственный объект с формой точки (point) имеет единственную пару координат (x,y) или тройку координат (x,y,z). Пространственный объект с формой мультиточки (multipoint) обладает неупорядоченным набором из нескольких пар или троек координат. Геометрия базы геоданных принципиально двухмерная, но вы можете задать свое z-значение каждой формообразующей точке точечного, мультиточечного, линейного или полигонального объекта. Z-значения обычно представляют высоты, но они могут также представлять и другие показатели, например, количество осадков.

Пространственный объект с формой полилинии (polyline) имеет один или несколько путей. Путь – это цепочка сегментов, каждый из которых может быть одного из следующих типов параметрических кривых: прямая линия, дуга окружности, дуга эллипса или кривая Безье. С полилинией может ассоциироваться необязательное z- значение или m-значение (линейная мера). Z-значения могут применяться к таким линейным пространственным объектам как реки или гребни. Линия гребня, например, образует некоторый профиль поверхности, и вы можете задать конкретные высоты в каждой промежуточной точке этой линии.

m-значение: некоторые приложения используют линейную систему измерения, которая основана на расстояниях вдоль путей. Вы можете задать свое m-значение каждой формообразующей точке линейного объекта. Примером линейной системы измерений являются километровые столбы или пикеты вдоль дорог или каналов.

Пространственный объект с формой полигона (polygon) имеет одно или более колец. Кольцо – это замкнутая цепочка сегментов. Каждый сегмент может быть типа прямой линии, дуги окружности, дуги эллипса или кривой Безье. Кольцо не может иметь самопересечений, но может пересекать другие кольца в полигоне. Кольца в полигоне могут соприкасаться в любом числе точек. С полигоном может быть ассоциироваться необязательное z-значение.

В формате базы геоданных (в отличии от покрытий) одночастные и много частные объекты находятся в одном классе объектов. Другое важное отличие состоит в поддержке параметрических кривых: дуг окружностей, дуг эллипсов, кривых Безье. Эти типы линий позволяют точнее представлять форму пространственных объектов, и особенно важны в строительных приложениях.

Слайд 9. База геоданных: пространственная привязка.

Геометрия пространственных объектов хранится как упорядоченный набор координат x и y, который может дополняться z- и m-значениями. Эти координаты соотносятся с точками на поверхности Земли посредством пространственной привязки, состоящей из нескольких частей.

Одна часть привязкиэто система координат. Другая часть пространственной привязки определяет представление координат в базе геоданных. Чтобы избежать неоднозначности при сравнении местоположений и применении пространственных операторов, внутри базы геоданных для хранения координат используются целые числа.

При отображении карты на мониторе эти целочисленные значения преобразуются в единицы карты и обратно, и вам не приходится думать о них , за исключением случая, когда определяется координатный домен и масштаб пространственной привязки.

Координатный домен состоит из минимальных и максимальных значений для x и y, и возможно, z- и m. Масштаб определяет, сколько целочисленных единиц соответствует одной единице карты. Если масштаб равен 1000, то максимальная точность представления координат равна 1/1000 единицы карты.

Существует определенная связь между масштабом и координатным доменом. Очень большое значение масштаба сужает пространственный домен. Практическое правило таково: произведение масштаба и наибольшего интервала координат в домене не должно превышать 231.

Пространственная привязка ассоциируется с классом пространственных объектов. Если классы пространственных объектов организованы внутри набора классов объектов, то все эти классы пространственных объектов совместно используют одну и ту же пространственную привязку. База геоданных может иметь множество пространственных привязок, - по одной на каждый набор классов объектов и каждый автономный класс пространственных объектов.

После того, как пространственная привязка ассоциирована с классом пространственных объектов или набором классов объектов, вы можете менять систему координат, но не координатный домен или масштаб.

Слайд 10. База геоданных: отношения между объектами.

Объекты в реальном мире имеют отношения с другими объектами. Одни объекты имеют фиксированный пространственный экстент (на пример, леса), другие – не имеют (например, люди).

Одним из примеров отношений между объектами является связь земельного участка с владельцем, зоной землепользования, учетной записью или зданием.

Желательно отслеживать эти отношения так, чтобы, когда один объект меняется, связанные с ним объекты могли реагировать. Например, когда удаляется инженерная опора, должны удаляться и все прикрепленные к ней трансформаторы и другое оборудование.

Формат базы геоданных имеет средства явного определения отношений среди пространственных и непространственных объектов.

Различают три вида отношений: топологические, пространственные и общие. Топологические отношения встраиваются в данные в момент создания

геометрической сети или плоской топологии (внутри одного класса). Топология базы геоданных аналогична топологии покрытия Arc/Info. Эти отношения позволяют быстро находить соседние полигоны или пересекающиеся линии. В базе геоданных кроме плоской топологии реализован еще один топологический механизм, позволяющий отслеживать пространственные отношения между объектами разных классов пространственных объектов (между объектами разных слоев), осуществляя, таким образом, межслойную или трехмерную топологию. Например, если граница между государствами подходит по реке, то объекты линейного класса реки должны совпадать с объектами линейного класса граница. Или изолиния с нулевой отметкой должна точно соответствовать границе полигона, представляющего акваторию моря.

Пространственные связи. ArcGIS ArcInfo реализует богатый набор пространственных операций, которые позволяют определить такие пространственные отношения между объектами как касание, совпадение, пересечение, размещение внутри или вовне. Например, может быть решена такая задача: «Определить общую протяженность автомобильных дорог Республики Татарстан» или «Найти все автомобильные дороги, пересекающие железнодорожную».

Общие отношения – формируют явную постоянную связь между пространственным или непространственным объектом из классаисточника с пространственным или непространственным объектом из классаадресата.

Слайд 11. База геоданных: кардинальность общих отношений.

Отношения имеют определенный набор характеристик. Одной из характеристик является понятие кардинальности отношений. Кардинальность определяет, сколько объектов типа А связано со сколькими объектами типа Б. В целом, отношения могут

Соседние файлы в папке ГИТ лекционный курс