Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ГИТ лекционный курс / Тема 5 текст

.pdf
Скачиваний:
67
Добавлен:
10.02.2015
Размер:
244.21 Кб
Скачать

ТЕМА № 5. Модели представления данных ГИС.

Слайд 2. Дискретные и непрерывные данные.

Многие реальные географические объекты имею форму с четким контуром. Говорят, что такие объекты дискретны. У дискретного объекта есть известная определенная граница. Можно точно определить, где объект начинается, и где он заканчивается. Озеро - это дискретный объект на карте ландшафта. Можно точно определить границу воды и суши. Другие примеры дискретных объектов: дороги, здания, участки. Дискретные объекты обычно бывают искусственными (созданными человеком) и обычно описываются векторным типом данных.

Непрерывные данные называют также недискретными или поверхностями. Непрерывные данные описывают объекты или явления, которые существуют в каждой точке пространства. Одним из типов непрерывных данных могут быть значения высот над уровнем моря. Примером постепенно меняющихся данных может служить распространение жидкостей или газов - рассеивание или любое другое перемещение, при котором явление передвигается из районов высокой концентрации в районы низкой концентрации, пока уровни концентрации не выравниваются. Примеры поверхностей такого типа - это распределение концентрации соли в почве или воде, уровня загрязнения от выброса загрязняющего вещества или ядерного реактора, огня от лесного пожара. На поверхности, отражающей концентрацию явления на рисунке справа, концентрация в любой точке будет функцией от способности явления двигаться через среду. Непрерывные данные обычно описываются растровым типом данных.

Существует другой тип непрерывных данных, которые относятся к непрерывным достаточно условно, и могут, в принципе, рассматриваться как дискретные данные. Примером таких данных могут быть данные, отражающие расселение популяций животных или плотность населения людей, распределение потенциальных клиентов магазина и распространение эпидемии, т.к. людям и другим живым организмам свойственно собираться в группы или стаи (т.е. образовывать дискретные объекты), а не расселяться по поверхности Земли равномерно.

Таким образом, многие объекты не являются явно непрерывными или явно дискретными. Создается единая среда представления географических объектов, в которой крайние случаи будут чисто дискретными или чисто непрерывными. Большинство

явлений находится где-то между крайностями. Примерами объектов промежуточного типа могут быть типы почв, границы лесов, болот или географические границы рынков сбыта, на которые влияет телевизионная рекламная кампания. Из этого следует, что для представления дискретных данных может быть использована модель непрерывных данных – растровая модель, а для непрерывных данных– векторная модель.

Фактором определения положения объектов в диапазоне от непрерывных до дискретных явлений может быть простота выявления его границ. Если границу между шоссе и окружающими его полями можно определить довольно просто, то граница между болотом и заболоченным лугом определяется не столь очевидно и сетка растра, состоящая из ячеек, позволит представить ее с большей или меньшей точностью, не хуже, чем в векторном способе.

Растровый и векторный - два принципиально разных, но совершенно равноправных способа представления географического пространства, одинаково важны при изучении географического пространства. Нельзя говорить, что один способ хуже или лучше другого. Они призваны решать разные задачи. Выбор модели данных зависит от того, какие объекты мы собираемся исследовать, и какие методы исследования хотим применить. На выбор модели также влияет масштаб исследований. Кроме того, часто мы бываем ограничены физическими возможностями компьютеров и способов сбора данных.

Слайд 3. Растровая модель данных: растр изнутри

Растровая модель данных использует разбиение пространства на множество элементов, каждый из которых представляет малую, но вполне определенную часть земной поверхности.

Растровый набор данных состоит из ячеек. Каждая ячейка, или пиксель, - это квадрат, представляющий определенную часть территории. Все ячейки растра должны быть одного размера.

Строки и столбцы. Ячейки организованы в виде строк и столбцов, составляя двумерную матрицу. Для каждой ячейки существует уникальный адрес, состоящий из номера строки и номера столбца. Все точки исследуемой области покрываются ячейками растра.

Ячейки растрового набора данных могут быть любого размера, но они должны быть достаточно малы, чтобы отразить все детали, необходимые для анализа данных. Ячейка может представлять квадратный километр, метр или даже сантиметр.

Слайд 4. Разрешение растра.

Как вы уже могли догадаться, чем больше размер ячейки, тем большую площадь земли она покрывает, т.е. тем ниже (грубее) разрешение растра, и тем меньше точность в отображении положения точек, линий и границ полигонов.

Выбор размера ячейки растра для исследуемой области зависит от разрешения данных, необходимого для максимально точного анализа. Ячейка должна быть достаточно малой, чтобы отражать необходимые детали, но достаточно большой, чтобы объем занятой памяти компьютера позволил эффективно выполнить анализ.

Чем более однородна поверхность с точки зрения таких переменных, как топография или землепользование, тем крупнее может быть ячейка без ущерба точности.

Разрешение возрастает при уменьшении размера ячейки, однако обычно за счет увеличения занятого дискового пространства и снижения скорости обработки. Уменьшение ячеек определенной области в два раза требует увеличения дисковой памяти примерно в четыре раза, в зависимости от типа данных и используемой технологии их хранения. Для большинства пользователей эффективность анализа более чем компенсирует потерю разрешения.

Слайд 5. Представление пространственных элементов в растровой и векторной моделях данных.

При преобразовании точек, полилиний и полигонов в растр, вам необходимо знать, как растровый набор данных будет представлять эти объекты.

Главный недостаток представления картографических данных в форме ячеек растра - это потеря точности информации о местоположении объектов. Вместо точных координат точек мы имеем отдельные ячейки растра, в которых эти точки находятся. Здесь мы наблюдаем изменение пространственной мерности, которая состоит в том, что мы изображаем объект, не имеющий измерений (точку), с помощью объекта (ячейки), имеющего и длину, и ширину. Чем меньше ячейка, тем меньше ее площадь, тем точнее она представляет точечный объект.

Линии, то есть одномерные объекты, изображаются как цепочки соединенных ячеек. Опять же, здесь имеет место изменение пространственной мерности от одномерных объектов к двухмерным структурам. Каждая точка линии представляется ячейкой растра, и каждая точка линии должна находиться где-то внутри одной из ячеек растра. Легко увидеть, что эта структура данных изображает линии ступенчатым образом.

Слайд 6. Представление объектов в растровом наборе данных.

Этот ступенчатый вид также обнаруживается при изображении областей с

помощью ячеек растра. Повторим, что точность представления данных зависит от масштаба и размера ячейки. Чем больше разрешение ячеек, и чем больше ячеек представляют определенную площадь, тем точнее это представление.

Слайд 7. Значение ячейки.

Каждой ячейке растра присваивается определенное значение, служащее для идентификации или описания класса, категории, группы, к которым относится ячейка, либо для задания количественной характеристики свойства, которое описывает данный растр. Значение может представлять такие характеристики, как тип или структура почв, класс землепользования, стратиграфические подразделения. Значение может также представлять величину, расстояние или отношение в непрерывной поверхности данных. Высота, величина и направление уклона, уровень шума от аэропорта, величина pH почвы - примеры количественных характеристик.

В растрах, представляющих изображения, значения могут указывать цвет или спектральную отражающую способность. В этом случае каждой ячейке приписывается не одно, а несколько значений (мультиканальный растр).

Значения ячеек могут быть как целые, так и с плавающей запятой. Целочисленные значения удобны для представления значений дискретных данных, а значения с плавающей запятой - для представления непрерывных поверхностей.

Зоны. Любые две или более ячейки с одинаковым значением принадлежат к одной зоне. Зона может состоять из соединенных ячеек, несоединенных ячеек, или из тех и других. Зоны, ячейки которых соединены, представляют отдельные объекты территории, например, здание, озеро, дорогу или линию электропередачи. Каждая ячейка растра принадлежит к определенной зоне. Одни растры состоят из нескольких зон, другие - из множества зон.

Регионы. Каждая группа соединенных ячеек в зоне называется регионом. Зона, состоящая из одной группы соединенных ячеек, включает один регион. Зона может состоять из стольких регионов, сколько нужно для представления объекта; количество ячеек в одном регионе практически не ограничено. В растровом наборе данных на рисунке внизу, Зона 2 состоит из двух регионов, Зона 4 - из трех регионов, а Зона 5 - только из одного региона.

Значение ”Нет данных”. Если ячейке присвоено значение “Нет данных” (No Data), это означает, что данных о заданной характеристике в точке, которую представляет ячейка, либо нет, либо недостаточно. Значение отсутствия данных, иначе называемое пустым значением, обрабатывается всеми операторами и функциями иначе, чем другие

значения. В большинстве случаев это значение передается в выходной растр, в других - ее значение формируется на основании значений соседних ячеек.

Слайд 8. Значение ячейки (продолжение).

Для некоторых видов данных, чаще всего непрерывных, значение ячейки представляет измерение в центре ячейки. Пример – растр высот. Для изображения непрерывной поверхности, значения высот на границах ячеек вычисляют путем интерполяции, на основании известных значений ячеек, отнесенных к центральной точке.

В других случаях значение ячейки относится ко всей ее площади - поверхность отображается в виде «ступенек».

Слайд 9. Присвоение атрибутов растровому набору данных.

Связанные таблицы. С целочисленными (категорийными) наборами растровых данных обычно связаны таблицы атрибутов. Первое поле такой таблицы - Значение (Value), в нем хранятся значения, присвоенные каждой зоне растра. Второе поле, Счет (Count), содержит количество ячеек каждой зоны в растре. Оба эти поля - обязательные. В таблицу можно добавить практически неограниченное количество других полей, представляющих другие атрибуты растра.

Обычно существует отношение “один-ко-многим” между значениями ячеек (кодами) и числом ячеек, которым присвоен этот код. Это значит, что может быть 400 ячеек со значением 4 (жилые дома отдельных семей) и 150 ячеек со значением 5 (коммерческое использование земли) в растровом наборе данных землепользования. Код будет записан много раз, по одному разу для каждой ячейки из этой категории (или меньше, в зависимости от технологии хранения данных), но атрибуты, связанные с этим кодом, будут написаны только один раз. Это позволяет экономить память и облегчает обновление данных.

При работе с непрерывными данными обычно каждая ячейка имеет уникальное значение, и с ним не связаны дополнительные атрибуты, поэтому привязывать новые атрибуты не требуется. В том случае отношение “многие-к-одному” не возникает. Если же вы тем не менее желаете дать атрибуты растру с непрерывными данными, то этот растр предварительно необходимо переклассифицироватьсоздать новый растр, значения ячеек которого представляют некоторый диапазон непрерывных данных. Например, можно, разделить значения уклона на пять категорий—от 0 до 10 процентов, от 11 до 20, от 21 до 30, от 31до 40 и от 50 и выше—или на группы с размером интервала только два процента

(от 0 до 2 процентов, от 3 до 4 и т.д.). Затем вновь созданному категорийному растру задать атрибуты.

В заключение этой части лекции перечислим основные преимущества и недостатки растров.

Преимущества.

1.Несмотря на то, что все объекты представлены набором точек (пикселов), на растрах они хорошо распознаются. Вы всегда узнаете своего друга даже на очень плохой фотографии.

2.Растровая структура данных организована точно также как и данные дистанционного зондирования (ДДЗ), что обеспечивает легкий перенос и использование спутниковых изображений в ГИС.

3.Прямоугольная сетка данных легко привязывается к прямоугольной системе координат (системе координат проекций).

4.Многие функции, особенно связанные с операциями с поверхностями и наложением (overlay), легко выполняются на этом типе структур данных.

Недостатки.

Среди главных недостатков растровой структуры данных – уже упоминавшаяся проблема низкой пространственной точности, которая уменьшает достоверность измерения площадей и расстояний. Другой недостаток - необходимость большого объема памяти, обусловленная тем, что каждая ячейка растра хранится как отдельная числовая величина. Последняя проблема сегодня не так серьезна, как прежде, благодаря огромному росту емкости внешних запоминающих устройств компьютеров. Кроме того, в настоящее время существуют развитые методы сжатия растровых данных, позволяющие значительно сокращать объем растров без существенной потери их качества.

Слайд 10. Векторная модель данных: основные элементы.

Второй метод представления географического пространства называется

векторным (vector).

Векторная модель данных основана на векторах (направленных отрезках прямых). Базовым примитивом является точка, а основными базовыми элементами являются дуга (arc) и узел (node). Векторные линейные объекты создаются путем соединения точек прямыми линиями или дугами. Для того, чтобы определить дугу нужно указать, по меньшей мере, 2 точки - начальную и конечную - для описания местоположения линейного

объекта в пространстве. Если линия является кривой или ломаной, то необходимы дополнительные точки – формообразующие (вертексы). Чем сложнее линия, тем больше точекнампотребуетсядляуказанияточногоее расположения.

Слайд 11. Векторное представление графики.

Векторный метод позволяет задавать точные пространственные координаты явным образом. Это достигается приписыванием точкам пары координат (Х и Y), линиям – связной последовательности пар координат их вершин, областям – замкнутой последовательности соединенных линий, начальная и конечная точки которой совпадают.

Слайд 12. Атрибуты.

Векторная структура данных показывает только геометрию картографических объектов. Чтобы придать ей полезность карты, геометрию необходимо связать с атрибутивной информацией. В растровой структуре значение атрибута записывается в каждую ячейку. В векторном представлении используется совсем другой подход: в явном виде хранятся графические примитивы без атрибутов, а атрибуты векторных объектов хранятся в специальных таблицах и связываются с графическими элементами с помощью служебных идентификаторов. Идентификаторы в большинстве случаев недоступны для пользователей и являются одними из наиболее важных, можно сказать, ключевых элементов в различных форматах пространственных данных.

Слайд 13. Дватипавекторных моделей данных.

Существует несколько способов объединения векторных структур данных в векторнуюмодельданных. Всеспособыотносятсякодному издвухосновныхтиповвекторных моделей данных: топологические векторные модели данных и нетопологические векторные модели данных. Топология – это такой математический аппарат, который описывает пространственные отношения между объектами.

Простые векторные модели, как правило, не используют топологию и хорошо подходят для систем компьютерной картографии. Более продвинутые векторные модели, как правило, основаны на топологии и предназначены для выполнения аналитических операций.

Слайд14. Нетопологическаямодель векторных данных: спагетти-модель.

Простейшей векторной структурой данных является спагетти-модель [Dangermond, 1982], которая, по сути, переводит "один в один" графическое изображение бумажной карты. Возможно, она представляется большинством из нас как наиболее естественная или наиболее логичная, в основном потому, что карта реализуется какумозрительная модель. Хотя название звучит несколько странно, оно на самом деле весьма точно, по сути. Если представить себе каждый графический объект нашей бумажной карты кусочком (одним или несколькими) макарон, то вы получите достаточно точное изображение того, как эта модель работает. Каждый кусочек действует как один примитив: очень короткие - для точек, более длинные - для отрезков прямых, наборы отрезков, соединенных концами, - для границ областей. Каждый примитив — одна логическая запись в компьютере, записанная как строки переменной длины пар координат (X,Y).

В этой модели соседние области должны иметь разные цепочки спагетти для общих сторон. То есть, не существует областей, для которых какая-либо цепочка спагетти была бы общей. Каждая сторона каждой области имеет свой уникальный набор линий и пар координат. Хотя, конечно, общие стороны областей, даже будучи записанными, отдельно в компьютере, должны иметь одинаковые наборы координат.

Поскольку спагетти-модель выглядит как перевод "один к одному" аналоговой карты, пространственные отношения между объектами (топология), например, такие, как положение смежных областей, - подразумеваются, а не записываются в компьютер в явном виде. И все отношения между всеми объектами должны вычисляться независимо. Результатом отсутствия такого явного описания отношений между объектами является огромная дополнительная вычислительная нагрузка, которая затрудняет измерения и анализ. Но так как спагетти-модель очень сильно напоминает бумажную карту, она является эффективным методом картографического отображения и все еще часто используется в компьютеризованной картографии, где анализ не является главной целью. Кроме того, это представление оказывается весьма близким к языку управления многих плоттеров, что упрощает процесс вывода карт на печать. Отрисовка на плоттере данных спагетти-моделиобычнодовольнобыстрая посравнениюс отрисовкой другихмоделей.

Слайд 15. Топология: определение пространственных взаимосвязей.

В отличие от спагетти-модели, топологические модели [Dangermond, 1982], как это следует из названия, содержат топологическую информацию в явном виде.

Рассмотрим топологическую модель данных на примере модели данных покрытия ARC/INFO – одного из форматов данных, который многие годы считался одной из наиболее удачных разработок компании ERSI.

Топологическая информация описывается набором узлов и дуг. Узел (node) — больше, чем просто точка, обычно это пересечение двух или более дуг, и его номер используется для ссылки на любую дугу, которой он принадлежит. Каждая дуга (аrс) начинается и заканчивается либо в точке пересечения с другой дугой, либо в узле, не принадлежащемдругимдугам.

Топология представляет математическую процедуру, которая определяет пространственные свойства и взаимосвязи, включающие: связность и длины дуг, направление дуг, смежность и площади полигонов.

Пространственные взаимосвязи описываются пространственными свойствами.

Пространственные взаимосвязи

Каждая дуга имеет начальный узел и конечный узел

Дуги соединяются узлами

Соединенные дуги образуют границу полигона

Слева и справа от дуг имеются полигоны

Пространственные свойства

Направление Длина дуги Связность Площадь полигона Периметрполигона

Смежность и непрерывность

Слайд 16. Линейно-узловая топология.

Различают линейно-узловую топологию и полигонально-линейную топологию.

Линейно-узловая топология (дуга-узел) выражает пространственные взаимосвязи между дугами и узлами: она определяет длину, направление, связность. Географический анализ опирается на эти свойства.

Узлы. From-node – начальная точка дуги, to-node – конечная точка дуги. Они определяют, как цифровались ваши данные. Направление дуг важно, если вы моделируете направленные потоки (например, реки или движение транспорта).

Информация о топологии хранится в специальных таблицах.

Длина дуги измеряется от начального узла (from-node) до конечного узла (to-

node). Единицами измерения длины являются единицы измерения картографической проекции.

Направление дуги определяется от начального узла (from node) к конечному узлу

(to-node).

Связность. Дуги соединяются узлом. По определению дуги с номерами 4,7,8 на слайде соединены, поскольку каждая из них имеет общий узел с номером 8. Таблица внизу показывает эти пространственные отношения.

Слайд 17. Полигонально-линейная топология.

Полигонально-линейная топология представляет пространственные взаимосвязи между дугами и полигонами, которые ограничиваются дугами; она определяет площадьисоседство. Географическийанализтакжеопираетсянаэтисвойства.

Определение площади. Когда дуги или наборы дуг соединяются, чтобы образовать замкнутую фигуру, границы определяют площадь полигона. Этот набор дуг хранится как список, определяющий полигоны, который они образовали. Список дуг, образующих полигон, хранитсявотдельномфайле.

Соседство. Два полигона соседние, если у них общая дуга. Программа (ARC/INFO) нумерует полигоны и хранит их как левый полигон (LPOLY#) и правый полигон (RPOLY#). Один и тот же полигон может быть левым полигоном в отношении одной дуги и правым полигономпоотношениюкдругойдуге.

Вы можете представить концепцию левого и правого полигона, вообразив, что вы путешествуете вдоль дуги, как будто по дороге. Ваша исходная точка - это начальный узел (from-node) и вы направляетесь к конечному узлу (to-node). Площадь слева от вас - левый полигон, площадьсправаправыйполигон.

Обратите внимание, что полигон 5 и левый, и правый в верхнем списке. Полигон 5 является правым полигоном в отношении дуг под номером 6 и 10, но он же и левыйполигон по отношениюкдуге14.

Внешний полигон. Когда ARC/INFO строит полигонально-линейную топологию, всегда создаетсяодин"внешний" полигон, представляющий площадь, которая остается за границами покрытия. Дуги, определяющие внешние границы вашего полигонального покрытия, являютсявнутреннейграницейвнешнегополигона.

* Увнешнегополигонавсегда код(ID) = -1 .

Соседние файлы в папке ГИТ лекционный курс