Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Pogorelov_umen.doc
Скачиваний:
50
Добавлен:
22.04.2019
Размер:
587.78 Кб
Скачать
  1. Визуализация количественных характеристик пространственных объектов. Стандартные методы классификации векторных данных

На карте можно отображать количественные характеристики дискретных (точечные, линейные, полигональные) и континуальных (непрерывных) объектов. Дискретные объекты (точки, линии) обычно изображаются масштабируемыми символами, полигональные - заливкой или качественным фоном.

Континуальные явления могут быть визуализированы площадными объектами или поверхностями с непрерывными значениями. При этом используются цветовые оттенки (качественный фон), изолинии и перспективные виды (3D).

Для наилучшей визуализации количественной характеристики необходимо определить, в какой шкале измерения данных это делать (интервальная, отношений). Напомню, что при номинальной и порядковой шкалах количественные операции (разность, отношение) не выполняются.

Количественные характеристики следует разделить на 1) абсолютные и 2) относительные значения. Абсолютная величина относится к некоторому объекту или пространству (например, геофизическое поле). Относительные значения (ratios) показывают взаимные отношения между двумя количественными величинами, и находятся делением одной величины на другую для каждого объекта. Использование относительных величин, например, устраняет влияние разницы в площадях больших и малых участков или в количестве объектов на участках. Наиболее часто применяются виды относительных значений: средние, пропорции и плотности.

Пример средних значений: среднее число жителей в одном доме вычисляется путем деления общего количества жителей на количество домов на одном полигоне; среднее количество автомобилей на человека и т.п. Пример пропорции: доля жителей возрастной группы 20-30 лет определяется делением числа жителей этой группы к общему числу жителей; доля преступлений несовершеннолетних в общем количестве преступлений в районе и пр. Пропорции можно выразить в процентах. Примеры плотности: плотность древостоя, плотность железных дорог, плотность пользователей МТС на единицу площади. Относительные величины обычно создают, добавляя новое поле в таблице атрибутов.

Ранжированные значения (ранги) используют в случае, если количественная оценка объекта затруднена или характеризуется комбинацией нескольких факторов. Например, экологическое состояние района, пригодность почвы для выращивания определенной культуры или эстетическая привлекательность местности. Для указания ранга можно использовать текстовые аннотации (плохое, удовлетворительное, хорошее) или числа (от 1 до 10). Ранги применяются в порядковой шкале измерений.

Количественные характеристики представляют в виде отдельных значений или путем группировки их в классы. Это своего рода компромисс между точным представлением значением данных и некой генерализацией, позволяющей увидеть пространственные закономерности.

Картирование отдельных значений выполняется путем присвоения каждому объекту своего символа (числа) – уникального значения. В этом случае на карте представлена точная картина данных, но карта перегружается, если объектов или уникальных значений много (больше 10-12).

Классификация (создание классов) – группировка объектов, имеющих близкие численные значения, путем присвоения им одинаковых символов. Каждую группу значений называют классом – он имеет свой интервал от верхнего до нижнего значений. От определения диапазонов для классов зависит информативность карты. При изменении классов получаются разные карты. Классификацию можно выполнять вручную или используя стандартные методы классификации.

Создание классов вручную (manual) применяется, если осуществляется поиск объектов, отвечающих известным критериям. При этом определяется верхний и нижний предел для каждого класса и назначается каждому классу свой символ. Например, необходимо выделить участки, в которых менее 25% жителей пользуются Интернетом; в которых более 50% населения голосовало за КПРФ. Разбиение на классы вручную производится для получения привычной шкалы, принятой в корпоративных.

Стандартные методы классификации (classification method) используются при необходимости выявления закономерностей в пространственном распределении данных. Метод классификации учитывает конкретное статистическое распределении значений, например, с помощью гистограмм.

Метод естественных границ (natural breaks classification) использует статистический алгоритм для определения «естественных» сгущений (кластеров) значений атрибута. Алгоритм (метод Дженка) состоит в том, что минимизируется дисперсия в пределах каждого класса и максимизируется дисперсия между классами. Границы классов устанавливаются в тех местах, где между группами значений образуются пробелы. Этот метод подходит для данных с неравномерным распределением атрибутов. Хорошо подчеркиваются индивидуальные значения группировки. Недостатки: а) затруднен выбор оптимального числа классов, б) трудности сравнения карт, поскольку диапазон значений определяется свойствами наборов данных.

Классификация по произвольным интервалам (defined interval classification) разбивает множество значений на классы, границы которых следуют через установленные равные интервалы (interval size) – в параметрах классификации указывается единый интервал независимо от экстремальных значений. Применима к привычным атрибутам (интервалы высот, уровней доходов, возрастов), разбиваемым на интервалы 10, 100 и т.д. Недостаток: некоторые из классов (обычно крайние) могут содержать непропорционально большое или малое по отношению к другим классам количество значений атрибута.

Метод квантилей (quantile classification) создает классы с равным числом пространственных объектов в каждом. Так, если слой имеет 20 объектов, то при количестве классов 5 в каждом будет по 4 объекта, сгруппированных в порядке возрастания независимо от диапазона значений. Эта классификация особенно эффективна для ранжированных значений и визуально привлекательна, т.к. все изображаемые классы содержат одинаковое число пространственных объектов. Лучше всего применима к значениям атрибутов, имеющих в целом линейное распределение. Если используется четное число классов, то значение разграничивающее два класса посредине, является медианой статистического распределения.

Недостатки: а) объекты с близкими значениями могут оказаться в разных классах, что особенно нежелательно, если величины образуют группы, и наоборот, некоторые величины с большим интервалом могут оказаться в одном классе; б) если полигоны существенно различаются по размерам, то этот метод приведет к искажению пространственного распределения.

Метод разбиения на равные интервалы (equal interval classification) делит весь диапазон значений атрибутов на части равной длины в соответствии с количеством классов. Так, диапазон значений от 20 до 100 при количестве классов 5 будет поделен с интервалом в 16 единиц. Метод подходит для упрощенного представления результатов – которые просто интерпретировать и понятных неподготовленному пользователю. Кроме того, удобно использовать для картографирования континуальных данных – полей. Недостатки: некоторые классы в случае неравномерного распределения могут не содержать объектов.

Метод разбиения на интервалы стандартного (среднеквадратического) отклонения (standard deviation classification) создает четное число классов, которые представляют целые или дробные отклонения от среднего значения, полученного для всех объектов. Границы классов определяются выше и ниже среднего по значению стандартного отклонения . Интервал может быть равен 1, 0,5, 0,2 .

Метод подходит для отображения объектов в соответствии с их положением выше или ниже среднего значения; для отображения данных с нормальным распределением (симметричной относительно среднего гистограммой – колоколообразной). Недостатки: а) карта не показывает реальные значения объекта, а показывает, насколько удалены их атрибуты от среднего значения; б) при распределении, отличающемся от нормального, средняя величина непоказательна, вследствие чего разбиение на классы может привести к попаданию в один класс большого количества объектов. Пример: расчет среднего числа жителей по данным Краснодара и соседних районов.

При выборе метода классификации существуют следующие рекомендации. Прежде всего, следует построить гистограмму и поинтересоваться величинами средней и стандартного отклонения. В любом случае необходимо учитывать задачи картографирования.

  • Если данные имеют неравномерное распределение, сгруппированы и существуют разрывы в гистограмме, следует использовать natural breaks classification.

  • Если данные имеют равномерное распределение, а вы хотите подчеркнуть разницу между объектами, следует использовать equal interval classification или standard deviation classification.

  • Если данные имеют равномерное распределение, а вы хотите подчеркнуть относительную разницу между объектами, используйте quantile classification.

  • При наличии выбросов возможна группировка их в отдельных классах.

  1. TIN-модели. Визуализация поверхностей с помощью слоев TIN

Triangulated irregular network – нерегулярная триангуляционная сеть – является эффективным способом моделирования поверхностей. По сравнению с растром TIN имеет преимущество – изменение плотности данных в зависимости от сложности рельефа.

«Нерегулярная» определяет ключевое преимущество TIN в моделировании поверхности с переменной плотностью точек.

«Триангуляционная» указывает на способ построения оптимизированного набора треугольников по набору точек. Треугольники дают хорошее представление о локальной части поверхности, так как три точки со значениями z однозначно определяют плотность в трехмерном пространстве.

«Сеть» отражает топологическую структуру TIN.

Элементы TIN. Состоит из точек, каждой из которых сопоставлено вещественное значение (координата z). По этим точкам производится построение сети треугольников, т.е. триангуляция, которая образует непрерывную поверхность в трехмерном пространстве. Триангуляция создает набор неперекрывающихся треугольников, называемых гранями (faces), точки – называются узлами (nodes), линии граней – ребрами (edges). Поверхность TIN может точно моделировать особенности рельефа (тальвеги, гребни) с помощью линий перегиба (breaklines).

Единственное ограничение состоит в том, что она не может изображать случаи отрицательных уклонов (карнизы, пещеры).

На практике TIN обычно строят с помощью фотограмметрических инструментов, измеряя высоты по стереопарам АФС, по данным геодезических съемок, по оцифрованным изогипсам, растрам со значениями z, наборам точек в файлах или базах данных.

Триангуляция и топология. В ArcInfo для оптимального моделирования поверхности треугольниками применяется алгоритм триангуляции Делоне (Delaunay). Иногда этот метод называют методом Вороного-Делоне. Проблема моделирования поверхности заключается в нахождении способа, который бы при минимальном количестве точек модели позволил максимально информативно отобразить рельеф. Метод можно упрощенно свести к нахождению дискретных точек, заполняющих пространство. Первоначально работы были выполнены Георгием Федосеевичем Вороным (1868-1908). Закончил Санкт-Петербургский университет, работал в Варшавском университете и Новочеркасске. Задача, которую решал Вороной, посвящена проблеме заполнения n-мерного эвклидова пространства параллелоэдрами со смежными гранями. В то время не стояла проблема построения модели рельефа, но созданная Вороным модель применяется сейчас для описания рельефа без упоминания его имени. Борис Николаевич Делоне (1890-1980), развивший идеи Вороного, преподавал в Киеве, Ленинграде и Москве. В 1929 г. Избран членом-корреспондентом АН СССР.

Разбиение Вороного включает понятия: плоскость, канал и узел. Для двух произвольных точек можно найти плоскость (совокупность точек), равно удаленную от них. Для трех точек можно найти линию (геометрическую совокупность точек), равно удаленных от этих точек (она проходит через центр описанной окружности). И для четырех произвольных точек можно найти точку, равно удаленную от четырех точек. Делоне рассмотрел случай, когда совокупность точек можно представить как набор треугольников. Дело в том, что в случае с четырьмя ближайшими точками возможны два варианта триангуляции:

Определение триангуляции Делоне указывает, что любая окружность, проведенная через три узла в треугольнике, не будет включать никакого другого узла. Как видим, случай 1 удовлетворяет испытаниям Делоне, поскольку проведенная через узлы каждого треугольника окружность не содержит внутри никаких других узлов.

Треугольники всегда имеют три узла и обычно три соседних треугольника (за исключением внешней границы TIN). В описании топологии содержится информация об узлах (идентификаторы) и соседних треугольниках (идентификаторы).

Представление морфологии поверхности может быть задано точечными, линейными и полигональными пространственными объектами, преобразованными в TIN. Внимание: при создании TIN объектов следует указывать поле с координатой z. При генерировании поверхности на основе TIN-модели решается задача использования исходных шейп-файлов – точечных, линейных или полигональных. Наиболее простой способ преобразования из точечного шейпа.

Точечные объекты 3D (опция <Triangulate as> masspoints) представляют точки, в которых измерена координата z. После триангуляции они сохраняются как узлы с соответствующими координатами и высотой.

Более сложный случай – линейный шейп.

Линейные пространственные объекты поверхности (breaklines) – линии перегиба. Существуют два вида:

  • hard breaklines (резкие линии перегиба) – отражают разрыв в уклоне и передают изрезанность поверхности, улучшая анализ и отображение TIN;

  • soft breaklines (нерезкие линии перегиба) – позволяют добавлять ребра, чтобы показать линейные пространственные объекты с ненарушенным уклоном. Например, необходимо добавить очертания дороги к модели поверхности.

Наиболее сложный случай преобразования в TIN-модель полигонального шейпа. Здесь нужно предусмотреть разные виды построения поверхностей на основе координаты z полигонов (внутри полигонов, вне и т.п.).

Площадные пространственные объекты поверхности – полигоны. Существует несколько видов:

  • replace polygons (полигоны замещения) задают одно постоянное значение z границе и всем высотам внутри нее;

  • erase polygons (полигоны стирания) отмечают все области в пределах полигона как находящиеся вне зоны интерполяции для данного режима. При аналитических операциях типа вычислений объема, построения изолиний и интерполяции такие области игнорируются;

  • clip polygons (полигоны отсечения) отмечают все области вне полигона как находящиеся вне зоны интерполяции для модели;

  • value fill polygons (полигоны заполнения) назначают целочисленное атрибутивное значение всем граням в пределах полигона. Никакой замены высоты, стирания или отсечения не происходит.

Следует заметить, что каждая из приведенных категорий делится еще на две разновидности: hard и soft.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]