Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Pogorelov_umen.doc
Скачиваний:
47
Добавлен:
22.04.2019
Размер:
587.78 Кб
Скачать
  1. Данные, информация, знания в геоинформатике

Геоинформатика изучает и сама разрабатывает принципы и технологии сбора, накопления, передачи, обработки и представления данных для получения на их основе новой информации и знаний о пространственно-временных явлениях в геосистемах. Тесно связанные понятия данные, информация и знания имеют основополагающее значение для геоинформатики.

Дефиниции должны быть определены во избежание двусмысленности и недоразумений. Термины «информация», «данные» чрезвычайно распространены. При этом в быту и в науке они употребляются как синонимы слов сообщение, сведения, сигнал, материалы, знания. Однако эти слова имеют разное научное содержание, суть.

Понятие данные (data) – это зарегистрированные сигналы или факты. Слово «данные» происходит от латинского “datum” – факт. Однако данные не всегда фактографичны (например, предположение, идея, или могут быть неточными).

Данные несут в себе информацию о событиях, произошедших в материальном мире, однако они не тождественны информации. Так, получив послание на непонятном языке, мы зарегистрировали лишь сигналы, но не извлекли информацию. Различие между данными и информацией такое же, как между шифровкой и ее переводом. Правда, часть информации мы все-таки получаем: о шрифте, о качестве бумаги и т.д. Но метод ее получения не адекватен самой информации. Так, методом извлечения информации из текста на иностранном языке является использование словаря, извлечения из записи на магнитной ленте – использование устройства типа магнитофона и т.п. Иначе говоря, данные – совокупность фактов, представленных в каком-либо формализованном виде для их использования в науке или других сферах человеческой деятельности.

Применительно к геоинформатике «данные» можно рассматривать и определять в трех контекстах: вне автоматизированной среды использования, внутри ее и в среде ГИС. В первых двух контекстах под «данными» понимаются либо факты, либо сведения, подготовленные для компьютерной обработки. Под «данными» в среде ГИС понимаются результаты наблюдений и измерений реальных объектов. Элемент содержит три главных компоненты: 1) атрибутивные сведения, которые описывают сущность, характеристики, переменные, значения и т.п. его квалификации; 2) географические сведения, описывающие его положение в пространстве относительно других данных; 3) временные сведения, описывающие период или момент времени, представляющие элемент данных.

Фундаментальным понятием в геоинформатике является «пространственные данные» – spatial data. Пространственным данным в русскоязычной литературе соответствует два понятия: первое – это пространственные данные в широком смысле слова (включают все пространственно-координированные данные об объектах реального мира, а также цифровые изображения и карты, каталоги координат геодезической сети и пр.); второе – связано с информационным обеспечением ГИС – это цифровые данные о географических объектах. В качестве синонимов термина «пространственные данные» употребляются понятия «географические данные» и «геопространственные данные».

Данные – это атрибут информации. Латинское «informatio» – разъяснение, изложение.

Все виды энергообмена сопровождаются появлением сигналов, при этом взаимодействии сигналов с физическим полями или телами возникают изменения их свойств, т.е. регистрация сигналов. С середины 20 века информация – общенаучное понятие, включающее обмен сведениями между людьми, между человеком и машиной, машиной и машиной, а также обмен сигналами между организмами (в широком смысле – между любыми физическими объектами). Нас интересует научная информация, т.е. та, которая может служить исследовательским целям.

Данные соответствуют дискретным зарегистрированным сигналам, в результате чего мы получаем информацию о реальном мире. Информация – это продукт взаимодействия данных и адекватных (соответствующих им) методов (иначе говоря – данные, релевантные пользователю). Информацию можно определить и как средство (управляющего) воздействия на систему (объект). Здесь упор делается на передаваемую информацию. Но есть еще и потенциальная – непередаваемая, заключенная в самом явлении или объекте.

В этом смысле важен метод извлечения, регистрации данных. Физический метод регистрации данных может быть любым – механическое перемещение тел (при ударе), изменение их формы или параметров качества поверхности (при механическом воздействии – нанесении петроглифов на камень), изменении электрических, магнитных, оптических характеристик, химического состава или химических связей, наконец, связей на молекулярном или атомарном уровнях. В соответствии с методом регистрации данные могут храниться на носителях различных видов. Свойства информации тесно связаны со свойствами их носителей (разрешающая способность и др.).

Надо заметить, что задача преобразования данных с целью смены носителя информации относится к одной из важнейших задач информатики в частности и геоинформатики в общем. Устройства для ввода и вывода информации имеют стоимость до половины стоимости аппаратных средств (графопостроитель, модем, принтер, дигитайзер и др.).

В современной науке существует несколько парадигм, объясняющих явления информационного порядка (математическая, физическая и др., не говоря уже о философской).

Среди них первая (по времени возникновения) – теория К.Шеннона. Она ставит целью вычисление количества информации по формуле:

I = – Σpilog2pi,

где I – количество информации; pi – вероятность появления i-го сигнала; n - количество всех возможных сигналов. Логарифм в этой формуле свидетельствует о том, что информация – величина аддитивная I1+2 = I1 + I2, тогда как вероятность появления сигнала – мультипликативная p1+2 = p1*p2. Эта формула получила очень широкое распространение во многих областях и используется как мера разнообразия. Однако, у нее есть недостаток – она не учитывает содержательную сторону информации. Как отмечали некоторые исследователи: совокупность из 100 букв, выбранных случайным образом, фраза в 100 букв из газеты, пьесы Шекспира или теоремы Эйнштейна имеют в точности одинаковое количество информации.

Шеннон саму идею подсчета количества информации, видимо, заимствовал у физика Больцмана, который таким образом считал энтропию – симметричное состояние систем, характеризующееся минимумом информации.

В общей теории систем утверждается, что не существует систем обработки данных, которые могли бы обработать более чем 2*10547 бит в секунду на грамм своей массы. При этом компьютерная система, имеющая массу, равную массе Земли, за период, равный примерно возрасту Земли, может обработать порядка 10593 бит информации (предел Бреммермана). Задачи, требующие обработки более чем 10593 бит, называются трансвычислительными. На практике это означает, например, что полный анализ системы из 110 переменных, каждая из которых имеет 7 разных значений, является трансвычислительным.

В учебнике по основам геоинформатики так определяют информациюэто все, что может быть сообщено. Различия делаются для существующей (как бы потенциальной) информации и передаваемой (аналог кинетической энергии). Передаваемая информация зависит от более или менее удачно подобранных знаковых систем и отдельных знаков. Существующая информация объективна и определяется только объектом или явлением, в котором заключена.

Определений знаний не меньше, чем информации. По мнению некоторых информация отлична от знания тем, что для нее нет количественной меры. Знания – это интерпретация информации. То есть информация, включенная в коммуникативный процесс (с участием человека) становится знанием. Однако интерпретация (объяснение) может не ограничиваться знанием: этот ряд можно дополнить: информация – знание – мысль (гипотеза).

Иначе говоря, с позиции геоинформатики знания – это отражение смысловых (семантических) аспектов географической действительности (воспринимаемых как «безучастная» информация) в мозгу человека или в технической системе, т.е. интерпретация информации об окружающих объектах и явлениях.

В геоинформационной практике терминами «данные» (совокупность фактов в формализованном виде) и «информация» часто пользуются как синонимами.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]