Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
_ТР_ЭлК_2012__Шестаков.doc
Скачиваний:
39
Добавлен:
26.09.2019
Размер:
11.56 Mб
Скачать
  1. Математические истоки тр. Случайные события, процессы, смеси, свойства оценок.

Свойства объекта считываются по показаниям совокупности датчиков. Они (переменные) могут быть детерминированными и случайными, числовыми и лингвистическими и существуют, обычно, единым вектором, массивом описания - .

¤ Детерминированные переменные обязательно принадлежат распознаваемому объекту. Их отсутствие, искажение рассматривается как недостаток в технологии получении исходных данных, требуя повторения считывания. Важность этих данных велика. Анализ детерминированных переменных лежит в верхней ступени иерархии последовательности распознавания. Имена переменных бинарных векторов свойств распознаваемого объекта и классов часто формулируются уже при формировании множества классов. Числовые детерминированные признаки, также бинаризуются в новой метрике числовой оси. Например, по изделию оси размеров: бесспорные зоны - брак – 0, годен – 1. Примером детерминированных признаков может быть при пуске ракеты из орудия вектор, включающий в себя признаки: наличие ракеты в стволе; готовность прибора сопровождения; положение ствола в зоне возможного выстрела. В распознавании текста в изображении – идентификатор текста, полученный предварительным анализом участка изображения.

¤ Случайные переменные при каждом цикле считывания одного и того же свойства объекта различны, однако существуют в определенном интервале чисел (часто внутри многомерного гиперэллипсоида).

Случайной функцией называется функция, значение которой при каждом данном значении аргумента (или нескольких аргументов) является случайной величиной. Скалярная функция скалярного вещественного аргумента (в качестве которого обычно выступает время) называется случайным процессом. Случайная функция нескольких скалярных вещественных аргументов (обычно координат точек пространства) называется случайным полем.

Набор объектов (кортеж) называется вероятностной моделью или вероятностным пространством задачи. Если в нем определены все рассматриваемые классы, цели, потери, полностью описывает ситуацию.

- пространство исходов, в ТР - признаковое пространство. Оно характеризуется совокупностью метрик осей, а его минимизация, часто, лежит в основе преобразования входного массива . Пересчет метрики пространства, уменьшая расстояния между классами снижает аппаратные и временные ресурсы необходимые для процедур распознавания.

Наряду с пространством исходов в математической статистике вводятся понятия допустимых функций , это - алгебры подмножеств заданных на . Обычно определяет линейную совокупность подмножеств множества , базирующихся на теоретико-множественных операциях – объединении, пересечении, образовании дополнения и замкнутых относительно счетных объединений.

Третий объект - вероятность на . Это наиболее трудоемкая величина в исследованиях, определяющая достоверность выводов при распознавании.

¤ Лингвистические переменные. Расширяют понятия случайной переменной на заключения, выводы и т.п. Исходно, лингвистическая переменная описывается кортежем

[X,T(X),U,G,P],

где: X – имя переменной (например, о возрасте на шкале лет - молодой);

T(X) – множество значений переменной (термы) (очень молодой, молодой, старый, очень старый);

U – универсальное множество (универсум), на котором задана переменная (возраст), такое множество удерживает свойства всех объектов (например: множество всех действительных чисел, на шкале которого задается возраст, или множество всех комплексных чисел используемых для отображения спектральных образов колебательных процессов);

G – синтаксическое правило, порождающее термы;

P – семантическое правило, ставящее каждому X его смысл, P(X) – нечеткое множество заданное на U (27 лет – молодой, 62 года – старый или очень старый).

Семантическое правило может выдавать и цифры, например вероятности, в данной точке U существования конкретного терма.

Область существования свойств X на U реально может быть ограничена. Ограничения на существование x в u отображаются зависимостями R(x;u). Они допускают только те x=u, которые удовлетворяют условию . Например: возраст человека ограничивается диапазоном чисел от 0 до 200.

Рис.2.1. Области задания лингвистических переменных (ин, ик, нн, нк, ндн, ндк – начало и конец идеальной, нечеткой, недопустимой областей)

На рис.2.1 представлены примеры областей задания логических переменных: а – на оси одного свойства, б – в пространстве трех свойств на поверхности. Наряду с ограничениями задается и семантическое правило формирования имени переменной. На рис. 2.1в приведен пример задания вероятности P определения конкретного значения переменной в границах нечеткой области.

Причиной появления не четкого описания переменных служат:

  1. Ограничения на ресурсы измерительных средств, средств наблюдения, средств очувствления и т. д. Они приводят к описанию объекта в нечеткой словесной (символьной) форме.

  2. Пакет передачи опыта включает в себя и совокупность не четких правил. Оценки свойств интервальные или заданы по экспертным заключениям с разрешением не достаточным для проведения анализа.

  3. В процессе создания (жизни) объекта реализуется ряд альтернативных вариантов промежуточных решений по его самоорганизации, которые приводят к неопределенности свойств объекта , появляется нечеткое описание свойств, например, образ самолета противника.

  4. В описании цели присутствует ряд не четко заданных словесных конструкций.

Различают так же синтаксическую нечеткость (Железные болты и гайки. Ограничение, железные, действует только на болты или и на гайки тоже). И семантическую – не ясен смысл фразы. Часто в литературе встречаются термины: случайные исходы, нечеткая информация, нечеткая функция полезности, нечеткая цель и т. п. Новая терминология порождает и новую формулировку задач, как, например. Интерпретация вероятности и возможности на основе распределения уверенности.

Лингвистические переменные в первом приближении можно оцифровать, ранжировав их по эффективности. Тогда переменная превращается в вектор, число степеней свободы которого равно числу ее термов. Далее эффективно используется аппарат анализа числовых случайных переменных.

Случайная величина, событие появляется в некотором пространстве размерностью . Размерность пространства зависит от числа составляющих случайную величину частей (компонентов) и возможных числовых значений (уровней), которые могут принимать эти компоненты. В компьютерных приложениях, как правило, число разрешимых уровней для -го компонента принимается равным , где - целое число.

Изображения имеют некоторую специфику формирования потока данных. Растровые форматы представления изображений передают информацию о нем по точкам. Если точка (пиксель) характеризуется кодированием цвета с , то говорят о бинарном представлении - компоненты, при - о полутоновом. Точка обычно представлена в трех или четырех компонентном пространстве, в последнем случае добавляется - компонента, характеризующая прозрачность пикселя.

Трех компонентное пространство в целочисленном представлении для полутонового описания пикселя может быть представлено в формате с перекодировкой, это 16 - и 256 - цветные модели. Такой файл описания изображений сопровождается перекодировочной таблицей. По таблице коды преобразуются в представление без кодировки с . Эти форматы получили еще название индексированных. Элемент матрицы ai,j является указателем на таблицу цветов. Число используемых цветов равно 2K, где K - количество бит, используемый для хранения элемента матрицы. Цвета в указываемой таблице могут кодироваться другим числом бит. Например, в 256 цветовых режимах видеоадаптеров выбирается 256 цветов из 262144 возможных, так как выбираемые цвета представляются в RGB формате и для каждой цветовой компоненты кодируется 8-ю битами. Существует много методов преобразования многоканальных изображения в индексированные (Error diffusion, ближайшего цвета ...).

Форматы без перекодировки включают в себя и варианты с комбинациями , , и . Однако в практике систем распознавания образов более правильно обрабатывать сигналы непосредственно с АЦП CCD или SMOS матриц приборов наблюдения, используя формат *.RAW.

Монохромные приборы дают однокомпонентное описание точки с , 12, 14 и у приборов ультра высокого качества .

Описание точки с цветных приборов сложно. На рисунках 2.2, 2.3 приведены варианты нанесения цветовых фильтров на фотоприемники матрицы.

Рис.2.2. Однородное заполнение

Рис.2.3. Выделен зеленый цвет

Каждый фотоприемник поставляет сигнал, который с учетом окружения перекодируется в представление цифровым процессором сигналов камеры. Однако указанное, не исчерпывает всех вариантов встречающихся описаний изображений. Дальнейшие преобразования продолжают изменения и распознавание приходится вести по описанию сцены в финишном формате.

Представление пикселя в распространенных цветовых системах приведено в таблице 2.1.

Таблица 2.1.

Цветовая

система

Бит

1-ый компонент

2-ой

компонент

3-ий компонент

RGB

Truecolor

8:8:8

Красный

0-255

Зеленый

0..255

Синий

0-255

RGB

Highcolor

5:6:5

5:5:5

Красный

0-31

0-31

Зеленый

0-63

0-31

Синий

0-31

0-31

RGB

Extended

12:12:12

16:16:16

Красный

0-4095

0-65535

Зеленый

0-4095

0-65535

Синий

0-4095

0-65535

CMY

8:8:8

Голубой

0-255

Пурпурный

0-255

Желтый

0-255

LAB

8:8:8

Яркость

0-255

Канал A

0-100%

Канал B

0-100%

YIQ

8:8:8

Яркость

0-255

Синфазный

0-255

Суммарный

0-255

HLS

8:8:8

Тон

0-3600

Яркость

0-100%

Насыщенность

0-100%

HSB

8:8:8

Тон

0-3600

Насыщенность 0-100%

Яркость

0-100%

Такие преобразования, естественные для восприятия изображения человеком или удобные для передачи данных, печати в системах распознавания является дополнительными, зашумляющими сигнал операциями. Кроме того при изменении соотношения цветовых составляющих смещаются оценки положения границ объектов, что в высокоточных приборах не допустимо.

При цветовых преобразованиях необходимо также помнить, что между цветовыми моделями CIE, CMY, RGB, YIQ существуют аффинные преобразования, тогда, как между HLS и HSV- нет. Данное обстоятельство будет заметно, если изображение, содержащее непрерывные цветовые переходы, переводить, например, из HLS в RGB (на изображениях может появиться разрыв непрерывности).

Наиболее эффективно вести распознавание получив «чистый» сигнал с матрицы. Но на практике это решение не всегда возможно. Цифровые процессоры сигналов камеры наблюдения, последующих устройств формируют сигналы в одном из указанных стандартов и обратное преобразование не эффективно, так как первичная информация частично потеряна. Не редко отличительными признаками могут являться сами компоненты стандартного сигнала, например, цветовой тон в стандарте HSB. Поэтому все указанные кодировки сигналов встречаются в задачах распознавания.

Как следует из выше сказанного в современных системах с распознаванием изображений описание пикселя представляется 8-16 битами, которое может первичным преобразованием увеличиваться до

24-32 битного.

Распознаваемый объект представлен пикселями. Тогда объем пространства исходов

или .

Специфика описания ситуации в задачах распознавания образов в очень большом объеме пространства исходов. Даже для сегмента описания объекта и с 24 - битным представлением пикселя он превышает .

Обозначим результаты наблюдения, заданные в пространстве исходов, , где , - целые положительные числа. Для текущего наблюдения моменты съема информации будем считать расположенными во времени равномерно. Отсчет будем вести от нуля в каждом новом наблюдении. Разность индексирует данные опыта, которые или предшествовали текущему наблюдению, или отстоят от текущего отсчета на расстоянии большем, чем расстояние взаимного влияния (корреляции) . Данные опыта, дополненные оценками результатов распознавания, принятия решений и составляют априорную информацию об объекте исследования на момент начала текущего наблюдения. Как следует из определения, вероятностное пространство можно считать заданным, если известно для всех распознаваемых классов, ситуаций ( - индекс класса). Исследователь сам решает интегральную или дифференциальную форму описания (функция распределения или плотность вероятности) использовать на практике. Однако большее распространение получила дифференциальная форма. Она более наглядна. Рассмотрим несколько часто используемых функций распределения вероятности (для сравнения разброса у всех графиков =1 ).

Нормальное распределение.

,

Его плотность (рис. 2.4) зависит от двух параметров - среднеквадратичного отклонения и - математического ожидания.

Вид нормированной функции распределения для нормального закона приведен на рис. 2.5.

Рис. 2.4. Нормированная плотность одномерного нормального распределения

( =1, =0)

Рис.2.5. Нормированная интегральная функция одномерного нормального распределения ( =1, =0)

Нормальный закон в ТР используется довольно часто. Он хорошо подходит для оценки симметричных, много причинных случайных событий при слабом доминировании какой либо из причин. В описании шумовых сигналов, подчиняющихся нормальному закону, утвердился термин – белый шум (обычно шум от многих источников практически равной энергии).

В игровых ситуациях нередко приходится иметь дело с событиями, образами, плотность распределения вероятности появления которых близка к равномерному закону распределения.

На рис. 2.6, 2.7 приведены нормированные функции дифференциальная и интегральная для равномерного распределения вероятности.

Равномерное распределение вероятности задается как правило на слитном участке оси пространства исходов. Хотя такой признак не обязателен, в сложных системах отдельные участки на оси могут быть запрещены и события в них не появляются.

Для равномерного закона при нулевом значении центра интервала

, где - ширина полуинтервала.

Рис. 2.6. Нормированная плотность одномерного равномерного распределения ( 1, =0)

Рис. 2.7. Нормированная интегральная функция одномерного равномерного распределения ( 1, =0)

Рис. 2.8. Нормированная плотность одномерного экспоненциального распределения ( 1)

Рис. 2.9. Нормированная интегральная функция одномерного экспоненциального распределения ( 1)

Это примеры симметричных законов распределения. Многие образы имеют тенденцию к многочисленности на границе интервала своего существования. К ним относятся многие биологические объекты, природные включения (например, камешки и т. п. в пластах полезных ископаемых), отсортированные по размеру. На рис. 2.8, 2.9 приведен вид кривых экспоненциального закона распределения, практически хорошо подходящий для указанных случаев.

Экспоненциальный закон распределения , ( , ), где - параметр, имеющий размерность, обратную размерности оси и определяющий разброс случайной величины.

Но реальные образы, как правило, многомерны. В практике обработки изображений наибольшее распространение находят двумерные функции описания яркости и соответственно двумерные распределения вероятности появления простейших образов. Спектральные преобразования дополненные координатой смещения во времени превращаются в вейвлет преобразования

На рис. 2.10, 2.11 представлено изображение и распределение интенсивности в сечении сформированного лазерного пучка, часто используемого в сканирующих системах. Оно близко по форме к двумерной функции плотность нормального распределения. В идеальном случае размеры пикселя не превышают 1…3 .

Рис.2.10. Изображение зондирующего лазерного пучка (пиксель)

Рис.2.11. Распределение интенсивности в приделах пикселя

Рис.16. Трехмерное распределение интенсивности пучка

52

Двумерные функции распределения учитывают взаимное влияние выпадения у текущего случайного события определенной координаты по одной оси от величины на второй. Наиболее просто это пояснить на примере.

где <1 – коэффициент корреляции координат случайного события, >0 – среднеквадратичное отклонение (стандартное отклонение) по оси , - математическое ожидание по оси .

Для непрерывного представления осей пространства исходов , где - взаимная корреляционная функция.

Степень взаимосвязи между параметрами точек в пространстве исходов уменьшается по мере увеличения расстояния между ними. Обще принято считать независимыми события, разнесенные в пространстве исходов на наименьшее расстояние, на котором ( - допустимый в анализе коэффициент ошибки). Это расстояние получило название радиуса корреляции. События, разнесенные на расстояние большее, чем радиус корреляции принято считать не зависимыми.

В задачах распознавания образов взаимосвязь не редко сохраняется в приделах всего сегмента образа. Под сегментом образа будем понимать участок пространства минимальных размеров, описывающий рассматриваемый образ. Например, сохраняется связь цветовых характеристик пикселей биологического, ботанического объекта по всему объему при его конкретной реализации в большей степени, чем между различными объектами конкретного класса. Еще больше расстояние и степень связи у искусственных объектов. Это необходимо учитывать при проведении исследований. Проведя оценку цветовых характеристик пикселей в приделах одного объекта нельзя считать выборки не зависимыми. Только исследование многих объектов дает достоверную информацию для описания характеристик класса.