Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
_ТР_ЭлК_2012__Шестаков.doc
Скачиваний:
36
Добавлен:
26.09.2019
Размер:
11.56 Mб
Скачать
  1. Сложные образы в задачах распознавания.

Вначале рассмотрим задачу контроля качества горения факелов горелок газомазутного котлоагрегата.

Рис. 11.1. Датчики и горелки в котлоагрегате

Рис. 11.2. Сигнализатор и датчики

Задача обусловлена взрывом котлоагрегата при случайном гашении факела. Поступающий газ в считанные секунды вызывает взрыв котлоагрегата. В то же время аварийное выключение приводит к отключению подачи электроэнергии, т.е. цена ошибок первого и второго родов велика. Факелы контролируются с образованием колец отсчета в памяти контроллеров датчика и сигнализатора.

Принимают сигнал оптического излучения факела, делят его на поддиапазоны с образованием основного и обзорного каналов, причем обзорный канал используют при потере сигнала по основному каналу. Он имеет программируемый коэффициент усиления больший, обзорный. Сигнал оцифровывают последовательности отсчетов, формируемой по кольцу. Длительностью записи превышает установленный допуск на время принятия решения о наличии или отсутствии факела, по меньшей мере, в два раза. Во фрагменте упомянутой последовательности, длительностью меньшим, чем допуск и граничащем с текущим отсчетом, определяют средний уровень пульсации сигнала в диапазоне частот пульсации пламени факела. Во всей упомянутой последовательности определяют уровень постоянной составляющей, по величинам которых осуществляют текущую подстройку смещения окна оценки пульсаций сигнала в основном канале таким образом, чтобы центр окна приближался к текущему уровню постоянной составляющей; сравнивают средний уровень пульсаций сигнала с уровнем, соответствующим принятию решения об отсутствии факела. Понижают упомянутый уровень при увеличении уровня постоянной составляющей, и по результату сравнения принимают решение о наличии или отсутствии факела, причем при принятии решения об отсутствии факела осуществляют текущую подстройку коэффициента усиления основного канала в сторону увеличения.

Это обеспечивает более объективный контроль наличия факела, позволяя использовать при контроле более устойчивые зоны с большим уровнем постоянной сигнала и малыми пульсациями (что характерно при стехиометрическом режиме горения в ядре факела), не теряя контроля при смещении факела и переходе в зоны с меньшей постоянной составляющей. При гашении факела соседние горелки не обеспечивают, как правило, требуемого уровня постоянной составляющей при существующем уровне пульсаций, так как постоянная составляющая вычисляется за существенно большее время, чем составляющая среднего уровня пульсаций.

Задача практически базируется на двух проблемах распознавания: необходимо по фрагменту и полному кольцу отсчетов динамически подстраивать высокочувствительный канал АЦП контролирующий пульсацию пламени и распознать с малой задержкой гашение факела.

Рис. 11.3. Положение зоны оценки пульсаций сигнала на его оси

При срыве сигнала, запуске системы контроля для сокращения времени поиска сигнала и настройки усилителя рабочей зоны анализа вводят обзорный канал со своим усилителем, коэффициент усиления которого устанавливают меньшим, чем у основного канала, и обеспечивающим охват всей зоны сигнала для выбранного типа горелок, спектрального поддиапазона и состава горелочной смеси по фиг.11.3.

Полученные сигналы преобразуют в коды, по рабочему сигналу формируют кольцо отсчетов длительностью, превышающей допуск на время срабатывания, по крайней мере, вдвое. По обзорному каналу также формируют кольцо отсчетов размером, достаточным для определения текущих интегральных параметров сигнала, характеризуемых средней величиной и рабочим диапазоном пульсаций, которые используют при потере сигнала по основному каналу.

По кольцу отсчетов рабочего канала определяют постоянную составляющую, которую используют для текущей подстройки смещения рабочего канала и принятия решения о наличии факела по фиг.2.

Рис. 11.4. Зона оценки пульсаций и обзорная зона при высокодинамичном контроле

В части кольца длительностью, меньшей допуска на время срабатывания, прилегающей к текущему отсчету, вычисляют среднюю величину пульсаций сигнала в диапазоне частот пульсации факела. Средняя величина пульсаций используется для текущей подстройки коэффициента усиления усилителя рабочего канала и принятия решения о наличии факела. Уровень принятия решения об отсутствии факела по величине пульсации изменяют в зависимости от величины постоянной составляющей: вычисляемой по более длительной реализации сигнала и, следовательно, более инерционной. Практически уровни срабатывания понижают с ростом уровня постоянной составляющей, которая повышается при движении в корень факела, по рис. 11.5.

Рис. 11.5. Зоны принятия решений, разделенные решающими границами.

В тех же условиях, но при наладке подачи объемов газа и воздуха может проводится настройка режимов работы горелок газомазутных котлоагрегатов по акустическим сигналам от пламени факелов с целью обеспечения наиболее полного, равномерного сгорания топлива путем индивидуальной настройки каждой горелки.

Сигналы снимались в два этапа с использованием электретного (первый этап), и динамического микрофонов (второй этап).

В ходе работ была доказана возможность регистрации звуков пламени от горелки на фоне шумов и их зависимость от состава топливной смеси.

На рис.11.6 приведен интегральная временная диаграмма хода звуковых сигналов для пяти режимов работы горелки.

Рис.11.6. Интегральная временная диаграмма звуковых сигналов (пламя и все шумы)

с регулировкой подачи газа (электретный микрофон) - 45 файлов: три зоны

  • небольшая пульсация пламени до ~ 12000 (16 файлов),

  • большая пульсация пламени от ~ 12000 до ~ 24000 (16 файлов),

  • малая пульсация пламени от ~ 24000 до ~ 35000 (10 файлов).

Больший масштаб по сигналам в зонах:

Рис.11.7. Спектры сигналов − 1 и 2 ой файлы без 2000 – небольшая пульсация пламени

Рис.11.8. Спектры сигналов − 30 и 31 ой файлы без 2000 – переход к малой пульсации пламени

Рис.11.9. Спектры сигналов − 42 и 43 ой файлы без 2000 – малая пульсация пламени

Оценены и виды сигналов помех от дымоотсоса и вентилятора.

Рис.11.10. Вид сигналов звуковой помехи только с дымоотсоса – 4 файла

Вентилятор добавляет помехи – вид сигналов от вентилятора и дымоотсоса

Рис.11.11. Вид сигналов звуковой помехи от вентилятора и дымоотсоса – 15 файлов

Больший масштаб по сигналам:

Рис.11.12. Вид сигналов звуковой помехи от вентилятора и дымоотсоса – 1 и 2 файлы

Для идентификации режима работы горелки был проведен спектральный анализ с выделением информационной зоны участков спектра акустических сигналов.

Рис.11.13. Дымоотсос - низкочастотная часть спектра

Рис.11.14. Фон - более широкая полоса

Спектры сигналов от пламени факела различимы на фоне шумов

(спектры соответствуют файлам, показанным на рис.2...4)

Рис.11.15. Спектры сигналов − 1 и 2 ой файлы – небольшая пульсация пламени

Рис.11.16. Спектры сигналов − 30 и 31- ый файлы – переход к малой пульсации пламени

Рис.11.17. Спектры сигналов − 42 и 43 - ий файлы – малая пульсация пламени

Видна рабочая зона до 200 (до 100) Гц отображающая качество горения горелки. Ниже приведены интегральные низкочастотные спектры для 9 зон по 5 файлов.

Рис.11.18. Спектры групп сигналов (по 5 файлов группа, номер группы = floor(Nфайла/5))

Рис. 11.19. Интеграл по спектру информативной зоны (0...100 Гц) по группам (j – номер группы):

  • 0, 1, 2 – небольшая пульсация пламени;

  • 3, 4, 5, 6 – большая пульсации пламени;

  • 7, 8 – малая пульсация пламени.

Рис. 11.20. Интеграл по спектру не информативной зоны (220...320 Гц) по группам.

В медицине постановка диагноза базируется на совокупности наблюдений, анализов и измерений не редко только косвенно говорящих о наличии болезни. Это налагает определенную специфику на проведение процесса распознавания и принятие решения.

Рассмотрим данный процесс на примерах систем иридодиагностики и аускультации сердца.

Хотя изображения глаза перспективны и в охранных системах.

Самой надежной и точной методикой создания биометрического портрета человека является сканирование сетчатки человеческого глаза. Сетчатка пронизана кровеносными сосудами, переходящими в малые вены и артерии. Их рисунок — уникальный в своем роде и с возрастом меняется незначительно. Впрочем, при тяжелых заболеваниях и травмах, могут происходить его изменения, препятствующие распознаванию. Инфракрасный лазер отражается сосудами глазного дна. Человек должен находиться не дальше чем на расстоянии 1,5 см. от камеры и не двигаться. При этом воспринимается более 400 характерных точек. Для сравнения: при съемке отпечатков пальцев их количество колеблется между 30 и 40.

В противовес сканированию сетчатки, распознавание зрачка не требует лазерной техники. Избыточное освещение может вызвать сужение зрачка и затруднить обследование. Поэтому часто работают с искусственным источником освещения. Распознавание базируется на значительных признаках на зрачке, типа кругов, канавок, пятен сосудиков или завитушек. И только некоторые насчитывают ровно 200 атрибутов.

Одним из разделов медицинской диагностики является наука - иридология. В основе ее лежит изучение радужной оболочки глаза. Помимо специальных инструментов каждая наука имеет также свой особый язык, свою терминологию. Ключевым понятием в иридологии является целостность тканей. Цель иридологии – это оценка степени целостности тканей, включая врожденные сильные и слабые места организма, собирательно называемые ‘конституцией’.

Стремясь добиться наилучшей визуализации радужной оболочки глаза (радужки), специалисты на первом этапе работали с инструментами офтальмологии (раздела науки о глазных болезнях и аномалиях): офтальмоскопом, щелевой лампой и другими приспособлениями для освещения и увеличения.

Сегодня существует ряд приборов: интрапупиллографы, биокалиброметры, регистраторы пульсации хориоидального участка сетчатки: считыватели формы зрачка, регистраторы микродвижений глаз, которые создают довольно объемные описания характеристик состояния глаза.

Исследуются зрачковые реакции при интегральной и локальной стимуляции сетчатки глаза, зрачка с разрешением 15-20 угловых минут разных участков сетчатки и временным до 1 мс. Источники света обеспечивают локальное возбуждение с определенной частотой мигания. Подсветка может осуществляться и в инфракрасном свете без симуляции реакции глаза.

Приборы позволяющий проводить измерения линейных величин и микрофотометрический анализ локальных участков изображений радужки, глазного яблока. Считывается 3D форма зрачка. Геометрические параметры регистрируются с точностью и локальностью в 100 мкм и выше.

Это позволяет судить о той или иной степени деформации формы зрачка в каждом отдельном секторе радужки и на основе этого признака в комплексе с другими иридодиагностическими признаками проводить предварительную постановку диагноза.

А поскольку пульсация хориоидального участка сетчатки отражает пульсацию кровотока заднего сосудистого слоя глаза, то по ее величине можно судить о характере кровотока в сосудах радужной оболочки.

Богатую почву для диагностики создает геометрия линий в различных участках сетчатки.

Особый раздел иридодиагностики – цветовой состав радужной оболочки. Собственная пигментация радужной оболочкиопределяется концентрацией меланина в переднем пограничном слое и строме. Кривые пропускания 5% раствора этого пигмента рис. 11.21.

Из спектральных свойств меланина ясно, почему сильно пигментированные коричневые радужки в красном свете кажутся более светлыми , чем серые или голубые. Очевидно также, что в синем свете все пигментные образования становятся черными, а в красном почти полностью обесцвечиваются. Поэтому локальная пигментация на более светлом фоне окружающей ткани радужки, также как участки депигментации на темном фоне, контрастнее всего выглядит на синем свете.

Рис. 11.21. Кривые пропускания меланина и гемоглобина на различных участках спектра

Выбор вида освещения определяется спектральными свойствами исследуемой детали и окружающего ее фона. При исследованиях состояния гемоглобина обращают на себя внимание два участка спектра с минимальным пропусканием:

  • участок с длиной волны менее 440 нм (фиолетовый свет);

  • 540...580 нм (желто-зеленый).

Из-за поглощения света в этих участках новообразованные сосуды радужной оболочки могут выглядеть, как черные линии.

Из спектральных свойств меланина ясно, почему сильно пигментированные коричневые радужки в красном свете кажутся более светлыми , чем серые или голубые. Очевидно также, что в синем свете все пигментные образования становятся черными, а в красном почти полностью обесцвечиваются. Поэтому локальная пигментация на более светлом фоне окружающей ткани радужки, также как участки депигментации на темном фоне, контрастнее выглядит на синем свете.

На рис. 11.22 приведена классификация систем иридохромографии по используемой аппаратуре. Спектральный состав коэффициентов пропускания и отражения может исследоваться на различной по стоимости аппаратуре.

Детальная картина получается в ветви с монохроматической фотоприемной матрицей благодаря применению узкополосных источников света.

В полихроматической ветви работают наборы светофильтров. В обеих случаях может осуществить нечто подобное иридохромоскопическому анализу.

Упрощенные системы оснащаются цветными приборами наблюдения.

Рис. 11.22. Классификация систем иридохромографии

При выборе вида освещения для иридохромоскопии следует исходить из предполагаемых спектральных свойств объекта наблюдения и окружающего его фона. Необходимо стремиться к созданию максимального контраста и фона. Глубинный анализ тканей радужки проводится с учетом особенностей ее структуры и степени пигментации. В терминах ТРО необходимо не допускать увеличения зон перекрытия классов в цветном признаковом пространстве.

Сегодня широко используются системы, способные распознать личность по фотографии сетчатки (банковские системы пропусков, военные и т.д.), многие медицинские центры сегодня могут предложить полную диагностику организма именно по изображению все того же глаза, ну а лазерная коррекция зрения стала рабочим инструментом офтальмологии.

Процесс автоматической диагностики с постановкой диагноза в данном применении находится в начальной стадии. Основной задачей является предварительная обработка исходных изображений с соблюдением принципов ТРО. Это особенно важно для систем работающих в недоступной человеку области спектра.

На рис. 11.23 представлена последовательность операций при распознавании в устоявшаяся в иридодиагностике. Описано три подхода к решению задачи.

При распознавании по контуру неизвестный объект (1) считывается, его изображение (2) на квантуется и дискретизируется (3).

Понижение размерности описания достигается минимизирующим преобразованием (4).

В результате выполнения описанных этапов плоское изображение объекта представляется в виде многосвязного контура. Т.к. при идентификации используется только внешний контур изображения, то его выделение происходит в узле (5).

Параллельно проводится анализ изображения с целью выявления на нем отдельных опорных элементов (6), необходимых для проведения нелинейных преобразований внешнего контура изображения объекта (7).

Выполнение этого этапа позволяет уменьшить перспективные искажения на изображении, а также провести желательную переориентацию в пространстве и приведении его к плоскостям проектирования, в которых интегральные признаки идентификации проявляются наиболее ярко.

Далее объект идентифицируется (8).

При этом либо происходит классификация неизвестного объекта , либо, если риск диагноза велик, делается запрос новой реализации объекта, снятой, например, под другим ракурсом.

Рис.11.23. Основные операции обработки изображений в иридодиагностике

При распознавание по одиночным признакам получают одиночное изображение (2) и далее проводятся этапы предварительной обработки изображения: кодирование (9) и минимизация (10).

Затем многосвязной контур подвергается препарированию (11) на систему односвязных контуров.

Каждый такой контур нормализуется (12) и распознается (13).

Т.к. целевые признаки ,как правило, представляют собой связную систему из односвязных контуров, то для их формирования приходится проводить синтез односвязных контуров для получения изображений целевых признаков (14), по найденному набору который на изображении неизвестного объекта и проводится его целевое распознавание (15).

Исходом этого этапа может быть либо отнесение неизвестного объекта к одному из классов, либо запрос новой информации об объекте.

Распознавание по стерео парным снимкам проводится с помощью двух приборов наблюдения. Стерео изображения (16) дискретизируются, кодируются (17).

Минимизация их описания (18), и препарация на систему односвязных контуров (19) подготавливает несвязанное описание объектов.

Для 3D анализа проводится идентификация схожих точек стереопары (20).

Далее составляется пространственное описание видимой части неизвестного объекта (21) и формируются целевые признаки (22).

По ним проводится распознавание (23), определяется номер класса либо дается запрос новых снимков неизвестного объекта .

Многие из приведенных операций подходят под термин фильтрация изображения.

Изображение глаза будет зашумлено, поэтому понятие фильтрации в данном случае весьма обширно, и включает в себя любое преобразование графической информации. Фильтрация может быть задана не только в виде формулы, но и в виде алгоритма, а не редко и таблицы его реализующая. Человек запоминает графическую информацию, в основном, в виде трех ее составляющих:

1.Низкочастотные составляющие изображения. Они несут информацию о локализации объектов, составляющих изображения. Эта составляющая наиболее важна, так как связка глаз - мозг уделяет ей первостепенное внимание.

2.Высокочастотные составляющие изображения. Они отвечают за цветовые перепады - контуры изображения. Увеличивая их, мы повышаем резкость изображения.

3.Текстуры изображения. Чтобы понятно объяснить, что это такое проведем небольшой эксперимент. Расслабьтесь, вспомните интерьер вашего дома, например, письменный стол. Вы знаете его очертания, местоположение, цвет - это низкочастотные характеристики, вспомнили его заостренные углы, небольшую царапину где-нибудь ближе к его кромке - это высокочастотные составляющие. Также Вы знаете, что стол деревянный, но не можете в точности рассказать обо всех мельчайших деталях его поверхности, хотя общие характеристики (коричневый с темными впадинами, две области расхождения концентрических эллипсов от сучков) - наверняка. В данном случае в скобках - описание текстуры. Можно трактовать текстуру как характеристику участков в контурах изображения.

Будем рассматривать фильтры в виде квадратной матрицы A. Пусть исходное изображение X, а получаемое как результат фильтрации - Y. Для простоты будем использовать матрицы 3x3:

Рекурсивными фильтрами первого рода будут такие фильтры, выход Y которых формируется перемножением весовых множителей A с элементами изображения X. Для примера рассмотрим фильтры низких частот:

.

Фильтром низких частот пользуются часто для того, чтобы подавить шум в изображении, сделать его менее резким. Используя фильтр A3 , будем получать изображение Y следующим образом:

Выход фильтра второго рода формируется аналогично первому, плюс фильтра B:

Для простоты рассмотрим одномерный фильтр вида:

:

Рассмотрим и другие фильтры:

Высокочастотные (для подчеркивания резкости изображения):

Для подчеркивания ориентации север N, и северо-восток N-S:

.

Подчеркивание без учета ориентации (фильтры Лапласа):

.

Корреляционный:

,

где - коэффициенты корреляции между соседними элементами по строке (столбцу). Если они равны нулю то отфильтрованное изображение будет совпадать с исходным, если они равны единице, то фильтр будет эквивалентен лапласиану. При обработке изображений очень часто используют последовательность фильтров: низкочастотный и Лапласа.

Часто используют и нелинейную фильтрацию. Для контрастирования перепадов изображения используют градиентный фильтр:

,

или его модульную вариацию:

.

Еще один нелинейный фильтр - Собела:

A0 ... A7 - входы, yi,j - результат фильтрации.

,

Рекурсивная версия (с вызовом функцией самой себя прямо или косвенно):

где B0 ... B7 - выход отфильтрованного изображения.

Нелинейная фильтрация - достаточно загадочная область цифровой обработки сигналов, многое еще в ней пока не изучено. Важность же ее не вызывает сомнений, потому, что окружающий нас мир по своей сути не так линеен, как порою хочется его нам интерпретировать.

Примеры работы некоторых фильтров приведены на рис. 11.24 – фильтр Лапласа и на рис. 11.25 – фильтр Собела.

Левое окно интерфейса программы показывает – исходное изображение, правое – полученный результат.

Рис. 11.24. Выделение контуров методом Лапласа

Рис. 11.25. Обработка изображения фильтром Собела

Наряду с оптическими изображениями в медицине широко применяются и акустические сигналы.

Известно, что выслушивание является одним из наиболее эффективных ме­тодов клинических исследований сердца.

И в наше время, несмотря, на внедрение в клиническую практику рент­геновского, ЭКГ и других методов, наиболее полное представление о меха­нике сердечной деятельности и ее нарушениях по-прежнему дает исследо­вание звуков сердца.

В данном случае это пример хорошо теоретически проработанной причинно-следственной картины, содержащей сложные механические модели и уравнения динамики жидкостей.

Базовой привязкой является обычно сигнал с электрокардиографа, На рис. 11.26 приведен график поясняющий синхронизацию. Теоретическим обоснованием является высокая степень корреляции между длительностью акустической и электрической систолы.

Рис. 11.26. Синхронизация циклов прослушивания сердца по электрокардиограмме. - сигнал с электрокардиографа, - сигнал с стетотелефона

Упрощенно считая, что систола - это только со­кращение миокарда, а диастола - только пассивное расслабление, можно ввести два базовых сигнала синхронизации R- зубец и T- зубцы.

На самом деле картина существенно сложнее. Теория фазовой структуры сердечного цикла была создана 1945 г. Сердечный цикл состоит из 4-ех периодов и 11-ти или 8 фаз. Опишем некоторые из них.

Система желудочков начинается с фа­зы трансформации, или асинхронного сокращения (20 мс), в конце которой атриовентрикулярные клапаны закрываются внутри желудочковым давлени­ем. В следующей фазе изометрического сокращения (32 мс) в основном поддерживается постоянство объезда, не отмечается выраженной динамики геометрии внутренних н внешних поверхностей сердца.

Далее следует протосфегмический интервал (5 мс), когда закончилось изометрическое сокращение. Очередные фазы - максимального и редуцированного изгнания -дифференцируются друг от друга лишь по внутри желудочковым барограм­мам.

Теперь о периодах и фазах диастолы. Первая из них именуемая протодиастолическим интервалом, соответствует закрытию полулунных клапа­нов, и во время нее кровотока через клапаны уже нет (последнее трудно представить, если при открытых клапанах сохраняется хотя бы минималь­ный перепад давления).

Следующая фаза - изометрического расслабления (85мс) - характер­но, как известно, снижением внутри желудочкового давления, причем сред­няя его скорость примерно равна средней скорости подъема давления, в на­чале механической систолы. На том этапе, так же как и в фазу трансформа­ции, имеет место явление активного изменении геометрии желудочков, т.е. часть явлений не сводится к пассивному расслаблению миокарда. Следует подчеркнуть, что фаза быстрого пополнения желудочка постоянством дли­тельности (в норме 9.5 мс).

Нормальная хронокардиограмма левого желудочка человека (средние данные в секундах) приведены в таблице 8.

Таблица 8

Период напряжения

0,086 ±0,001

асинхронное сокращение

0.053 ±0.001

Изометрическое сокращение

0.032 ± 0,001

Период изгнания

0.58 ±0,002

Систола:

Механическая

0.290 ±0,002

Общая

0.144 ±0,002

Период расслабления

0,124 ±0,005

Продолжительное изгнание

0.04 1( 0.034)

Изометрическое расслабление

0.083 ±0.004

Период наполнения:

0,453 ±0,021

Быстрое расслабление

0,09. ±0,004

Диастаз

0,259 ±0,019

Систола предсердий

0.096 ±0,004

Интерсистолический интервал

0.07

Схема расположения стандартных точек записи фонокардиограммы на грудной клетке

показана на рис. 11.27:

  • Первая точка — верхушка сердца;

  • вторая точка — четвертое межреберье слева:

  • третья — четвертое межреберье справа;

  • четвертая — второе межреберье слева;

  • пятая — второе межреберье справа.

Таким образом, задача формализуется, как задача распознавания сигналов от набора источников звуков расположенных определенным образом в пространстве и локализованных во времени.

Основная сложность состоит в устранении влияния наложения звуковых сигналов на друг друга во времени.

Рис. 11.27. Точки прослушивания сердца

Не мало сложностей вызывает и крепление микрофонов. Плохое прилегание приводит к изменению частотного спектра снимаемых сигналов.

Во всем множестве возникающих вопросов рассмотрим один – дискретизацию сигналов. Этот вопрос возникает почти во всех системах распознавания образов и имеет важное значение.

Эта процедура известна давно; ее применяют к различным сигналам как биологического, та к и небиологического про­исхождения, и уже накоплено много знаний о ее теоретических и практических аспектах. Применение этих знаний основано на некоторых фундаментальных соотношениях теории информации и теории фильтров.

Процесс аналого-цифрового преобразования удобно подраз­делить на три этапа.

Первый этап - взятие отсчетов (или кван­тование по времени); на этом этапе сигнал, являющийся непре­рывной функцией времени, преобразуется в сигнал, имеющий определенные значения только в отдельные, обычно следующие через равные интервалы моменты времени (временные точки).

Второй этап часто называют квантованием (или квантованием по уровню); на этом этапе значение исходного непрерывного сигнала в каждой дискретной временной точке представляется в виде дискретного числа.

Третий этап - интерполяция, которая используется для восстановления исходного сигнала по его цифровому представлению.

Теорема отсчетов, являющаяся краеугольным камнем теории аналого-цифрового преобразования, утверждает следующее:

если в моменты времени t = ..., —2Т, —Т, 0, Т, 2Т, ... взять отсчеты функции f(t), которая может быть синтезирована как линейная комбинация элементарных сигналов, то по этим отсчетам невозможно отделить частотные составляющие функции, лежащие выше частоты I/ (2T) Гц, от частотных составляющих, лежащих ниже этой частоты.

Этот эффект можно уподобить «свертке» шкалы частот, в ре­зультате которого составляющие сигнала, лежащие между ча­стотами К и (K+1) /T, «совмещаются», с составляющими, лежащими между частотами (К— 1) и К /Т.

Сигнал можно построить из со­вокупности синусоид, каждая из которых имеет определенную амплитуду, частоту и фазу. В математической форме этот ряд Фурье для периодического сигнала с периодом Т за­писывается в виде

f(t)=Fn*exp(in2t/T),

Fn=1/T *F(t)exp(-in2t/T)dt.

Для непериодического сигнала ряд Фурье выражается в виде

F(t)=1/2*F()exp(it)d.

где F() - преобразование Фурье, которое определяется как

F()=f(t)exp(-it)dt.

В терминах анализа Фурье теорему отсчетов можно сфор­мулировать следующим образом:

Если функция f(a) задана для всех частот ,меньших рад/с (или 1/(2Т) Гц), и равна нулю для всех частот выше этого значения, то исходный сигнал f(t) можно полностью восстановить по данным его отсчетов при условии, что частота отсчетов превышает 1/Т.

Наиболее важное значение имеет обратный аспект теоремы отсчетов, т. е., указание на то, чего не следует делать ни в коем случае. Говоря конкретнее, если частота отсчетов ниже, чем удвоенное значение частоты самой высокой составляющей сигнала, то неизбежны ошибки.

Взятие отсчетов энергии в области частот не следует рассматривать, как фильтрацию. Нельзя выбирать частоту отсчетов, учитывая только те частотные составляющие данного сигнала, которые представляют интерес.

Например, предположим, что отсчеты некоторого электрокардиографического сигнала берутся через период 5 мс (с частотой 200 Гц), поскольку составляющие сигнала, лежащие в частотном диапазоне выше 100 Гц, не представляют интереса.

Если эта электрокардиограмма была сначала записана при помощи аппаратуры с широкой полосой пропускания, регистрирующей частотные составляющие из диапазона частот выше 100 Гц (независимо от того, являются ли они полезным сигналом или шумом), то в соответствии с теоремой отсчетов эти частотные составляющие дадут ошибки в значениях отсчетов (их называют «ошибками совмещения»).

Правильное взятия отсчетов в данном случае заключается либо в том, чтобы вначале фильтруется сигнал электрокардиографа для устранения всех составляющих, соответствующих частотам выше и близким к 100 Гц, а затем брать отсчеты с частотой 200 Гц, либо в том, чтобы определить самую высокочастотную составляющую исходной электрокардиограммы, а затем брать отсчеты с частотой, по крайней мере вдвое превышающей частоту этой составляющей.

Если в сигнале присутствуют шумы, то дискретизация искажает форму и полезного сигнала.

На рис. 11.28 представлен вариант дискретизации гармонического сигнала с частотой отсчетов близкой к рад/с без соблюдения рекомендации по предварительной фильтрации. Входной сигнал с приходом импульса строба оцифровывается.

Выходной сигнал для двух значений сдвига фазы представлен на рис. 11.30 и рис. 11.31, на рис. 11.29 в том же масштабе приведен входной сигнал. Фаза его соответствует случаю оцифровки рис. 11.30.

Рис. 11.28. Входной сигнал и импульсы стробов

В данном случае выходной сигнал имеет ступенчатую форму, аппроксимация не проводится. По форме сигнала очевидно то, что говорить об ошибке представления не приходится, налицо грубое искажение и расширение спектра частот.

Рис. 11.29. Входной сигнал со сдвигом по на 5 единиц

Рис. 11.30. Выходной сигнал со сдвигом по на 5 единиц

Рис. 11.31. Выходной сигнал со сдвигом по на 48 единиц

Когда экспериментатор получает сигнал в цифровой форме, его может заинтересовать, какой вид имеют эти данные в про­межутках между точками отсчета. Восстановление сиг­нала в непрерывном виде называются интерполяцией. Хотя разные методы дают различные по качеству результаты, ни один из них не может обеспечить полное восстановление исходного сигнала. Вопрос идет о понижении ошибки распознавания объектов, вызываемой размытием описания классов из за дискретизации и не совершенством интерполяции. Работы в области аппаратной аускультации сердца рекомендуют частота от­счетов выбирать в 100 раз и более раз большую, чем граничная частота звуковых сигналов от сердечных мышц.

Распознавание объектов при сверхразрешении. Традиционно считается, что предел возможного в оптико-электронных приборах наблюдения ставит фундаментальный рэлеевский критерий разрешения. Улучшить его не много можно за счет высокого качества сигнала с фотоприемной матрицы и экстраполяции спектра частот в более высокочастотную область. Но эта величина дает выигрыш на 20...30 % не более. Данная величина реально размещает границу разрешения на уровень 0,15...0,3 мкм. Микроэлектронные технологии с проектными нормами ниже 0,13 мкм ставят задачу смещения этой границы в область 0,05...0,09 мкм, в противном случае оптические методы контроля качества изделий становятся неприемлемыми. Данные значения явно уходят в область сверхразрешения.

Под сверхразрешением классически понимается получение изображения участка поверхности объекта с различием объектов, меньших половины длины волны зондирующего излучения. Такой подход сегодня не совсем приемлем, если учесть возможности ближнепольной оптики (БПО). Ее действие основано на присутствии в дальней зоне излучения вполне идентифицируемых следов взаимодействия света с микрообъектом, находящимся в ближнем световом поле, локализованным на расстояниях, ощутимо меньших длины волны излучения. БПО сочетает элементы обычной оптики и сканирующей зондовой. С 1993 г. ведется промышленный выпуск приборов БПО, их предельное ожидаемое разрешение достигает величины в 13 нм, что соответствует лучшим экспериментальным результатам. Возможности БПО велики, но существенным недостатком является малое расстояние между зондом и исследуемой поверхностью.

Есть резерв разрешения и в информационном наполнении сигналов сканирующей микроскопии, в какой то степени они реализуются в динамической микроскопии малых смещений (ДММС). В ДММС расширен информационный базис построения изображений за счет учета предыстории изменения сигналов.

Перечень основных операций в ДММС:

  • предельно сфокусированный зонд смещается с контролем положения по исследуемой поверхности на величину, меньшую планируемого разрешения;

  • фиксируется распределение яркости дифракционного поля в дальней зоне;

  • расшифровываются последовательности кадров с распознаванием малых объектов;

  • реконструируются изображения объектов с учетом динамических изменений в дифракционных картинах.

Перечисленные операции позволяют улучшить разрешение исходной системы.

Совместное использование преимуществ БПО и ДММС дает надежду на достижение требуемого предела разрешения с приемлемой величиной «зазора» между сканируемой полупроводниковой пластиной и микрообъективом со встроенным зондом БПО. Плоскостность пластины в пределах чипа сегодня составляет величину в несколько десятых долей микрометра.

В предлагаемом решении используется фильтрующее свойство оптической системы при передаче изображения структуры с пространственной частотой более высокой, чем предельная разрешаемая данной оптической системой. Исследуемый образец сканируется зондом, перемещаемым вдоль объекта с малым шагом.

Для более наглядного представления рассмотрим одномерный случай. В качестве зонда взят луч с распределением освещенности по нормальному закону

Изображение в плоскости анализа регистрируется многоэлементным фотоприемником в каждом из q положений. Регистрируется как амплитуда, так и фаза излучения, попавшего на фотоприемник. Объект представляет собой миру с коэффициентом пропускания t(x), изменяющимся по синусоидальному закону.

Параметры a и b – границы синусоидального изменения коэффициента пропускания, ω – пространственная частота периодической структуры. После взаимодействия излучения зонда и исследуемой структуры сигнал имеет вид

pr(x) = gauss(x)·t(x).

Далее на каждом шаге с помощью прямого Фурье-преобразования вычисляется спектр сигнала.

Рассмотрим оптическую систему, пропускающую все частоты без изменений. Ниже на графиках представлена амплитуда E результирующего спектра на значимых шагах сканирования:

а

б

Рис. 11.32. Зонд вне объекта, объект (а) и результирующий спектр (б)

а

б

Рис. 11.33. Зонд наезжает на объект, объект (а) и результирующий спектр (б)

а

б

Рис. 11.34. Зонд на объекте, объект (а) и результирующий спектр (б)

Восстановление спектра по дифференциальной информации дает положительный результат. Таким образом можно распознавать объекты, заложенные в нескольких классах.

Пусть реальная оптическая система, ЧКХ которой равна

«не видит» частоты второго максимума результирующего спектра, т. е. α меньше 25 (рис. 11.34).

Рис. 11.35. Распознанная форма сигнала с фазовым смещением

Однако изменение спектра при «наезде» на структуру позволяет распознать ее форму (рис. 11.35).

Таким образом, ДММС позволяет по изменениям низкочастотных составляющих во время наезда сканирующего зонда на не разрешимую традиционными методами структуру восстановить ее вид.

Можно также говорить об построении изображений по срезам дифракционного поля, полученным в разнесенных сечениях. В этом случае весь процесс идет через операции распознавания образов.

Подытожим тему распознавания сложных образов описанием возможностей человека.

В принципе, возможности человека выделять объекты, в том числе и визуальные сообщения, существенно индивидуальны.

Однако при обучении операторов сложной техники, при проектировании пультов управления, интерфейсов пользователей программ необходимо достаточно строго учитывать наработанные рекомендации по кодировке сообщений (по З. Лоуи) обеспечивающие уверенное распознавание их в отведенные сроки.

Согласно статистике сообщения могут передаваться посредством изменений цвета, формы расположения и т. п. при числе вариантов не более указанных в таблице 9. Эти цифры гарантируют надежное распознавание среднестатистическим оператором изменений ситуации и ее правильную оценку.

Таблица 9

Изменяемый параметр

Максимальное число вариантов

Число цветовых градаций

3...10.

Вариация размера

3

Вариация формы абстрактного знака

8...16

Вариация формы буквы/цифры

50

Вариация формы ассоциативного знака

200...1000

Расположение линейное

3...5

Расположение двухмерное

4...9

Расположение трехмерное

8...12

Ориентация

4...8

Ширина линии

2...3

Частота мигания

2...4

Яркость

2...4

Длина линии

2...4

Тип линии (точки, тире и т. п.)

3...4

Объемность

2...3

Расфокусировка

2

Движение через параметры

2...10

При этом минимальные размеры знаков ограничены. Некоторые ограничения приведены ниже. Они могут быть распространены с определенной корректировкой и на другие типы сообщений.

  • Диаметр точки или кружочка

>

0,5 мм.

  • Короткая сторона трех и четырех угольника

>

0,5 мм.

  • Ширина темной линии на светлом фоне

>

0,25 мм.

  • Ширина светлой линии на темном фоне

>

0,125 мм.

Считается что человек в сложной ситуации по приведенным придельным параметрам проводит правильное распознавание объекта с ошибкой не хуже . Эти цифры оценены для оператора после его обучения.

Комбинации сообщений требуют времени для их осмысления. Скорость выполнения человеком логических операций в распознавании образов различна. Для простейших выводов она должна планироваться не меньшей чем ниже указанные ограничения:

  • операция «И» – 0,6 с.,

  • операция «ИЛИ» – 0,2 с.

Более комплексный параметр – пропускная способность системы анализа элементарных зрительных образов. Его размерность выражается в двоичных единицах в секунду усвояемых сообщений.

Оценка этого параметра зависит от организации процесса распознавания и у различных авторов она различна. Есть устоявшиеся оценки, которые используют разработчики приборов и программ.

Некоторые оценки придельных скоростей усвоения приведены ниже. Человек способен усваивать сообщения при скорости входных потоков:

  • по Стерлингу – 12 бит/с;

  • по Миллеру – 24 бит/с;

  • по Шаклану – 50 бит/с;

  • по Глезеру и Цуккерману – 70 бит/с.

Запоминает человек порядка 10 бит/с.

Минимальное время опознавания одинокого объекта считается равным 0,5 секунды. Это что то вроде начальной задержки системы, затрачиваемой на переключение типа работы.

Результаты достаточно скромные. Хотя они сильно меняются от индивида к индивиду. Например, по оценке коллег Айвазовский с одного взгляда запоминал до 700 деталей.

Из приведенных данных легко видеть роль обучения в процессах правильного принятия решений. Обучение человека начинается с его рождения и длится многие годы. Ответственные работы поручаются лицам достигшим возраста 18 лет, да и то со значительными оговорками.

В результате распознавание ассоциативных знаков во много раз более результативнее, чем букв и уж тем более – абстрактных символов.

Ведутся и «электрические» исследования реакций человека. Например, исследуется электрическая реакция мозга при распознавании цвета.

Используются три методики построения цветового пространства (ЦП) для выявления чувствительности на смену цвета.

  • Смешение цветов и составление цветовых уравнений базиса ЦП.

  • Измерение отдельных цветовых функций, как отдельных осей координат.

  • Изменение больших цветовых различий и построение ЦП методами многомерного шкалирования.

Цветовые всплески и смена цветов (стимулы) ответ - электрическая активность мозга. Реакция быстрая. Фронт смены < 1 мс. Электрическая активность коры мозга дает прямое различие между стимулами. Но осмысление информации идет много медленнее.

В примерах приведенных выше в основном рассмотрены процедуры распознавания изображений. Их практическое применение началось с исследование следов элементарных частиц, далее аэрофотоснимков, распознавании объектов при анализе аэрокосмической информации. Сегодня это повсеместный промышленный контроль и бытовая сфера, автоматическое распознавание геометрических примитивов и знаков при вводе изображений книжных страниц и т. п. Однако специалисты видят существенный разрыв между теорией и практикой искусственного узнавания объектов.

Понятие образ шире, чем понятие изображение. ТРО все более абстрагируется, в основном рассматривая множественные операции. Три конечных множества прежде всего подлежат теоретическому анализу :

  • - множество наименований признаков;

  • - множество значений признаков;

  • - множество наименований классов распознаваемых объектов.

Объект считается заданным, если указаны значения его признаков. Для каждого указано его значение .

Таким образом, объект это функция , имеющая

  • область определений ,

  • область значений .

Решающее правило указывает на наименование , которому принадлежит или наиболее близок этот объект. Наименование находится через функцию . Эта функция задана на множестве всех всевозможных объектов .

Таким образом, решающее правило разбивает множество объектов на подмножества (классы разбиения или просто - классы) , представляющие собой прообразы решений

.

Вводится и понятие обучающей выборки - обучающего множества.

Функция обучения составляет вместе с материал обучения .

Класс из задан чаще всего, как вероятности появления объектов данного класса признаками определяющими данную точку.

В более общем виде это функционал, определенный в пространстве признаков ,

.

Сумма всех функционалов в каждой точке обычно постоянна по всему полю существования описания классов. Например, при вероятностном описании классов, постоянная равна единице.

Каждый объект порождает вектор своего описания

,

в общем случае , часть информации может быть не получена или присутствуют данные, не учтенные в описании классов.

Данный вектор случаен, погрешности технических средств считывания значений признаков порождают приблизительность, нечеткость признакового описания объекта. Часто в этом случае говорят о математическом ожидании и эллипсоиде рассеяния или доверительной области оценки признаков объекта.

В теории принятия решений за базу берется, как правило, наихудшая граница доверительной области положения объекта.

Если учесть нечеткость описания классов то нечеткость описания объектов это случайность над случайностью.

В радиофизических задачах признаки приобретают свойства понятные специалистам:

  • поляризационные;

  • узкополосные;

  • интегральные, заданные в полосе частот.

Они могут иметь прямое физическое содержание, а могут переносить и смысловое. Примером последнего служит признак - положение центра тяжести импульса.

Наибольшую неопределенность в трактовку вносят поведенческие признаки.

Исследование устойчивости и правила их выбора признаков рассмотрены выше.

Под одним из показателей сложности будем понимать множество недетерминированных компонентов алфавита признаков, явно выходящих за пределы возможности их эффективного и быстрого анализа в системах последовательных машин. Обычно, сегодня, размерность пространства анализа нечеткости вывода при этом более чем 100 бит. На помощь в случае широкого описания пространства признаков приходят искусственные систолические сети.

У человека, согласно существующей модели, нейроны можно разбить на три большие группы: рецепторные, промежуточные и эффекторные. Рецепторные нейроны обеспечивают ввод в мозг сенсорной информации. Они трансформируют сигналы, поступающие на органы чувств (оптические сигналы в сетчатке глаза, акустические в ушной улитке или обонятельные в хеморецепторах носа), в электрические импульсы своих аксонов. Эффекторные нейроны передают приходящие на них сигналы исполнительным органам. На конце их аксонов имеются специальные синаптические соединения с исполнительными органами, например мышцами, где возбуждение нейронов трансформируется в сокращения мышц. Промежуточные нейроны осуществляют обработку информации, получаемой от рецепторов, и формируют управляющие сигналы для эффекторов. Они образуют центральную нервную систему.

Микроскопические исследования проводят на тщательно подготовленных образцов (заморозка, срезы, окраска) для получения локального двумерного взгляда на большую трехмерную структуру.

Техника микропроб позволяет провести исследования внутренней электрохимии узлов.

Этические соображения запрещают многие важные эксперименты, которые могут быть выполнены только на людях. Большое значение имели эксперименты над животными, однако животные не обладают способностями человека описывать свои впечатления.

Согласно описанной модели мозг представляет собой множество нейронов, имеющих однородную структуру. Каждый нейрон реализует некоторую функцию, называемую пороговой, над входными значениями. Если значение функции превышает определенную величину - порог (что характеризует суммарную значимость полученной нейроном информации), нейрон возбуждается и формирует выходной сигнал для передачи его другим нейронам. Пройдя путь от рецепторов (слуховых, зрительных и других) через нейронные структуры мозга до исполнительных органов, входная информация преобразуется в набор управляющих воздействий, адекватных ситуации.

Отдельные нейроны, соединяясь между собой, образуют новое качество, которое, в зависимости от характера межнейронных соединений, имеет различные уровни. Нейроны моделируют довольно простыми автоматами, а вся сложность мозга, гибкость его функционирования и другие важнейшие качества определяются связями между нейронами и их наполнение. Каждая связь представляется как простой элемент, служащий для передачи сигнала и его линейного усиления или ослабления. Существует большой класс задач: нейронные системы ассоциативной памяти, статистической обработки, фильтрации и другие, для которых связи формируются по определенным формулам, при этом обучение нейронных сетей оказалось осуществимым при моделировании задач на обычных персональных компьютерах.

Хотя сетевые парадигмы весьма разнообразны, в основе почти всех их лежит эта конфигурация рис11.36. Здесь множество входных сигналов, обозначенных x1, x2,…, xn (вектор X),поступает на искусственный нейрон. Каждый сигнал умножается на свой вес w1, w2,…, wn (W), и поступает на суммирование (Σ). Каждый вес соответствует «силе» одной биологической синаптической связи. Суммирующий блок, складывает взвешенные сигналы формируя сигнал NET. В векторных обозначениях NET = X·W. Сигнал NET преобразуется активационной функцией F и дает выходной нейронный сигнал OUT. Это модель МакКоллака – Питса.

Рис. 11.36. Искусственный нейрон.

Активационная функция может быть:

  1. Линейной пороговой - OUT = k·(NET), где k=constant. OUT = 1, если NET > T, OUT = 0 в остальных случаях, где Т – некоторая постоянная пороговая величина,

  2. Сигмоидальной функцией более точно моделирующей нелинейную передаточную характеристику биологического нейрона и представляющей нейронной сети большие возможности.

  3. Функцией гиперболического тангенса . И т. п.

Если F сужает диапазон изменения величины NET то F называется «сжимающей» функцией. Приведенное упрощение не учитывает синхронизирующие функции биологического нейрона, задержки и др.

Однослойные нейронные сети (рис 11.37) не в состоянии выполнить некоторые простейшие логические функции («ИСКЛЮЧАЮЩЕЕ И» и др.), т.е. не обладает функциональной полнотой.

Рис. 11.37. Однослойная нейронная сеть.

Рис. 11.38. Двухслойная нейронная сеть.

Многослойные сети более гибки. Двухслойные сети из 16 возможных двоичных функций от двух переменных могут воспроизвести 14 из них (кроме «ИСКЛЮЧАЮЩЕЕ ИЛИ» и «ИСКЛЮЧАЮЩЕЕ НЕТ»). Это достигается выбором соответствующих весов и порогов. Мак-Каллок и Питтс доказали, что любую вычислимую функцию можно реализовать с помощью многослойной сети искусственных нейронов.

Однако работы по повышению эффективности нейронных сетей с целью совершенствования структуры продолжаются и в первую очередь это многослойные сети с обратными связями – рекуррентные сети.

Рекуррентная сеть Эльмана (рис. 11.39) имеет частичные обратные связи. Вектора исходных коэффициентов W , входной внешний сигнал X дополняются задержанным вектором весов с внутреннего слоя.

Пусть состояния скрытого слоя нейронов, входной сигнал

.

Рис. 11.39. Сеть Эльмана

Обучение сети рекомендуется выполнять с использованием градиентного метода наискорейшего спуска, последовательно проводя следующие действия.

1. Присвоить начальные веса;

2. Для текущего момента t определить состояние сети v и y,

3. Сформировать полный вектор x(k);

3. Определить вектор погрешности обучения e. Целевая функция обучения - минимизация квадрата расстояния между выходным и ожидаемым сигналами ;

4. При величине меньшей допуска завершить процесс обучения.

4. Определить вектор градиента в новой точке (k);

5. Уточнить значения весов для нейронов выходного слоя, например, с учетом коэффициента и скрытого слоя

6. Повторить цикл со второго пункта.