Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по ООА с флэшки С. Ю. Иванова.pdf
Скачиваний:
36
Добавлен:
20.05.2014
Размер:
607.79 Кб
Скачать

Иванов Сергей Юрьевич Для допуска к экзамену: 4 лабы + контрольная (10 неделя)

04/09/2009 ООА объектно-ориентированный анализ.

Цель: выделить объект из окружающей среды, а затем классифицировать его. Является основой таких наук как наук:

-астрономия

-медицина

-биология

-и т.д.

Одним из основоположников ООА можно назвать Карла Линнея. Он один из первых сформулировал правила классификации для биологических объектов.

Объект В общем значении:

то, на что направлена та или иная деятельность; в более широком значении — любой предмет вообще. В философии:

нечто, существующее в реальной действительности (то есть независимо от сознания): предмет, явление или процесс, на которые направлена предметно-практическая и познавательная деятельность субъекта (наблюдателя).

В программировании:

некоторая сущность в виртуальном пространстве, обладающая определённым состоянием и поведением, имеет заданные значения свойств (атрибутов) и операций над ними (методов).

Процесс В общем:

выполнение пассивных инструкций компьютерной программы на процессоре ЭВМ

В информатике:

— последовательная смена состояний объекта во времени.

Одним из современных основателей ООА является основоположник теории систем Берталанфи («Кибернетика» Н. Винера в 1946 году и «Общая теория систем» Л. Берталанфи в 1968 году), в России – Месарович (отличная книга по теории систем). Это библиографическая редкость. Неплохо её использовать при

написании диссертации.

Существует теория моделирования, где достаточно четко дается определение понятию процесс. Основным является понятие система, ей может быть все что угодно. Однако, в системе можно выделить

элементы, которые взаимосвязаны. Изменение состояний системы называется событием. Считается, что

событие происходит мгновенно. Ряд логически связанных событий представляет собой процесс. Процесс можно представить в виде некоторых явления. Это отображение процесса или его часть.

Рассмотрим математическое представление объекта (МПО). Упрощенное МПО это переменная или константа. Массивом будет представляться более сложный объект, либо класс объектов. Предполагается, что

объект обладает некоторым признаком или группой признаков, которые мы определяем как свойства объекта - properties. Понятие объекта является основным в современным системах программирования, и все сводится к

описания методов и свойств.

Пусть задано множество объектов N. Любое свойство, которым может обладать xЭN позволяет выделить подмножество таких элементов, которые обладают этим свойством. Обозначим его M*.

Часто задача распознавания и классификации является сложной, поскольку рассматривается целый набор признаков, а в задаче требуется определить является ли предъявленный объект искомым или нет. Кроме того

рассматриваются не только признаки, но и устанавливается взаимосвязь или отношение между двумя элементами, которые принадлежат заданному множеству xRy, где x,yЭN (R=relation).

Отношения (R) бывают следующих видов:

рефлексивное, если оно выполняется между объектом или самим собой, т.е. xRx = xRy («быть похожим на…», «быть одинаковым с…»).

Отношение симметрично если xRy = yRx (csor в защите информации).

Отношение транзитивно если xRy & yRz => xRz.

При выполнении рефлексивности, симметричности и транзитивности отношение называется эквивалентным. В случае распознавания два эквивалентных объекта считаются неразличимыми. Если два

объекта неразличимы, а различить их необходимо, то нужно добавить некоторые признаки или изменить отношение между признаками.

Если отношение рефлексивности и симметричности выполняется, а отношение транзитивности нет, то такое сложное отношение называется отношением толерантности.

Распознавание образов и выделение объектов из окружающей среды, а также определение явлений и процессов, является основополагающей задачей при эволюции.

По данному предмету 4 лабораторных работы.

1.Лучше выполнить на 2-ой неделе. Она несложная. Более точная информация ожидается на сайте. Дано: S – строковая переменная, в которую загружается часть текста. Необходимо проанализировать весь

текст и определить есть ли заданное выражение в тексте или нет. Текст можно использовать любой. Искомое выражение моет быть в двух вариантах: «Казнить нельзя, помиловать», «Казнить, нельзя помиловать». Программа должна найти выражение в тексте и сказать, что делать с человеком.

Рекомендуется использоваться Basic и функции meet (выделяет несколько символов строки). 2.Существует звуковой файл в стандартном формате (лучше чтобы это было музыкальное произведение).

Берется фрагмент и решается задача - существует ли данные фрагмент в данном музыкальном произведении. 3.Найти лицо на фотографии формата (*.JPEG).

4.Распознать объект в файле, который представляет собой анимацию (*.AVI).

Для решения задачи распознавания обычно задают набор классов или алфавит образов. Объекты для

которых выполняется отношение эквивалентности или, по крайней мере, толерантности представляют собой

образ.

Представим множество M как некоторую совокупность из алфавита образов, т.е. M={A1,A2,…,An}

Если n=1, то распознавать нечего.

Если n=2, то это задача динамики и решается простыми автоматами (военными и в компьютерных играх).

Каждый класс в алфавите может быть представлен некоторым количеством элементов – реализациями. Множество M может быть представлено некоторой последовательностью реализаций.

M={b1,b2,…,bt}

Обычно t значительно больше n, т.е. множество объектов можно рассматривать как множество реализаций, либо как множество классов. Свойства реализации будем называть признаками. Будем считать, что

у элементов класса одинаковые признаки по которым производилась классификация, и их одинаковое число.

Пусть, для элемента класса мы определим N признаков. Тогда элемент принадлежащий алфавиту класса A сопоставим следующее определение:

xЭA, x={x1,x2,…,xN}

Предположим, что признаки являются числовыми. В этом случае они могут быть либо дискретными, либо представлены некоторыми непрерывными значениями. В реальности объекты являются дискретными, определяется некоторой дискретной величиной, которая ограничивается точностью измеряемой аппаратуры. В случае дискретной величины признак представляется только одним значением, в случае непрерывной – диапазоном значений.

Предположим, что каждый признак имеет определенное числовое значение из совокупности. Каждая реализация может задаваться множеством признаков. Предположим мы рассматриваем два признака x1 и x2. Интервал значений для каждого признака откладываем на оси значений.

Рисунок двух классов

На данном рисунке представлены два класса – A и B.

Если распознаваемый объект имеет такие признаки (x1 и x2), что попадает в область класса A или B, то тогда его можно отнести к классу A или И соответственно. В ином случае, для существующих классов, которые определены, реализация объекта не определена.

Если за счет добавления признака класс можно расширить, ввести новые соглашения, то объект можно будет отнести к тому или иному классу. При увеличении количества признаков, задача формирования класса становится более сложной, а пространство становится уже не двумерным, а N-мерным по количеству признаков. Сама область превращается из плоскости в гиперкуб.

Если мы рассмотрим упрощенное представление классов объектов в двумерном пространстве, возникают варианты:

Рисунок пересекающихся классов

При решении подобных задач используется статистический анализ (пример: биржевые операции).

Рисунок рассредоточенных классов

В задачах, где возможно графическое представление, наиболее ванной задачей является определение четкой границы, либо такой границы, при определении которой ущерб или ошибка будут минимальными (Борисов Н.И., «Штрафные функции»).

11/09/2009

Алгоритм лабораторной работы №1 1.Создать два текстовых файла. Текст 20-30 слов.

2.Взять фразу «Казнить(,) нельзя(,) помиловать» в двух вариантах и внести в два текстовых файла. 3.Три сообщения о результате: «Казнить», «Помиловать», «Не определено».

4.Взять первое слово из эталона и проверить его наличие в тексте. Операцию повторить вплоть до последнего слов.

5.Если все слова найдены – определить в каком месте стоит запятая. Запятую можно рассматривать как символ прибавленный к определенному слову.

6.Вывести сообщение о соответствующем решение. 7.Сделать чтобы порядок слов учитывался.

7.1.Пронумеровать слова, учитывая порядок цифр вывести сообщение.

7.2.Просмотр текста осуществляется не сначала, а с той позиции, где произошла остановка. В этом случае автоматически можно анализировать порядок слов в тексте. Например, найдено первое слово – поиск продолжается с известной позиции. Если найдено второе – поиск продолжается с новой позиции. Если третье слово не найдено, то выводится сообщение, что фраза не найдена, либо не соблюдается порядок слов. Это является аналогом закладки.

Лабораторная работа №3

1.Взять фотографию в формате *.jpg

2.Сформировать собственную фотографию, вырезав фрагмент из общей. В этом случае анализ изображения проще.

3.При неполном соответствии задачу решить довольно сложно, поэтому следует находить не два совпадающих объекта, а два объекта, у которых совпадение наиболее максимально.

Рассмотрим два наиболее часто используемых формата – JPEG и BMP. Принципиальное различие между этими форматами состоит в том, что в BMP изображение представляется массивом точек. Каждой точке соответствует параметр цвета, яркости и т.д.

Цвет задается по системе RGB тремя числами (интенсивность красного, зеленого и синего). Любой цвет можно представить комбинацией трех цветов.

Если значения отличаются ненамного – цвет совпадает или близок. Это делается для каждой точки. В результате, существует достаточно много параметров информации об изображении. Если изображение 1000*1000 пикселей и на каждый пиксель двоичное слово характеристик, то требуется 4мб.

JPEG отличается тем, что точки с одинаковыми параметрами объединяются в прямоугольники. Предположим, в среднем, на изображение на прямокгольник приходится 32 точки. Для описания прямоугольника достаточно двух точек, расположенных по диагонали. Следовательно, изображение в формате jpeg для приведенных здесь средних значений в 32/2=16 раз меньше, чем bmp.

Увеличение точек при воспроизведении позволяет получать более качественные изображения с помощью формата jpeg. Исторически он появился для отображения фотошаблонов больших интегральных микросхем.

Формируется прямоугольник или матрица с определенными значениями и эта матрица прогоняется по целому изображению.

Задача.

1. Дано изображение цифры на матрице 100х100.

2.Существуют эталоны цифр (10). Размеры матрицы, куда вписывается число, могут быть min=4x4, max=100x100.

3.Определить какое число в поле изображения.

Упрощенный вариант – российская почта (индексы на конверте). Размер жестко фиксирован. Пусть это будет матрица 5x7. Таких матриц в изображении может быть не более шести. Поле, в котором пишутся цифры – 36х8.

Для простоты решения предположим, что существует два цвета – белый и небелый. Считываются ненулевые элементы (белый цвет – 0, небелый – 1) и сравниваются с шаблоном. Считанная матрица сравнивается с шаблоном.

При написании цифры рукой полного совпадения не будет. В таком случае выбирается самый похожий шаблон. Необходимо сформировать критерий похожести. Простой подход:

1.Количество ненулевых элементов близко к их количеству в эталоне.

2.Наиболее близкая форма. Т.е. максимальное совпадение по ненулевым элементам матрицы. Например, цифра один. Предполагается, что третий или четвертый столбец матрицы заполнен

единичными элементам.

Кроме того, предполагается, что может существовать диагональная полоса от верхнего конца единицы. Следовательно, необходимо выстроить еще несколько ненулевых элементов. При их нахождении в предполагаемых позициях матрицы, с погрешностью в одну позицию, то считаем, что нашли изображение единицы. Аналогично вырабатываются правила для других талонов цифр.

В случае текста необходимо иметь образцы шрифта, которые можно использовать при распознавании текста. По этому принципу работает ABBYY FineReader. Не всегда в нем происходит полное распознавание текста. Очень хорошо распознается текст, в котором используются стандартные компьютерные шрифты.

При сканировании книг возможно ошибочное распознавание символов. В этом случае пользователю дается возможность вручную проверить текст и поставить необходимый символ. Если текст имеет большое значение, то необходимо его ручная корректировка. Из-за этого тормозится всемирная программа перевода текста с бумажных носителей в цифровой вид.

Существует два режим отображения текста на компьютере. Кодированный, где каждому символу соответствует определенный код. В таком режиме работает большинство редакторов и текстовых процессоров. Текстовый процессор работает с кодом символа, а отображает символ в том шрифте, который был задан для выбора.

К сожалению, такой режим неудобен для изображений свободного вида, однако просто для манипуляций с текстом. Занимается мало памяти, надежность хранения текста высокая. Присутствующая картинка отображается либо в формате bmp, либо jpg. Эта технология называется OLE.

Второй способ отображений – растровый. Широко используется если текст сканируется или фотографируется. В таком случае не происходит распознавание текста стандартными средствами. Такой текст воспринимается как картинка. Для работы с таким текстом необходимо провести его распознавание.

В современных текстовых процессорах существуют средства для рисования. Они используют не растровый режим, а векторный. Например, программа Paint использует растровый режим, а опция распознавания в Word использует векторный режим. В векторном режиме отображается фигура в соответствии с правилами геометрии. Например, при рисовании линий (длина=50 точек) в программе Paint, задается и запоминается 50 точек, а в программе рисования Word задается только две точки и опция, показывающая, что это линия.

Группирование – операция, объединяющая выделенные объекты в один.

25/09/2009 Постановка задачи распознования.

Дано:

N – множество обьектов;

C – множество классов объектов; Xij - множество признаков объекта; rj – множество правил.

Нужно по предъявлению объекта ni определить к какому классу cj принадлежит объект.

Очень часто используют упрощенную задачу, в которой отсутствует описание отношений между признаками объекта, т.е. проверяется только наличие признаков. Часто полную задачу распознавания можно свести к упрощенной, в случае если описание отношений между признаками неважно, либо отсутствует, либо отношение между признаками представляют в виде обычного признака. Например: отношение xi↔xi+1 является новым признаком xn+1 (часто в математике при решении уравнений заменяются переменные). На самом деле новый признак означает, что введено новое пространство.

Упрощенная задача выглядит так: если признаки изменяемые (детерминированные), то задача распознавания сводится к определению точки в гиперкубе признаков n-ой размерности. После определения точки в гиперкубе определяется область для классов. Если точка попадает в область определения класса, то данный объект принадлежит этому классу. Если области класса пересекаются и определить к какому классу принадлежит объект невозможно, то производят определенные операции для разграничения областей классов:

1.Повышение точности измерений

2.Введение нового признака

Пример задачи распознавания:

Детективное агентство имеет множество описаний объектов одного класса («человек»). Множество описаний характеризует множество реализаций из заданного класса. Задача модифицируется и нужно определить по полученным признакам определенную реализацию, если данной реализации нет, то добавить в множество реализаций. Как правило, в заданном классе выделяют подклассы, что помогает резко ограничить область поиска, так как многие преступники придерживаются одной и той же специализации, то есть находятся в области определения подкласса. Основными признаками считаются биологические, которые трудно изменить(овал лица, форма черепа, отпечатки пальцев, сетчатка глаза, группа крови, ДНК). Для того, чтобы решить задачу поиска объекта при наличии нескольких признаков объекта составляют целевую функцию, которая представляет собой:

F=∑ki*xi , где ki – важность i-ого признака.

Если признака нет, то xi = 0, если есть, то xi = 1.

В данной формуле учитываются только совпадающие признаки (0;1). Если такие признаки есть и значимость их велика, то задача распознавания реализации является достаточно простой. Если существуют несколько малозначительных признаков, то стоимость их увеличивается при суммировании и может служить основанием для распознавания объекта.

02/10/2009 Признаки объектов:

1)Детерминированные – признаки, которые принимают конкретные числовые значения, как правило, в определенных единицах измерения, причем некоторые признаки могут иметь одинаковые единицы измерения. Могут быть непрерывными и дискретными. Непрерывные подразумевают, что в выделенном интервале значений находится счетное множество значений, которое определяется точностью измерений. С точки зрения математики для непрерывных значений на выделенном интервале существует бесконечное множество значений. Но точность позволяет приводить непрерывную систему к дискретной.

2)Вероятностные – в этом случае значение признака является случайным и, как правило, подчиняются некоторому закону распределения на выделенном интервале значений. При работе со случайными признаками часто используют различные гипотезы, которые позволяют оценивать наличие или отсутствие данного признака. Более того, можно использовать те значения признака, где вероятность его существования

достаточно высока (обычно 95%). Часто в случае случайных признаков используют интервальные оценки. Для описания случайных признаков используют статистические методы, которые требуют многократных испытаний. Прикладные задачи, где часто используются вероятностные признаки обычно относятся к биржевым операциям

иразличным прогнозам, в том числе и прогнозам погоды.

3)Логические – как правило, их получают из детерминированных, вероятностных и некоторых качественных признаков. Приобретают значения 0 или 1. Логическими признаками являются те, которые получаются в результате некоторых операций с другими признаками, которые можно рассматривать как некоторые высказывания или продукции. В качестве логического признака можно рассматривать всю совокупность приведенных выше признаков или отдельный признак. Логические признаки очень удобны для генерации математических высказываний или секвенций, которые позволяют реализовывать некоторую цепочку рассуждений и делать логический вывод. Логические признаки удобно использовать, если существует достаточно много качественных признаков и необходимо определить соотношение между ними.

4)Структурные (лингвистические) – эти признаки представляют собой некоторые элементы (символы) или целые конструкции, которые описывают структуру объекта. Каждый элемент может рассматриваться как цепочка терминалов или как предложение. Считают, что предложение описывает объект, если предложение, которое описывает неизвестный объект относится к языку определенного класса, то этот объект принимается принадлежащим этому классу. Структурные признаки используются для анализа и описания объекта, часто они используются совместно с различными отношениями, существуют специальные грамматики, которые позволяют работать со структурными объектами. Для структурных признаков очень важны соотношения между элементами. При чем, допустимы достаточно сложные отношения, которые включают в себя измерении (оптика – заказ очков). Часто используют специальную грамматику для описания структурных элементов, объектов использующих данную грамматику и отношения этих объектов (часто используют грамматику Эванса).

Задача распознавания №2. Заключается в проведении начальной классификации распознавания объектов и составлении априорного объекта классов. Основное в задачи – выбор принципа классификации. Этот принцип определяется требованиями предъявляемыми к системе распознавания. Часто система распознавания (диагностика) связана с системой управления, которая использует результаты распознавания. При уточнении задачи распознавания априорный алфавит классов уточняется, в результате формируется рабочий алфавит классов в системе распознавания.

Пример: классификация рыб в Охотском море. Имеется априорная информация, которая определяет основные классы рыб (множество признаков достаточных для определения того или иного морского объекта). Как правило, если признаков много и их можно упорядочить создают словарь признаков:

Размер объекта от 40 до 100 см в длину, предмет продолговатой формы, есть 2 глаза и зубы и т.д. Основная задача управления – реализовать операцию забора и выброса; можно составить достаточно

большой словарь признаков, для анализа которого требуется много времени. Но известные признаки можно свести в одно множество и сформировать класс. Ещё лучше иметь эталон, который объединяет основные признаки для заданного класса. Эталон может быть материальным и виртуальным. Одной из основных способностей объекта «человек» является то, что он умеет создавать виртуальные эталоны и модели, с помощью которых он может достаточно точно решать задачу распознавания. Модели отражают как правило, те свойства и отношения элементов в объекте, которые значимы в определенной задаче распознавания для реализации требуемых действий 9модель описывает меньше свойств, чем эталон). Например - из множества рыбы нужно отобрать только определенный объект - камчатский краб. Можно выбрать определенные признаки отличающие краба от рыб, что позволит быстро отсортировать крабов. Если в выбранном множестве возможно присутствие других ненужных объектов, то определяются ещё дополнительные признаки, которые позволяют выбрать только нужные объекты.

При формировании дополнительного словаря признаков необходимо произвести обучение системы распознавания: обучение с помощью учителя или самообучение (эксперименты). Эксперименты можно проводить либо с самим объектом (натурным) либо с макетами. Макет представляет собой объект в уменьшенном/увеличенном виде. Можно использовать математическую модель в случае, если существует математическое описание процессов, которые происходят с исследуемым объектом. Для динамических моделей наиболее часто используются системы дифференциальных уравнений. В большинстве случаев

дифференциальные уравнения можно свести к линейным алгебраическим получается задача большой размерности. Размерность настолько высока, что решение задач требует большого количества машинного времени. Это область суперкомпьютеров и параллельных вычислений. Если в системе или сложном объекте удается определить элементы с похожими свойствами, то возможно решение задачи для одного элемента, решение задачи для других получается значительно быстрее с использованием результатов для объекта рассмотренного выше.

Возможен другой подход. Макромоделирование – выделяют только те элементы, которые могут изменяться, а остальные уравнения решаются относительно этих элементов и создается макромодель.

Пример: x,y,z – неизвестные; z – целевой элемент. Решим систему уравнений относительно z. Предположив, что x и y известны. Тогда из трех необходимых уравнений получится одно, которое и будет макромоделью.

Имитационное моделирование – для исследования (диагностики) работы одного или нескольких объектов. Существует около 500 языков имитационного моделирования. Типичными задачами являются задачи логистики, функционирования и развития корпораций. Имитационная модель прогоняется несколько раз и описывает определенный временной интервал. Часто используется для решения задач массового обслуживания. Используя модели, человек способен достаточно быстро выполнить диагностике возникшей ситуации и принять обоснованное решение. Как правило, многие объекты способны решать такую же задачу, но на более низком уровне (кошка может начать охоту за мышью ещё не видя её).

09/10/2009 Распознавание визуальных образов.

Будем рассматривать отображение объекта в 3х-мерном пространстве. Множество световых сигналов попадает на сетчатку глаза, которая является плоскостью (2х-мерным пространством). Чтобы отобразить 3хмерное пространство, при отображении вводится искажение, используется правило перспективы. Правило перспективы учитывает геометрию Лобачевского. В военной области головки наведения оптические для ракет.

Задача: ракетный крейсер «Москва» оснащен ракетами «Базальт», которые имеют несколько систем наведения, в том числе и спутниковые, системы наведения работают на различных частях траектории ракет. В среднем считается, что на нашей широте линия горизонта от наблюдателя отстоит на 4км. В ракету заведен профиль корабля, необходимо попасть в нужный корабль. Сейчас распознавание используется для высокоточного оружия, метод распознавания – распознавание лазерной перспективой.

Геометрия Лобачевского ориентируется на отображение 3х-мерного пространства в 2х-мерном и позволяет рассчитывать искажения. Так как искажение предполагается изначально и предполагается прямая перспектива, то две параллельные прямые в геометрии Лобачевского сходятся в одной точке.

Задача (Лаб. Раб. №3): Распознать объект. Механистический подход предполагает полное совпадение изображений, изображения отображаются в одинаковом пространстве. Групповая фотография представляет собой некоторую матрицу, где каждый пиксель окрашен своим цветом и имеет определенную яркость, этого достаточно для отображения на плоскости и в объеме. Изображение будем считать плоской фотографией – это отображение пикселей на плоскости фотоаппарата, например одно число отображает цвет, другое – яркость и т.д. С помощью некоторой программы можно вырезать подматрицу (свое отображение) и с помощью перебора по большой матрице найти место, где размещена подматрица (предполагается полное совпадение). Если подматрица взята из другого источника, то полного совпадения не будет. Тогда необходимо создать новый эталон, т.е. необходимо выделить значимые точки объекта (расстояние между глаз, овал лица и т.д.). В простом варианте, когда объекты одинаково располагаются и мало отличаются, возможно, использование простого алгоритма. После создания двух эталонов пытаются решить задачу масштабирования, т.е. получить изображения одного и того же размера (что бы образцы вписывались в матрице одинаковых размеров). Затем происходит их сканирование и считается число совпадений, если число совпадений больше заданного, то считается, что объект найден. Иначе либо изменяются параметры изображения, либо изменяется число совпадений, либо возможна модификация формы изображения (например, частичный поворот, часто в томографии используют объемное изображение объекта, которое строится на использовании множества проекций). В случае если эти модификации не помогают, выносится решение, что объект не распознан. При изменении параметров нужно учитывать искажение.

В настоящее время очень актуальной является задача распознавания движущегося изображения. Определение движущегося изображение опирается на принцип зрения лягушки. Лягушка отслеживает на своей сетчатке те точки, которые изменили свои параметры, потом используется принцип локальности – для того, чтобы движущиеся точки объединить в один объект. Затем анализируется форма объекта некоторые его параметры и сравниваются с эталоном, затем принимается решение – что делать с объектом. Для лягушки: если объект большой, то – убегай, если объект похож на съедобный объект – лягушка пытается попасть языком в этот объект. У более развитых животных система распознавания, моделирования и масштабирования гораздо более сложная. Такие системы распознавания позволили существовать различным биологическим объектам. Лягушка использует простые модели, но здесь важен сам подход, который позволяет из общей картины выделить реальный движущейся объект. Если объект не движется, то лягушка выделить его из картины не может. Многие биологические объекты, в том числе и человек очень быстро реагируют на движение, так что не всегда нужно визуальное изображение. Реакция на движение является основой для различных видов единоборств. Очень часто пытаются прогнозировать то или иное движение и пытаются определить траекторию движения и конечную точку движения, если это удается сделать, то в единоборстве можно одержать победу.

Распознавание образов и управление объектами.

Задача: избавится от внешних устройств передачи данных (мышь, клавиатура).

Один из современных подходов состоит в том, что управление можно осуществлять с помощью вебкамер. Движение объекта рассматривается как движение мышью и осуществляется управление.

16/10/2009 Распознавание звука.

Если признаки объекта можно отобразить как некие упорядоченные множества значений, то очень удобно отображать эти значения в виде упорядоченного множества в некотором линейном пространстве. Для указания близости одного признака к другому в линейном пространстве используется понятие длины. Длина определяется как некая разность между двумя точками на шкале. Шкалы могут быть линейные и логарифмические. Как правило, для отображения различных колебаний в физике используют логарифмическую шкалу. Рассмотрим наиболее значимые колебания. Первая точка шкалы 1 колебание в секунду. 8Гц – частота воздействующая на организм, ряд органов входит в резонанс, с этой частоты начинается полоса инфронизких аудио-сигналов. Считается, что человек хорошо распознает колебания воздуха (звук) на частоте от 20Гц до 20КГц. В настоящее время для хранения аудиоинформации используется цифровой сигнал. Будем рассматривать отображение звука в цифровых форматах (wav, mp3). Аналоговый сигнал разбивается на несколько участков и каждый сигнал отображается в двоичном коде. Для того чтобы отобразить музыку или другие звуковые сигналы, не достаточно места на шкале частот. Ноты музыкального произведения можно сопоставить с некоторым нотным описанием. Если рассматривать ноты с точки зрения отображения на шкале частот, то определенной ноте соответствует определенная частота. Однако звук характеризуется еще громкостью, громкость соответствует амплитуде сигнала. Любой аудио объект отображается в координатах частота амплитуда и время. Существует классическое отображение звука в виде символов – ноты, где длительность определяется видом нот (¼ соответствует примерно 1 секунде). После выбора частоты и длительности звучания, необходимо определить громкость звучания данной ноты. Нотная запись с успехом используется человечеством. Музыканты профессионалы могут воспринимать музыку по нотам.

23/11/2009

Оказывается, пи отображении нот происходит отображение звуков в тактах. Такт – некий временной интервал. Ноты называются целыми, потому что звучит целый такт. Если рассматривать музыкальное произведение, то его можно представить в виде некоторого объемного объекта. Эти объемные объекты напоминают горные хребты. Если в один момент времени звучит одна нота, то звук довольно просто отображается. Если в момент времени звучит несколько нот, то на графике некоторые участки перекрываются, могут суммироваться, в этих близко расположенных участках произойдет суммирование амплитуды. Если изображение музыкального отрывка на свирели можно представить в виде одиночного объемного объекта, то отображение этого же отрывка оркестром представляется как набор близких объемных объектов.

Учеловека два уха, это позволяет по звуку определить примерное расстояния до объекта, поскольку каждое ухо слышит почти одинаково. Поэтому человек очень чувствителен к близким по частоте и амплитуде аудио-объектам. Некоторые исследователи учитывают волновую теорию звука и предполагают, что существует эффект интерференции между двумя рядом стоящими аудио-волнами. При определенной частоте и амплитуде возникают бинауральные волны, которые воздействую на подсознание человека (эффект аудио-наркотиков). Чтобы создать такие волны необходимо сгенерировать два звуковых сигнала, которые звучат одновременно с одной и той же амплитудой и для частоты в 1КГц считают, что наилучшая разница между двумя аудиосигналами 25Гц. Различные организмы по разному воспринимают аудио-сигналы, для лучшего восприятия необходимо ввести масштабирование, которое позволит настраивать индивидуально на заданный организм.

Учеловека очень развит анализ графических изображений. Поэтому большинство программ анализирующих звук отображает аудио-сигнал в графическом виде. Современные средства отображают аудио сигнал в плоскости.

Рассмотрим российскую программу для обучения английскому произношению. Эта система предполагает, что пользователь произносит отображаемую на мониторе фразу и эта фраза отображается в виде некоторого спектра. Спектр сравнивается с эталоном и выдается рекомендация.

Современная оцифровка музыки характеризуется определенными параметрами: стерео или моно, скорость отображения двоичных значений в секунду. Отсюда можно рассчитать сколько места будет занимать запись в памяти. С точки зрения отображения музыки 128Кб/сек более чем достаточно. Современные звуковые форматы рассматривают некоторый частотный диапазон. Если рассмотреть тот диапазон, который слышит человек, то 24КГц даны зря, музыки на данной частоте не бывает, а при кодировке занимается много места. Появляются форматы на которых не рассматриваются диапазоны, где амплитуда колебаний близка к нулю.

После 20Кгц идет область ультразвука. Ультразвук могут слышать дельфины, летучие мыши и другие. Ультразвук является одним из частых средств в медицине, является безвредным средством исследования. Современные звуковые карты как правило ориентированы на звук в диапазоне 20Гц-20кГц, однако современные звуковые форматы как правило позволяют записывать звук от 8кГц до 44кГц, то есть по умолчанию срезают низкие частоты. Дальнейшее повышение частоты после ультразвука, как правило, не воспринимается человеком и относится к области радиочастот. С помощью радиочастот можно модулировать низкие частоты для передачи на большие расстояния. Более высокая частота у видеосигнала (гГц). Эта область начинается с инфракрасного излучения (пульты и т.д.). Многие биологические объекты распознают инфракрасные сигналы (многие насекомые). Человек распознает инфракрасное излучение на небольшом расстоянии (тепло). Инфракрасные сигналы излучаются с помощью специального лазерного электроприбора. Средства излучения инфракрасного сигнала и других когерентных сигналов (лазера) удалось значительно уменьшить и удешевить за счет трудов Ж.Алферова. Получать инфракрасный сигнал гораздо дешевле, чем ультрафиолетовый. Между этими двумя сигналами располагаются сигналы видимой области спектра, которые воспринимает человеческий глаз. В этом спектре человек получает большинство информации, а так же может передавать информацию, используя отражение сигналов видимого спектра от предметов, либо генерируя сигналы с помощью специальных устройств (видеокамера + монитор). Для передачи сигнала любого цвета используется комбинация RGB. В робототехнике гибкие производственные системы используют инфракрасные датчики и для более точных систем ультрафиолетовые, их использование позволяет более точно позиционировать объекты. В условиях производства (металлообработки или сварки) возникает много тепловых помех, поэтому более надежными считаются ультрафиолетовые датчики, так как в этой области спектра меньше помех. Одним из часто используемых приемов при распознавании объекта является смещение области сигнала, если в текущей области сигнала, где происходит распознавание, возникает много помех (передача данных по витой паре – хорошо работает в условиях с малым количеством электромагнитных сигналов). Для исключения электромагнитного воздействия используют передачу сигналов по оптоволокну, т.е. область передачи сигнала не совпадает с областью, где существуют помехи. Средства, которые позволяют записывать информацию оптически (CD/DVD) не чувствительны к электромагнитному воздействию. Информация на оптических носителях записывается в соответствие с принципом, в котором отверстие в защитной пленке означает 1, а отсутствие

отверстия - 0. Количество хранимой информации на оптических носителях зависит от плотности, с которой возможно наносить отверстия. Эта плотность определяется возможностью надежного считывания светового сигнала, который зависит от дифракции (волны огибают границу отверстия и они кажется больше), чем больше длина волны, тем на большее расстояние волна огибает отверстие, соответственно излучению для красного сигнала это расстояние больше, а для фиолетового меньше. Поэтому плотность записи с помощью фиолетового лазера может быть выше (точки могут быть расположены ближе). Наиболее часто используется красный лазер (DVD, 4.7Гб), а оптический носитель «Blueray» более 20Гб. При дальнейшем повышении частоты появляется возможность передачи сигнала сквозь различные материальные объекты (рентген). Если в узи рассматривается отраженный сигнал, то при рентгене рассматривается проходящий сигнал. Существует ещё более жесткое излучение с меньшей длинной волны – гамма-излучение. Оно находится на границе, которая определяет использование различных методов. Для гамма-излучения обычно используют методы квантовой физики. В современной технике гамма-излучение используется при таможенной проверке больших контейнеров. При движении объектов существует достаточно простой алгоритм, который определяет контуры движущегося объекта (зрение лягушки). Суть алгоритма в том, что изображение содержащие объект, отображается в матрице. В черно-белом изображении в матрице либо 0, либо 1. При движении объекта значение соседних точек может изменится, те точки в которых значения изменились позволяют описывать конфигурацию объекта, даже если не известно каким цветом отображается объект.

Например, дана матрица 20x20, матрица является тем полем, на которое помещен объект, для чернобелого отображения возможно два варианта (черная – 1, белая – 0). На данном поле мы можем распознать только тот объект, цвет которого отличается от матрицы. Предположим это будет цифра 5, которая будет занимать размером некоторый прямоугольник. Нужно распознать размещенные на матрице цифры и написать её обозначение.

Усложнение задачи. Кроме цифры могут быть другие объекты, например случайные черные точки. Чтобы отличить цифру, надо обучить систему, для простого случая нужно иметь базу эталонов цифр. Для такой простой задачи нет необходимости использовать несколько отображений, где анализируется движение объекта. Усложним задачу – на матрице могут располагаться различные цвета, при чем цвет объекта не известен, в реальности он может быть неоднородным. Для выделения объекта из окружающей среды анализируем в начале одну матрицу и сравниваем её со второй матрицей (полученной при движении объекта). Определяем точки на второй матрице, значение которых изменилось. Эти точки должны определить размер и форму объекта, который двигался по фоновому изображению, описанному первой матрицей. Если известна скорость движения, то можно очень точно описать непосредственно сам объект. При незначительном движении объекта небольшое количество точек по границе объекта будет изменятся, объект можно будет выделить из среды, но граница его будет размыта.

Если рассматривать проницаемость объектов при разных сигналах, то она различна для разных областей частот определенных сигналов. Возьмем область видимого света, есть соответствующие лазеры (от красного до фиолетового), проницаемость самая высокая для красного света. Если взять аудио-сигналы, то самая лучшая проницаемость при инфразвуке. Многое зависит от среды, где распространяется сигнал – радиоволны хорошо распространяются в воздухе, однако для коротких волн (особенно FM) необходима прямая видимость. Волны с большей длинной волны могут передаваться на большие расстояния.

Необходимо осуществить радиопередачу с объекта, который находится в водной среде (радиочастоты недоступны). Нужно применить низкие частоты (большие антенны).

06/11/2009 Для контрольной работы:

Разработать ПО для фирмы, которой требуется распознавать образы (милиция, брачное агентство, продажа автомобилей и т.д.). Выделить признаки и присвоить признакам приоритет.

Отображение объектов в некотором векторном виде. Перемещение объектов – пересчитать все координаты от начальной точки. Изменение начальной точки дает передвижение всего объекта. В итоге из элементов создан новый объект.

Правило кинематографа: изображение в мозге человека остается дольше, чем оно проецируется на его сетчатку.

Отображение объектов с помощью различных форматов в компьютере и отображение информации у человека.

Отображение информации в компьютере в первую очередь связано с аппаратной реализацией систем, которые принимают информацию (аудио/видео) и воспроизводят её. Рассмотрим типичные аппаратные средства для воспроизведения и записи звука: SoundBlaster 16 бит для отображения музыки (М.Гук «Энциклопедия аппаратных средств»). Для изображений – видеокарты, которые позволяют воспроизводить данные в определенном формате (bmp, jpeg, tiff, avi, mpeg, и т.д.).

Для воспроизведения звука и видео существуют программные средства. Как правило это ПО формирует поток данных, которые передаются на указанные выше аппаратные средства, а они воспроизводят этот поток данных. HAL – аппаратно-программный уровень. Принципиально звуковые и видео форматы не отличаются, т.е. для компьютера звук или изображение ассоциируется с описанием некоторой функции, которая зависит от амплитуды частоты и длительности. Аудио и видео отличаются тем, что частота у видео выше. Проницаемость сигнала зависит от частоты для передачи на определенное расстояние. Широкое распространение получило использование УЗИ. Основная цель УЗИ на основании отраженного звука получить достаточно хорошее отображение внутренних органов для диагностики.

МИЭМ 2001 год совместная разработка с НИИ Кинестетеки и клиникой Моники по лазерной диагностики. Выдается 16 сигналов разного цвета, по отраженным сигналам делается вывод о наличии той или иной патологии. Так как лазерный луч имеет небольшую проникающую способность диагностируются небольшие поверхностные повреждения (меланома).

13/11/2009

Распознавание объектов в евклидовом пространстве.

Если удается выделить некоторый признак объекта такой, что он может иметь различные значения, которые можно представить в виде некоторого линейного отображения. В этом случае признаку можно сопоставить некоторую линейную шкалу. Величина признака обычно изменяется на определенном интервале. Величина может быть непрерывной (бесконечное множество значений) и дискретной. Пусть есть r признаков, тогда будем рассматривать R-мерное пространство в котором может быть описан объект, объект может представлять собой точку в пространстве. Класс объектов может быть представлен гиперкубом. Близость объектов в таком пространстве можно определить по отдаленности одной точки от другой. Если удалось организовать пространство признаков и определить длину, то эту длину можно вычислить через значения признаков. Длина на плоскости в двумерном пространстве определяется по теореме Пифагора. Формула для определения длины в трехмерном пространстве:

-в R-мерном пространстве:

Часто не удается создать сильную линейную шкалу, некоторые признаки описывают с помощью логарифмической шкалы, некоторые признаки являются качественными или логическими. В этом случае, для определения близости объектов (например образец и объект) стараются чтобы длина была минимальна. Другие пространства, которые не являются линейными рассматривают отдельно. Как правило, учитывают присутствие данного объекта в определенном интервале. Интересно, что один и тот же признак можно отобразить в виде

сильной линейной шкалы или более слабой логарифмической или шкалы, где признак отображается по возрастанию дискретной величины.

Возьмем признак объекта – цвет. Цвет – это частота света отраженного от объекта. обычно цвет ранжируется по возрастанию частоты:

Диапазон длин волн для цвета (от красного до фиолетового)

Диапазон видимого цвета в герцах

Перевод в частоту из длин волн

Некоторые линейные шкалы трудно представить в рамках определенного пространства, часто это зависит от решаемой по этому признаку задачи. Например: шкала – время. Если рассматривать историю Земли, то на обозримом графике история человечества будет невидна (последнее 7000 лет – эпоха человеческой цивилизации).

Рассмотрим шкалу электромагнитных колебаний (логарифмический вид). Звук от 20Гц до 20кГц. Если представлять звук на линейной шкале, то звук отобразить не возможно.

Метод определения длины и размеров объекта как правило, используется в том случае, если можно обеспечить близкий доступ к объекту, который позволяет изменять его габариты без искажений.

Рассмотрим задачу определения размеров объекта с большого расстояния. Предположим, что пространство трехмерное, считается, что измерение габаритов объекта с фронтальной стороны происходит с искажением. Если элемент объекта стоит на некотором расстоянии от фронтальной плоскости, значение этого элемента меньше. Приходится учитывать свойство трехмерного пространства – перспективу (прямую, обратную). Однако, если изображение объекта получают с разных точек, то возможно учитывая полученные значения габаритов объекта в каждой точке определить истинные размеры объекта

(геометрия Лобачевского (гиперболическая геометрия) — одна из неевклидовых геометрий, геометрическая теория, основанная на тех же основных посылках, что и обычная евклидова геометрия, за исключением аксиомы о параллельных, которая заменяется на аксиому о параллельных Лобачевского.

Евклидова аксиома о параллельных гласит:

через точку, не лежащую на данной прямой, проходит только одна прямая, лежащая с данной прямой в одной плоскости и не пересекающая её.

В геометрии Лобачевского, вместо неё принимается следующая аксиома: через точку, не лежащую на данной прямой, проходят по крайней мере две

прямые, лежащие с данной прямой в одной плоскости и не пересекающие её).

Пример: МПО Машиностроения разрабатывает корабельные ракеты. Если ракета летит не под прямым углом, возникает сложность распознавания.

Классификация систем распознавания:

Простые системы распознавания: системы распознавания, которые анализируют наличие одного или нескольких признаков. Часто работают в автоматическом режиме. В таких системах не рассматривают

отношения между признаками, а используют операции логики.

Сложные системы распознавания: системы диагностики технических устройств и медицинской диагностики. В этих системах выделяют априорную и апостериорную информацию. Классификация сложных систем ведется в соответствии с принципом использования априорной информации:

Одноуровневая сложная система: информация о признаках объекта это множество [x1…xn], которые определяются прямыми измерениями непосредственно на основе обработки результатов экспериментов.

АИ – априорная информация, БАР – блок алгоритмов распознавания, БУРС – блок управления работой средства. Предполагается, что существует достаточно априорной информации, чтобы отнести объект к одному или другому классу.

Существуют многоуровневые системы распознавания, где происходит промежуточная обработка информации полученной по группе признаков. Как правило, используют три уровня, где выполняются различные группы признаков:

1.Признаки используемые в локальных участках нижнего уровня. На основании их определяются признаки второго уровня.

2.Значения, полученные путем преобразования признаков первого уровня. (пример Амперметр). 3.Получаются из признаков второго уровня. Используются непосредственно в распознавании объектов,

которые входят в рабочий словарь признаков объектов.

Всистемах распознавания можно выделить и больше уровней признаков. По характеру использования априорной информации системы распознавания делят на 3 типа:

1.Системы без обучения. 2.С обучением. 3.Самообучаемая система.

Всистеме без обучения предполагается, что вся необходимая информация, априорная уже существующим в системе, и ее достаточно для распознавания. В системе существуют правила распознавания, которые позволяю использовать априорную информацию. В соответствии с правилами распознавания решается задача распознавания объекта, т.е. если выполняется правило с определенными признаками из рабочего словаря признаков.

Система с обучением. Предполагается наличие учителя, который определяет правила классификации и предъявляет новые признаки в априорной информации.

Если предположить, что у системы есть свои правила и априорная информация, то учитель может их модифицировать.

Самообучающаяся система – существуют правила и априорная информация, но они позволяют распознавать достаточно узкий круг объектов. Предполагается, что они дополняются и модифицируются самой системой за счет получения новой информации, ее обработки, моделирования и прогнозирования. Добавление к системе новых правил и априорной информации осуществляется после экспериментов с объектами. Необходима обратная связь и подтверждение. В теории вероятности существует методика проверки гипотез.

Компьютер не может генерировать гипотезы.

Если признаки принадлежат одному пространству и удается сформировать для каждого пространства шкалу измерений, то можно безусловно определить принадлежит объект данному классу или нет. Если пространств R, то можно построить псевдо гиперкуб, если шкалы линейные, то можно построить гиперкуб. Если функция непрерывна и линейна, то получается гиперкуб без неопределенных областей. А если есть разрывы, то могут возникать неопределенные области со скачкообразным переходом. Если признаки являются детерминированными, а также, если удается построить гиперкуб, то для линейных функций можно свести задачу распознавания к задаче нахождения минимальной длины между объектом и эталоном, а также определить классов объектов, если есть возможность определить область в пространстве признаков.

Основное применение: техника, транспорт, военное производство.

Такой же подход можно использовать, если некоторые признаки являются логическими (решается задача наличия данного признака).

Особое место при распознавании занимают вероятностные признаки. В этом случае известно описание признаков классов, а также плотности их распределения (рис.). Если возможно непрерывное распределение значений признака, то оно отображается через плотность распределения. Если признак имеет дискретные значения, то его представляют в виде гистограмм.

Гистограмма строится по следующему принципу: на некоторой шкале выделяется диапазон и для каждого диапазона определяется примерная частота попаданий в данный диапазон. Если количество интервалов стремится к бесконечности и количество реализаций, то получаем непрерывную функцию плотности распределения. Статистика работает, в основном, с нормальными распределениями. Считается, что существует некоторое множество нормальных распределений и надо описать существующую ситуацию. Рассмотрим, когда

описано 2 класса объектов (рис.). В областях Q объект может принадлежать обоим классам, тогда нужно определить границу и разделить классы. При решении реальных задач стараются сделать область границы меньше.

Исследование операций.

Задача определения границы между классами объектов и определение принадлежности объекта в случае,

если признаки вероятностные (рассмотрим признаки, подчиненные нормальному распределению):

Критерий Байеса.

Применение критерия целесообразно в случае, когда система распознавания многократно осуществляет распознавание неизвестных объектов в условиях неизменяемого признакового пространства или стабильного описания. Используется платежная матрица, которая определяет ущерб при неправильном распознавании.

Минимум риска усредненного по множеству решений задачи распознавания неизвестных объектов обеспечивается только тогда, когда решение r принадлежит объекту класса Q1 или Q2 принимается в соответствии со следующими правилами:

1).Если измеряемое значение признака Y данного объекта расположено в области r1, то объект в Q1, если к r2, то в Q2.

На основании критерия существует процедура, которая проверяет наличие критерия. Один из основных критериев при решении экономических задач.

Минимаксный критерий. При построении системы распознавания возможны ситуации, когда априорная вероятность появления объектов соответствующих классов неизвестно. Минимизация значения среднего риска принятия решений на основе Байесовской стратегии невозможно. В этой ситуации рационально использовать критерий, который минимизирует максимально возможное значение максимального риска.

Этот критерий состоит в том, что решение о принадлежности объекта соответствующему классу принимается в соответствии с Байесовской стратегии и определяет средний риск, затем рассматривается несколько вариантов и выбирается тот, при котором средний риск минимален.

Неймона – Пирсона. При построении некоторых систем могут быть неизвестны не только априорные вероятности, но и платежная матрица в подобных системах для построения алгоритма классификации использования критерия НП.: исходя из того, как определяется допустимое значение условной вероятности ошибки 1-го рода, а за ним определяется такая граница между классами, придерживаясь которой удается добиться тип условной вероятности ошибки 2-го рода. Эта задача относится к подразделу ТВ, где оценивается правильность гипотез. Выдвигается гипотеза, а потом проверяется ее правильность.

Если сформирована гипотеза и она отвергается, а на самом деле не отвергается, то возникает ошибка 1- го рода. Получается 2-хуровневая процедура: в начале мин по ошибка 1-го рода, потом 2-го.

Процедура последовательности решений.

Предполагается, что решение о принадлежности объекта классу принималось после измерения всех совокупностей объекта. Возможен другой подход: определение объема может происходить после анализа каждого признака последовательно. Алгоритм распознавания реализуется на основе данных о признаках к текущему моменту. Данные с течением времени могут изменяться. Последовательный анализ (в статистике) часто используется в живой природе, когда решение ограничено по времени. Хотя такая задача часто решается человеком. В этом случае можно выбрать приоритетные признаки, которые позволят быстро выбрать объекты из заданного множества.

Пример: Задача сортировки грибов.

12/11/2009

Нейронные сети.

Формальное представление обрабатывающих информацию объектов и обменивающихся информацией, которая называется нейронная по аналогии с медициной и психологией. Поскольку нейронные сети являются формализованными в них широко используется специфический математический аппарат. Нейронные сети были разработаны по аналогии с сетью нейронов в биологических объектах. Биологический нейрон – это

микроскопический объект, который как правило имеет два состояния: возбужденное и заторможенное. С помощью связей он соединяется с другими нейронами, а информация по нервной системе БО передается с

помощью слабого электрического тока.

Хронология

1943 год — Норберт Винер вместе с соратниками публикует работу о кибернетике. Основной идеей является представление сложных биологических процессов математическими моделями.

1943 год — Маккалок и Питтс формализуют понятие нейронной сети в фундаментальной статье о

логическом исчислении идей и нервной активности.

1949 год — Хебб предлагает первый алгоритм обучения.

В 1958 году Розенблаттом изобретен перцептрон. Перцептрон обретает популярность — его

используют для распознавания образов, прогнозирования погоды и т. д. Казалось, что построение полноценного искусственного интеллекта уже не за горами.

В 1960 году Уидроу (Widrow) совместно со своим студентом Хоффом на основе дельта-правила (формулы Уидроу) разработали Адалин, который сразу начал использоваться для задач предсказания и адаптивного управления. Адалин был построен на базе созданных ими же (Уидроу — Хоффом) принципально новых элементах — мемисторах. Сейчас Адалин (адаптивный сумматор) является стандартным элементом многих систем обработки сигналов.

В 1961 году под руководством М. М. Бонгарда разработана программа «Кора»: «…задача Коры — поиск

разделяющего правила после того, как найдены операторы, дающие достаточно четкие (коротко кодируемые) характеристики объекта или его частей». Программа Кора нашла применение, в частности, для распознавания нефтеносных пластов.

В 1969 году Минский публикует формальное доказательство ограниченности перцептрона и показывает, что он неспособен решать некоторые задачи (Проблема "четности" и "один в блоке"), связанные с инвариантностью представлений. Интерес к нейронным сетям резко спадает.

1974 год — Пол Дж. Вербос и А. И. Галушкин одновременно изобретают алгоритм обратного

распространения ошибки для обучения многослойных перцептронов. Изобретение не привлекло особого внимания.

1975 год — Фукушима представляет Когнитрон — самоорганизующуюся сеть, предназначенную для инвариантного распознавания образов, но это достигается только при помощи запоминания практически всех состояний образа.

1982 год — после длительного упадка, интерес к нейросетям вновь возрастает. Хопфилд (en:John

Joseph Hopfield) показал, что нейронная сеть с обратными связями может представлять собой систему, минимизирующую энергию (так называемая сеть Хопфилда). Кохоненом представлены модели сети, обучающейся без учителя (Нейронная сеть Кохонена), решающей задачи кластеризации, визуализации данных (самоорганизующаяся карта Кохонена) и другие задачи предварительного анализа данных.

1986 год — Дэвидом И. Румельхартом, Дж. Е. Хинтоном и Рональдом Дж. Вильямсом и независимо и одновременно С. И. Барцевым и В. А. Охониным (Красноярская группа) переоткрыт и существенно развит метод обратного распространения ошибки. Начался взрыв интереса к обучаемым нейронным сетям.

Основной идеей использования нейронных сетей является возможность параллельной или псевдопараллельной обработки информации. Основными методами в науке является исторический и метод аналогий. При методе аналогий в соответствие биологическим объектам поставили элементы, которые было просто реализовать. Современные нейронные сети, как правило, представляют собой сеть процессоров, которые предназначены для решения определенных задач, в первую очередь задач распознавания образов за счет параллельных и псевдопараллельных вычислений.

Рассмотрим систему зрения человека. После того как изображение проходит через зрачок оно проецируется на сетчатку глаза, где находятся рецепторы, которые воспринимают сигнал. Рецепторы возбуждаются по-разному, возбуждаются соответствующие нейроны и изображение попадает в мозг, где она и обрабатывается. Изображение окончательно формируется в мозге. Задача состоит в том, чтобы обработать как можно быстрее сигналы, которые передаются с матрицы (аналогия сетчатки). Это очень сложный процесс, так как человек различает цвета. Многие животные не воспринимают цвета, а видят в определенном спектре, только высшие обезьяны и птицы различают всю гамму. Если возьмем метод аналогии, то для животных

матрица заполняется ограниченными значениями (от 0 до 8), а для человека от 0 до многих миллионов. Аналогично пытаются построить процесс технического зрения.

логическая схема перцептрона с тремя рецепторами. Перцептро́н, или персептрон (англ. perceptron от лат. Perceptio — восприятие; нем. perzeptron) — математическая и компьютерная модель восприятия информации мозгом (кибернетическая модель мозга), предложенная Фрэнком Розенблаттом в 1957 году и реализованная в виде электронной машины «Марк-1» в

1960 году. Перцептрон стал одной из первых моделей нейросетей, а «Марк-1» — первым в мире нейрокомпьютером. Несмотря на свою простоту, перцептрон способен обучаться и решать довольно сложные задачи.

Перцептрон состоит из трёх типов элементов, а именно: поступающие от сенсоров сигналы передаются ассоциативным элементам, а затем реагирующим элементам. Таким образом, перцептроны позволяют создать набор «ассоциаций» между входными стимулами и необходимой реакцией на выходе. В биологическом плане это соответствует преобразованию, например, зрительной информации в физиологический ответ от двигательных нейронов. Согласно современной терминологии, перцептроны могут быть классифицированы как искусственные нейронные сети:

1.с одним скрытым слоем;

2.с пороговой передаточной функцией;

3.с прямым распространением сигнала. Распределение времени ЦП:

-монопольное (MS DOS)

-по приоритетам (системы реального времени) -каждому процессу дается квант времени

Если система управления сложная и она подсоединена к многим датчикам, которые работают в реальном

времени и сама система должна работать в реальном времени, в этом случае часто используют нейронные сети, а систему делают многоуровневой.

Пример: сложная производственная система (обычно двухуровневая) для них существуют специальные ОС, которые определяются понятием SKDA. Трехуровневая система управления МКС.

Основная идея технической нейронной сети: обработать множество сигналов {N}, полученных с датчика и получить в результате значительно меньшее множество, которое некоторым образом отображает полученные сигналы. Наиболее простым элементом, который позволяет это сделать является сумматор, где входные сигналы суммируются и выдается один результирующий сигнал.