Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет аэрокосмического приборостроения

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

labs

.pdf

Скачиваний:

Добавлен:

02.04.2015

Размер:

1.67 Mб

Скачать

☆

1 / 41 2 3 4 > Следующая >>>

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное автономное образовательное учреждение высшего профессионального образования Санкт-Петербургский государственный университет аэрокосмического приборостроения

М. Р. Гильмутдинов, А. М. Тюрликов, Е. М. Линский

ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ

СТАТИСТИЧЕСКИЙ АНАЛИЗ И КВАНТОВАНИЕ ВИЗУАЛЬНЫХ ДАННЫХ

Лабораторный практикум

Санкт-Петербург 2013

Составители: М. Р. Гильмутдинов, А. М. Тюрликов, Е. М. Линский

Рецензенты:

Аннотация Методические указания подготовлены кафедрой комплексной

защиты информации и рекомендованы к изданию редакционноиздательским советом Санкт-Петербургского государственного университета аэрокосмического приборостроения.

Редактор ___________________

Подписано к печати __.__.____. Формат 60 84 1/16.

Бумага офсетная. Печать офсетная.

Усл. печ. л. 2,0. Тираж _____ экз. Заказ ____.

Редакционно-издательский центр ГУАП 190000, Санкт-Петербург, Б.Морская ул., 67

Лабораторная работа 1

Статистический анализ цифровых изображений

Цель работы: изучение способов представления изображений, ознакомление со структурой формата BMP, анализ статистических свойств изображений, а также получение практических навыков обработки изображений.

1.1. Методические указания

1.1.1. Основные определения

Изображение в цифровом виде представляется в виде прямоугольной матрицы, элементы которой называют пикселями (от английского pix-el picture element). Пиксель может быть представлен одним или несколькими числовыми значениями, каждое из которых принадлежит логической структуре, называемой компонентой. В качестве примера можно рассматривать красную ( red), зеленую (green) и синюю (blue)

компоненты. Будем называть значение пикселя в компоненте A интенсивностью и обозначать Iy;x(A), ãäå ïàðà (y; x) указывает положение пик-

селя в изображении (y номер строки, x номер столбца).

В нескольких приведенных ниже заданиях требуется построить гистограммы частот для выборок, формируемых на основе данных компонент. Гистограмму следует формировать в виде двумерного графика, где на оси абсцисс отложены все возможные значения в компоненте от 0 äî 2L 1, ãäå L определяет размер разрядной сетки. Над каждым

значением на оси абсцисс изображается прямоугольник высота которого пропорциональна частоте появления данного значения в компоненте. Ширины всех прямоугольников одинаковые.

bfType

1.1.2.Структура BMP файла

Âданной лабораторной работе рассматриваются изображения, хранимые в наиболее распространенном формате RGB24 без сжатия. Файл

âформате BMP имеет следующую структуру.

1.Заголовок.

2.Данные таблицы цветов (отсутствует для RGB24).

3.Данные по пикселям.

Заголовок состоит из двух последовательно расположенных частей. В файле Windows.h содержится описание двух структур, относящихся к этим частям (здесь и далее примеры структур будут приведены в на языке Си с ориентацией на MS Visual C).

typedef struct tagBITMAPFILEHEADER {

WORD	bfType;
DWORD	bfSize;
WORD	bfReserved1;
WORD	bfReserved2;
DWORD	bfOffBits;

} BITMAPFILEHEADER, *PBITMAPFILEHEADER;

Поля структуры:

описывает тип файла, всегда ASCII код двух символов 'B' и 'M' (заглавные латинские буквы)

bfSize размер файла в байтах

bfReserved1 зарезервировано, должно быть 0

bfReserved2 зарезервировано, должно быть 0

bfOffBits смещение в байтах от начала структуры BITMAPFILEHEADER до массива пикселей

typedef struct tagBITMAPINFOHEADER{

DWORD	biSize;
LONG	biWidth;
LONG	biHeight;
WORD	biPlanes;
WORD	biBitCount;
DWORD	biCompression;
DWORD	biSizeImage;
LONG	biXPelsPerMeter;

biYPelsPerMeter

biXPelsPerMeter

LONG	biYPelsPerMeter;
DWORD	biClrUsed;
DWORD	biClrImportant;

} BITMAPINFOHEADER, *PBITMAPINFOHEADER;

Поля структуры:

biSize размер структуры в байтах

biWidth ширина изображения в пикселях

biHeight ширина изображения в пикселях. Если эта величина

положительная, то строки изображения хранятся снизу вверх. Если высота отрицательна, то строки изображения идут сверху вниз

biPlanes количество плоскостей изображения, всегда должно быть 1

biBitCount количество бит на пиксель. Для RGB24 это поле равно 24, таким образом, каждый пиксель описывается 8-ми битной интенсивностью красного, зеленого и синего

biCompression тип сжатия, для RGB24 равно BI_RGB (0)

biSizeImage размер изображения в байтах. Необязательное по-

ле, может быть равно нулю

горизонтальное разрешение в пикселях на метр. Используется для указания физического размера изображения. Приложение, работающее с этим изображением, может использовать эту информацию при выводе на специфическое устройство отображения. Например, значение 2834 соответствует 72dpi точкам на дюйм (Dots per Inch), что являлось стандартным разрешением экранов мониторов Apple Macintosh. Поле носит информативный характер и не является обязательным. Значение этого поля, как правило, установлено в 0.

вертикальное разрешение в пикселях на метр. Назначение этого поля аналогично biXPelsPerMeter.

biClrUsed размер палитры. Равно 0 для RGB24.

biClrImportant число значимых элементов палитры. Равно 0

äëÿ RGB24. Вопросы работы с палитрой будут подробно рассмотрены в следующей лабораторной работе.

За структурами по смещению, указанному в bfOffBits, располагаются данные, относящиеся к пикселям изображения.

1.1.3. Особенности представления данных в формате Windows BMP

Здесь перечислено несколько важных особенностей представления данных в формате RGB24, характерных для операционной системы Windows.

Данные представляются в виде одномерного массива, в котором значения, относящиеся к отдельным пикселам, записаны строка за строкой.

Строки изображения могут идти как снизу вверх (наиболее ча- стый случай), так и сверху вниз.

Ширина строки в байтах должна быть выравнена по границе двойного слова (32 бита), т.е. должна быть кратна числу 4. При необходимости для выполнения этого условия в конце каждой строки добавляются дополнительные байты (от одного до трех), значения которых несущественны. В англоязычной литературе добавляемые байты называют dummy bytes.

Каждый пиксел в формате RGB24 представляется тремя байтами. Первый содержит значение компоненты B, второй - G и третий

- R.

1.1.4. Критерии эффективности обработки изображений

Ïîä обработкой будем понимать применение к изображению некоторой процедуры преобразования пикселей. Примерами преобразования изображения могут служить методы фильтрации, масштабирования или сжатия. Иногда, например, для сжатия, для восстановления исходного изображения требуется дополнительное обратное преобразование. Преобразования могут быть обратимыми èëè с потерями. Оче- видно, что при использовании обратимого преобразования, по данным, полученным в результате преобразования, можно в точности восстановить исходное изображение. Для оценки искажений, вносимых при обработке с потерями, часто используют понятие øóìà, который какбы вносит применение цепочки "преобразование-обратное преобразование". Для определения количественных характеристик шума обозначим

(A)	^(A)
çà Iy;x интенсивности пикселей исходного изображения, а за	Iy;x èí-

тенсивности пикселей восстановленного изображения. Тогда шумом на позиции (y; x) в компоненте A можно считать разность между исходным

и восстановленным пикселем:

(A)	(A)	^(A)	:
Ny;x	= Iy;x	Iy;x	:

Наиболее простыми с вычислительной точки зрения критериями оценки искажений при обработке изображений с потерями являются сумма абсолютных значений разностей между исходными и восстановленными после обработки пикселями ( Sum of Absolute Di erences

SAD) и сумма квадратов разностей между исходными и восстановленными пикселями (Sum of Squared Di erences SSD):

H		W		^(A)
Xi		X	(A)	^(A)
Xi		X	jIi;j	Ii;j		j;	(1.1)
SAD =			jIi;j	Ii;j		j;	(1.1)
=1 j=1
H		W
Xi	X		(A)	(A)		2
Xi	X			^
SSD =		(Ii;j		^	) :		(1.2)
SSD =		(Ii;j		Ii;j	) :		(1.2)

=1 j=1

Вместо слова разность (Di erence) иногда используют слово ошибка

(Error).

Данные критерии часто используются для поиска и сравнения отдельных фрагментов изображения. Для сравнения изображений разной размерности или фрагментов изображений используют усреднен-

ные значения SAD (Mean of Absolute Errors MAE) è SSD (Mean of Squared Errors MSE):

^(A)

(A)

jIi;j

Ii;j

MAE = w

(1.3)

=1 j=1

(A)

MSE =

(Ii;j

Ii;j

) ;

(1.4)

=1 j=1

ãäå w является шириной, а h высотой фрагмента или изображения.

Более распространенным критерием оценки искажений, вносимых в изображение, является пиковое отношение сигнал/шум (PSNR peak signal-to-noise ratio ). Эта мера аналогична используемому при обработ-

ке звука отношению сигнал/шум , (SNR signal-to-noise ratio ):

H W

(A)

i=1 j=1

(Ii;j

)

SNR = 10

= 10 lg

;

(1.5)

P P

(A) 2

(A)

)

=1 j=1 (Ii;j Ii;j

iP P

ãäå ES определяет энергию исходного сигнала, EN энергию шума.

Энергия дискретного по времени сигнала определяется как суммой квадратов его значений.

Как и для аудио данных, для изображений шум интерпретируется, как несоответствие исходного и обработанного (восстановленного) сигнала, а энергия шума как сумма квадратов разностей отсчетов ис-

ходного и обработанного сигналов, аналогично (1.2). Отличие P SNR îò SNR заключается в том, что все значения исходного сигнала в числите-

ле дроби заменяются на максимальное значение интенсивности пикселя в данной компоненте. Однако для упрощения вычислений максимальное значение сигнала, как правило, заменяют на максимально возможное значение, которое может принимать интенсивность пикселя. Таким

образом, в используемой разрядной сетке L бит значение P SNR вычисляется по следующей формуле:

P SNR = 10	lg	W H (2L 1)2			(1.6)
		H W (A)	(A)	2
		P jP	^
		P jP	Ii;j
		i=1 =1 (Ii;j	Ii;j	)

Эффективность сжатия для изображений обычно оценивается как среднее число бит, затрачиваемых на представление одного пикселя (Bits Per Pixel - BPP) изображения или одной из его компонент (когда учитываются интенсивности всех пикселей только в данной компоненте). Наиболее простым способом анализа эффективности сжатия является оценка энтропии при поэлементном независимом сжатии. В этом случае значения интенсивностей обрабатываемой компоненты ин-

терпретируются как сообщения некоторого постоянного источника X (стационарного источника, сообщения на выходе которого независимы). Алфавит источника X формируется по всем возможным значениям

пикселей оцениваемой компоненты. Величина p^(x) является оценкой вероятности сообщения x, которая вычисляется как

p^(x) = nnx ;

ãäå nx количество пикселей в данной компоненте, которые имеют значение x, à n общее число пикселей в компоненте. Тогда оценка

энтропии при поэлементном независимом сжатии вычисляется по следующей формуле:

X
^	(1.7)
H(X) = p^(x) log2 p^(x):	(1.7)

1.1.5.Преобразование цветового пространства

Âцветных фотореалистичных изображениях, представленных в формате RGB24, данные цветовых компонент часто близки по значе- нию на соответствующих позициях (в этом случае говорят, что компоненты сильно коррелируют). Поэтому с точки зрения сжатия формат RGB24 является заведомо избыточным. В стандартах телевизионного ве-

щания, а также в популярном стандарте сжатия JPEG, используется другой формат представления изображений Y CbCr. В соответствии

с форматом Y CbCr изображение также представляется с помощью трех компонент, но эти три компоненты имеют меньше коррелируют друг с другом. Используя следующие формулы, компоненты R, G è B преобра-

зуются в яркостную (Y ) è äâå цветоразностные (Cb è Cr) компоненты:

Y= 0:299 R + 0:587 G + 0:114 B

Cb	=	0:5643 (B Y ) + 128	(1.8)
Cr	=	0:7132 (R Y ) + 128

Обратное преобразование выполняется по формулам:

G	=	Y 0:714	(Cr 128) 0:334 (Cb 128)
R	=	Y + 1:402	(Cr 128)	(1.9)

B= Y + 1:772 (Cb 128)

Стоит отметить, что реализация прямого и обратного преобразования выполняются с использованием арифметического округления, т.е. преобразование форматов в общем случае является необратимым. Более того, в результате обратного преобразования возможен выход вос-

становленных значений R, G, è B за границы исходного диапазона.

В этом случае после восстановления необходимо выполнить операцию

клиппирования (clipping) èëè насыщения (saturation ):

				8xmin	åñëè	x < xmin
Sat(x; x ; x		max	) =	8xmin	,, åñëè	x < xmin		(1.10)
min		max		>xmax		x > xmax
				>
				<	, во всех иных случаях
				>x
	визуальной информации для формата
Большая часть				>			Y CbCr сосре-
				:			Y CbCr сосре-

доточена в яркостной компоненте Y . На практике очень часто к компо- нентам Cb è Cr применяется процедура децимации èëè прореживания,

изображенная на рис. 1.1, в процессе которой часть отсчетов исключа- ется из рассмотрения. Искажения в восстановленных после прорежива-

ния компонентах Cb è Cr как правило несущественны, т.к. они содержат

небольшое количество визуальной информации (см. п.8 из подраздела 1.2.).

(a) Исходные данные

(b) После децимации

Рис. 1.1. Децимация компонент Cb è Cr, в соответствии с форматом 4:2:0

Под децимацией в данной работе будет упоминаться прореживание

âN раз по ширине и в N раз по высоте.

1.2.Порядок выполнения лабораторной работы

1.Согласовать с преподавателем BMP файл в формате RGB24.

2.Выполнить загрузку в память указанного BMP файла.

3.Выделить содержимое компонент R, G è B и сохранить их в от-

дельных файлах в формате RGB24 по следующему правилу: байты, не относящиеся к сохраняемой компоненте должны быть обнулены. Вэтом случае мы получим три файла с соответствующими цветами.

4.Проанализировать корреляционные свойства компонент R, G è B, используя формулу оценки коэффициента корреляции:

	^	^	^
r^A;B =	M[(A M[A])(B M[B])]			;	(1.11)
			^A ^B

1 / 41 2 3 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
02.04.201599.84 Кб56laba1_Damir_-_dlya_sliania.doc
#
02.04.201588.58 Кб36laba_66.doc
#
02.04.2015454.66 Кб57Laba_8.docx
#
02.04.2015358.22 Кб12Laboratornaya_rabota_chernovik 02 12 2014.docx
#
02.04.2015799.67 Кб28labrab4-5_Kuznetsovoy_Olgi_gr_6231K.docx
#
02.04.20151.67 Mб12labs.pdf
#
02.04.2015107.52 Кб17lab_2.doc
#
02.04.201571.17 Кб141lab_3_33__33.doc
#
02.04.201595.23 Кб20lab_4.doc
#
02.04.2015261.63 Кб17lab_5.doc
#
02.04.2015770.43 Кб5lab_pr_1.pdf