К. т. н. Загребнюк В. И., Насиров Ф. В.
Одесская национальная академия связи имени А. С. Попова, Украина
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ВЫДЕЛЕНИЯ ГРАНИЦ НА ЦВЕТНЫХ ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ
В технологии контекстного поиска изображений по регионам (RBIR – Region-based image retrieval ) точность и полнота поиска определяется эффективностью методов выделения объектов (регионов) на изображении. Широкий класс методов выделения объектов основывается на выделении границ регионов на изображениях в градациях серого [1 – 3]. Однако не все методы преобразования цветных изображений в градации серого, сохраняют цветовые контрасты [4], а их потеря сопровождается искажениями контуров, поэтому объекты выделяются на цветных изображениях с использованием текстурно-цветовых методов выделения регионов [5 – 7]. Во всех этих методах дескрипторы – это многомерные векторы, что существенно усложняет, как индексирование, так и поиск изображений по регионам. Таким образом, проблема разработки методов выделения регионов на изображениях со сложным цветовым и пространственным контекстом, которые минимизируют количество признаков в дескрипторе – актуальна. Одно из возможных решений этой проблемы заключается в представлении связного региона его контуром и усредненным значением цвета. Для эффективного определения контура связного региона необходимо разработать математическую модель, позволяющую выделять границы между регионами на цветных цифровых изображениях, что и является целью данной работы.
Пусть, в общем случае изображение сканируется маской размера
. Обозначим квадратную матрицу, такого же размера, как и маска, через
. Элементы этой матрицы – значения цвета пикселей в пределах маски. Для упрощения предварительного анализа будем считать, что граница в пределах маски расположена горизонтально, пиксели верхних
строк имеют значение цвета
, а остальные
строк –
. В этом случае матрицу
можно представить в виде блочной матрицы
,
где
- прямоугольная матрица размерности
, с элементами
, а
- матрица размерности
с элементами
. Пусть
. Для упрощения дальнейших вычислений будем использовать матрицу
. Тогда блочная матрица
будет состоять из блоков:
- нулевая матрица, а
. Векторизуем эту матрицу по строкам, в результате получим матрицу-строку
, где
- нулевая матрица строка размерности
, а
- матрица-строка размерности
с элементами
. Используя
построим генкелеву матрицу или матрицу вложения размерности
, где
– размер окна. Блочная матрица вложения
состоит из следующих блоков:
– нулевая прямоугольная матрица размерности
,
- квадратная матрица размерности
, у которой все элементы расположенные выше побочной диагонали равняются нулю, а расположенные на побочной диагонали и ниже нее равняются
. У прямоугольной матрицы
размерности
все элементы равны
. Вычислим матрицу
и ее сингулярные тройки:
- собственные значения матрицы
;
- собственный вектор соответствующий
; факторный вектор
. Не умаляя общности дальнейшего анализа, положим
, а
. Тогда собственные значения – это корни кубического уравнения. Для дальнейшего, наибольший интерес будет представлять собственная тройка, соответствующая наибольшему собственному значению. Наибольшее собственное значение в этом случае будет вычисляться по формуле :
,
где
;
;
.
Вычислим собственный и факторный векторы, соответствующие максимальному собственному значению. Собственный вектор
будет иметь компоненты:
;
Факторный вектор будет иметь следующую структуру
. Нулевая матрица-строка
размерности
. Матрица
размерности
, будет иметь вид:
,
а
размерности
, будет иметь следующие элементы:
,
.
Если сравнить размерности
и
, то можно заметить, что количество нулей в
совпадает с количеством нулевых столбцов матрицы
, и следовательно анализируя факторный вектор можно установить строку маски в которой изменяется цвет, или, что тоже самое, строку с границей регионов. Пусть количество нулевых компонент факторного вектора равно
, тогда номер
строки маски с границей будет вычисляться по формуле :
.
Таким образом, горизонтальную границу между цветовыми регионами в пределах маски можно определить без использования градиентных фильтров. Очевидно, что для определения положения вертикальной границы между двумя цветовыми регионами необходимо транспонировать матрицу
.
Рассмотрим теперь случай когда граница между двумя цветовыми регионами ориентирована, например, параллельно побочной диагонали.
Векторизуем матрицу с использованием схемы «Зигзаг» [8]. Тогда получим матрицу строку вида
, где
– матрица строка размерности
с нулевыми элементами, а
– матрица строка размерности
с элементами равными
. Пусть матрица
имеет
нулевых диагоналей. Если
, то
, иначе
, а
. Как и в предыдущих случаях, для окна размером
, блочная матрица вложения будет иметь вид
. Блочная матрица состоит из следующих блоков:
– нулевая прямоугольная матрица размерности
;
– квадратная матрица размерности
, у которой все элементы расположенные выше побочной диагонали равняются нулю, а расположенные на побочной диагонали и ниже нее равняются
. У прямоугольной матрицы
размерности
все элементы равны
. Для данного случая вычисление собственных и факторных векторов, в общем виде, очень громоздкое, поэтому рассмотрим числовые примеры для
и
при
.
Для
траекторная матрица будет иметь следующую блочную структуру:
, где
- нулевая матрица размерности
;
– матрица размерности
у которой все элементы расположенный выше главной диагонали равны нулю.
В этом случае матрица
будет иметь вид:
.
Собственные значения данной матрицы:
,
,
. Собственный вектор этой матрицы, соответствующий максимальному собственному значению, имеет компоненты:
,
,
. Собственный вектор, соответствующий
, имеет компоненты:
,
,
. Собственный вектор, соответствующий
, имеет компоненты:
,
,
.
Значения компонент факторного вектора
, соответствующего максимальному собственному значению приведены на рис. 1.
Рис. 1 . Факторный вектор, соответствующий максимальному собственному значению
В случае диагональной границы, зависимость количества нулевых компонент вектора
от
нелинейная и, для рассматриваемого случая, имеет вид :
.
Отсюда, номер диагонали
, которая расположена на границе двух цветовых регионов вычисляется по формуле :
.
Таким образом, предложенная математическая модель позволяет выделять границы различной ориентации на цветном цифровом изображении. Для различных ориентаций границы (горизонтальной, вертикальной и диагональной) в модели используются различные способы векторизации изображения: строками и столбцами с разворотами, а также зигзагом. Решение о наличии границы выносится на основании анализа структуры факторного вектора, соответствующего максимальному собственному значению. Получена аналитическая зависимость, связывающая количество нулевых компонент факторного вектора, размеры маски изображения и окна сингулярного спектрального анализа с номером строки-, столбц а- или диагонали-границы на изображении. Модель может быть эффективно использована в системах компьютерного зрения в процедурах сегментации цифровых изображений и для выделения регионов изображений в системах контекстного поиска по регионам RBIR. Целью дальнейших исследований должна стать разработка автоматических методов определения ориентации границ на изображении.
Список использованных источников:
1. Hiremath P. S. Content Based Image Retrieval based on Color, Texture and Shape features using Image and its complement / P. S. Hiremath , J. Pujari // International Journal of Computer Science and Security, 2007. - V . 1, № 4. - P . 25 - 35.
2. Deshpande A. Design Approach for Content-Based Image Retrieval Using Gabor-Zernike Features / A. Deshpande , S. K. Tadse // International Archive of Applied Sciences and Technology, 2012. - V . 3, № 2. - P . 42 - 46.
3. Chaudhari R. Content Based Image Retrieval Using Color and Shape Features / R. Chaudhari , A. M. Patil // International Journal of Advanced Research in Electrical, Electronics and Instrumentation Engineering, 2012. - V . 1, № 5. - P . 386 - 392.
4. Cadík M. Perceptual Evaluation of Color-to-Grayscale Image Conversions / M. Cadík // Pacific Graphics, 2008. – V. 27 .– P . 128 - 138.
5. Carson C. Blobworld : A system for region-based image indexing and retrieval / C. Carson, M. Thomas, S. Belongie , J. M. Hellerstein , J. Malik // Visual Information and Information Systems. Lecture Notes in Computer Science , 1999. – V .1614 .– P . 509 - 517.
6. Natsev A. WALRUS: A similarity retrieval algorithm for image databases / A. Natsev , R. Rastogi , K. Shim // Newsletter ACM SIGMOD Record, 1999. – V. 28, № 2. – P. 395–406.
7. Bartolini I. The Windsurf Library for the Efficient Retrieval of Multimedia Hierarchical Data / I. Bartolini , M. Patella, G. Stromei // Proceedings of the International Conference on Signal Processing and Multimedia Applications, 2011. - №1 - P . 139 - 148.
8. ISO/IEC 10918-1:1994 Information technology - Digital compression and coding of continuous-tone still images: Requirements and guidelines. – ISO/IEC, 1994. – 186 p.