Математика / 5. Математическое моделирование

К.т.н. Колдаев В.Д.

Национальный исследовательский университет МИЭТ, Россия

Методы формирования признаков изображений

Анализ изображения рассматривается как процесс преобразования информации, во время которого осуществляется переход изображения из некоторого исходного (в котором субъект определяется массивом значений яркостей пикселей) в конечное представление. Процесс построения описаний называется интерпретацией изображений (рис.1).

Блок-схема: процесс:      Представление изображенийПодпись: ПозиционноеПодпись:           СтруктурноеПодпись:      КомбинированноеБлок-схема: процесс: На уровне одной структурыБлок-схема: процесс: На уровне базы данных изображенияПодпись: Представление изображенияПодпись: Представление формы объектаПодпись: КонтурноеПодпись: Параметрическое описаниеПодпись: Конструк-
тивное
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Рис.1. Способы представления изображений

Главное требование к признаку – это инвариантность к любым преобразованиям изображения: плоскопараллельному смещению, повороту вокруг оси объектива, масштабированию, перспективным преобразованиям, деформированию, плавному или  произвольному изменению яркости, цвета, контраста [1].

Статистические признаки: коэффициент корреляции, моменты различных порядков, закон распределения, матрицы смежности. Недостатками этих признаков являются: значительные вычислительные затраты; неизвестность закона распределения; неоднозначность описания области изображения. Несмотря на это, для большинства реальных изображений признаки, полученные на основе статистического анализа, способны однозначно описывать области изображения.

Геометрические признаки делятся на простые и производные. К простым признакам относятся: периметр, площадь фигуры без дыр, площадь дыр, максимальное расстояние между внешними параллельными касательными и границами. К производным признакам относятся: средняя длина хорды, эксцентриситет, изрезанность контура, пористость, спиральность, периметр выпуклой наименьшей формы, описывающей объект.

Структурные признаки основаны на представлении, как всего изображения, так и изображения отдельного субъекта в виде совокупности некоторых примитивных геометрических элементов и их отношений между собой. Структурное представление изображения строится на базе геометрического подхода, включая в описание формы взаимное положение и отношения отдельных элементов. Типичным примером структурного описания изображения является иерархические (древовидные) структуры. Главным недостатком структурных методов является необходимость четкого разделения изображения на объект и фон, что, очевидно, невозможно в условиях реального изображения.

Лингвистические признаки. За основу берутся геометрические примитивы, вычисляемые на изображении и составляющие словарь терминальных символов. Порождающая грамматика представляет собой математическую схему, которая используется для описания правил построения языковых конструкций или комбинации слов и предложений из отдельных символов. Процесс грамматического анализа или грамматического разбора заключается в определении возможности формирования цепочки символов в рамках данной грамматики. Недостатками этого метода являются процесс выбора типа непроизводных элементов и трудоемкость операции поиска  последних на реальных изображениях.

В основу нейросистемных признаков положен принцип действия нейронных клеток головного мозга человека. Нейрон имеет несколько входов, каждый из которых имеет свою весовую функцию, а также из одного выхода и блока суммирования [2].

Пусть N – количество пикселей, относящихся к объекту. Все множество пикселей p(x,y), относящихся к объекту, обозначим , тогда координаты центра масс объекта вычисляются как

    

Вычисляем несколько вспомогательных величин:

 

 

Тогда длины максимальной и минимальной осей инерции вычисляются как:       

Длины главных осей инерции используются для вычисления эксцентриситета и ориентации объекта. Эксцентриситет определяется с помощью соотношения:

Многослойный персептрон – частный случай персептрона Розенблатта, в котором один алгоритм обратного распространения ошибки обучает все слои. Особенностью является наличие более чем одного обучаемого слоя (как правило – два или три; при применении большего числа теряется скорость обработки без приобретения качества). Изображение – это область, распределенная по пространственным координатам x, y и по длинам волн v описывается функцией   с(x, y, v). Эта функция является неотрицательной; ее максимальное значение в изображающих системах ограничено предельной величиной светочувствительности регистрирующих сред: 0< с(x, y, v) <A, где A – максимальная яркость изображения. Структура нейронной сети, выполненной в виде многослойного персептрона, представлена на рис.2.

Рис.2. Структура нейронной сети

На вход нейронной сети подается яркость каждого пикселя монотонного участка полутонового изображения, на выходе получаем три составляющие цвета: R (красный), G (зеленый), B (синий). Перекрестное влияние друг на друга оказывают следующие параметры характеристики сети: число нейронов в скрытом слое, функция активации, способ обучения сети. Главным достоинством нейронных сетей является значительная степень параллельности вычислений, и, как следствие, значительная скорость обработки, которая не может быть достигнута при использовании других подходов. Недостатком является необходимость предварительного разделения на объект и фон, а также отсутствие инвариантности ко всем видам преобразований.

    Для описания и сегментации свойств изображений применяют текстурные методы, делящиеся условно на две категории: статистические и структурные. Примером статистического подхода является использование матриц совпадений, формируемых из исходных изображений, с последующим подсчетом статистических моментов и энтропии. При структурном подходе, например, на основе мозаики Вороного, строится множество многоугольников. Многоугольники с общими свойствами объединяют в области. Для исследования общих свойств часто используют признаки – моменты многоугольников. Кроме вышеописанных подходов к формированию признаков, существует еще целый ряд методов: дистанционное преобразование, вейвлет-анализ и мультисенсорные системы.

При большом разнообразии методов и алгоритмов обработки изображений один и тот же алгоритм может быть эффективен для одного класса изображений,  и не удовлетворять заданным  критериям  для  другого. Разработка  новых  алгоритмов  сегментации  изображений, предварительное  определение  критериев  качества  их  работы  и  экспериментальные оценки являются обязательной составной частью процесса разработки автоматизированных производственных систем.

Литература

1.   Колдаев В.Д. Эвристические алгоритмы контурной сегментации  изображений [Текст] / В.Д. Колдаев // Научно-технический журнал «Известия высших учебных заведений. Электроника». –  М.: МИЭТ, 2007. – №4. – С.71-75.

2.  Колдаев В.Д. Предварительная обработка и фильтрация изображений методом масок [Текст] / В.Д. Колдаев // Оборонный комплекс – научно-техническому прогрессу России: Межотраслевой научно-технический журнал. – М.: ФГУП  «ВИМИ», 2010. – Вып.4. – С.79-83.