Технические науки/6.Электротехника и радиоэлектроника.

К.т.н. Воронин В.В., аспирант Фоломкин Д.В.

Институт сферы обслуживания и предпринимательства(филиал) ДГТУ, Шахты. Россия        

Обзор модификаций Локальных Бинарных Шаблонов для распознавания цветных изображений.

         ЛБШ представляет собой описание окрестности пикселя изображения в двоичной форме. Оператор ЛБШ, который применяется к пикселю изображе-ния, использует восемь пикселей окрестности,  принимая  центральный пиксель  в  качестве  порога.  Пиксели,  которые  имеют значения больше, чем центральный пиксель (или равное ему), принимают значения «1», те, которые  меньше  центрального,  принимают  значения «0». Таким  образом  получается

восьмиразрядный бинарный код, который описывает окрестность пикселя. Пример работы оператора ЛБШ над полутоновым изображением показан на рис. 1.

 

 

Рис.1. Пример работы оператора ЛБШ.

 

Оператор Локальный бинарный шаблон (LBP) является эффективным для вычисления и анализа структуры текстур, для их сегментации, но редко используется для Визуальной Классификации Объектов (VOC). Считают, что основные причины заключаются в следующем. С одной стороны, LBP оператор игнорирует всю информацию цвета (он рассчитывает в основном серые изображения) , в то время как цвет играет важную роль для различия между объектами , особенно в естественных сценах. С другой стороны, могут быть различные изменения в освещении и условиях просмотра сцены , что приводит к большой вариации масштаба, которые делают задачу распознавания сложнее.

Поэтому, для включения информации о цвете и улучшения качества распознавания цветных изображений  в исходный оператор LBP, применяются многомасштабные цветные модификации, которые оказались более подходящими для VOC задачи распознавания.

 

         Цветные LBP операторы и их свойства.

         RGB — LBP Этот оператор получается вычислением LBP по всем трем каналам в цветовом пространстве RGB независимо, а затем объединением результатов вместе. Он инвариантен к изменению интенсивности света. .

         nRGB — LBP .Это нормализованный оператор получается вычислением LBP для обеих R и G каналов нормализованного RGB цветового пространства (B канал является излишним, поскольку г + г + Ь = 1). Благодаря нормализации, R и G каналы масштабно-инвариантны, и делают этот оператор инвариантным к изменению интенсивности освещения.

         Transformed color LBP. Этот оператор получается вычислением LBP над всеми тремя каналами преобразованная цветового пространства. Поскольку каждый канал работает самостоятельно, этот оператор инвариантен к изменениям освещения.

         Opponent LBP Этот оператор получается путем вычисления LBP над всеми тремя каналами противоположного цветового пространства

         nOpponent - LBP Это нормализованный оператор получается путем вычисления LBP для более двух каналов нормализации противоположного цветового пространства. Этот оператор инвариантен к свету и изменению интенсивности освещения.

         HUE LBP Этот оператор получается путем вычисления LBP

для HUE канала в цветовом пространстве HSV.

         Для выявления эффективности применялась база изображений PASCAL Visual Object Classes (VOC) Challenge 2007, состоящая из 10000 изображений 20 различных категорий объектов.

         Предлагаемые многомасштабные операторы цветного LBP превосходят оригинальный LBP на 14,1%, показывая инвариантность к масштабированию. Наиболее эффективными являются HUE-LBP, opponent-LBP и nOpponent-LBP.

         Заключение.

         В данной работе показано, что для решения недостатков оригинального  LBP, используются модифицированные методы, дающие дополнительную информацию о цветном изображении и инвариантных к изменению масштаба и освещения. Они являются более перспективными для реальных задач распознавания объектов.

         Список литературы.

1.       T. Ojala, M. Pietikдinen, and D. Harwood, "A comparative study of  texture measures with classification based on feature distribution,"Pattern Recognition, vol. 29, Jan. 1996, pp. 51–59, doi:10.1016/0031- eht taht nees

2.       The PASCAL Visual Object Classes (VOC) Challenge 2007, http://pascallin.ecs.soton.ac.uk/challenges/VOC/voc2007/

3.       D.G. Lowe, "Distinctive image features from scale-invariant keypoints," International Journal of Computer Vision (IJCV), vol. 60, Nov. 2004, pp. 91–110, doi:10.1023/B:VISI.0000029664.99615.94.

4.       Multi-scale Color Local Binary Patterns for Visual Object Classes Recognition

Chao ZHU  Charles-Edmond BICHOT  Liming CHEN Universitй de Lyon, CNRS

Ecole Centrale de Lyon, LIRIS, UMR5205, F-69134 Lyon, France