Технические науки/6.Электротехника и радиоэлектроника.

К.т.н. Воронин В.В., аспирант Фоломкин Д.В.

Институт сферы обслуживания и предпринимательства(филиал) ДГТУ, Шахты. Россия        

Использование Локальных Бинарных Шаблонов для распознавания лиц на полутоновых изображениях.

            Сегодня  существует  большое  количество   приложений,  в  которых используются  методы распознавания лиц, таких как: идентификация личности, контроль удостоверений личности, использование  интерфейса „человек-компьютер”  и  т. п.  Главные  сложности  при  распознавании  лиц – множество  изменений  при  представлении  лиц,  таких  как:  различное освещение,  выражение  лица,  поворот  головы,  возрастные  изменения  и  т.  п.  Поэтому проблема автоматического распознавания лиц полностью не решена до сих пор [1]. Процесс  идентификации  личности,  который  базируется  на  распознавании  по изображению лица, состоит в том, что изображение лица неизвестной личности подается на вход  системы  распознавания,  в  которой  сравнивается  с  изображениями  лиц  известных личностей, находящихся в  базе изображений.  Процесс идентификации можно разделить на три основных этапа: регистрация  и нормализация изображения лица; выделение признаков; классификация.  [1]

            В  последнее  время  особенное  внимание  исследователей  для  выделения  признаков из изображения лица привлекают методы, которые используют локальные бинарные шаблоны (ЛБШ). ЛБШ  впервые  были  предложены  в 1996 году  для  анализа  текстур  полутоновых изображений [2]. Методы распознавания лиц, которые используют для выделения признаков ЛБШ  и  их  модификации,  демонстрируют  высокие  результаты  как  по  скорости,  так  и  по точности распознавания. Такие методы работоспособны при использовании изображений лиц с различной мимикой, различным освещением, поворотами головы. 

            Целью  данной  работы  является  рассмотрение процесса распознавания лиц на полутоновых изображениях методом Локальных бинарных шаблонов.[2]

            Локальные бинарные шаблоны (ЛБШ) представляет собой описание окрестности пикселя изображения в двоичной форме. Оператор ЛБШ, который применяется к пикселю изображения, использует восемь пикселей окрестности,  принимая  центральный  пиксель  в  качестве  порога.  Пиксели,  которые  имеют значения больше, чем центральный пиксель (или равное ему), принимают значения «1», те, которые  меньше  центрального,  принимают  значения «0». Таким  образом  получается восьмиразрядный бинарный код, который описывает окрестность пикселя. Пример работы оператора ЛБШ над полутоновым изображением показан на рис. 1. 

 

 

                                               Рис. 1.  Пример работы ЛБШ оператора 

            В  роботе [3] была  описана  модификация  ЛБШ,  в  которой  используют  пиксели окрестности, находящиеся на некотором расстоянии от центрального пикселя. В этом случае пиксели окрестности лежат на круге с радиусом R. Количество точек этого круга может быть выбрано  произвольно,  обозначим  их  как P. Для  вычисления  значений  в  этих  точках  для разных  радиуса R и  количества  точек P используется  билинейная  интерполяция.  Для представления ЛБШ с радиусом R и расстоянием P будем использовать обозначение LBP P,R. На рис. 2 представлены наборы пикселей окрестности для разных P и R.

 

 

                                   Рис. 2.  Модифицированный ЛБШ для различных P и R:

а) количество точек P = 8, радиус окрестности  R = 1.0; б) количество точек P = 12, радиус окрестности R = 2.5; в) количество точек P = 16, радиус окрестности R = 4.

            В  работе [2] было  предложено  для  анализа  изображения  использовать  не  все  ЛБШ,  а только те, которым свойственно иметь не более двух переходов с «1» в «0» или наоборот. Такие шаблоны называют uniform pattern, обозначим их как  LBP Pu,R. Использование  LBP Pu,R  имеет два преимущества. Во-первых, происходит экономия памяти, потому что при использовании  LBP Pu,R  для анализа изображения нужно лишь P(P−1)+2 ЛБШ, тогда  как  для  представления  всех LBP P,R  нужно  использовать 2P  ЛБШ.  Во-вторых,  LBPPu,R  определяют только важные локальные текстуры, такие  как, концы линий, края, углы, пятна. Для работы такого метода исходное изображение делится на области. Далее считается гистограмма каждой области и общая из построенных гистограмм. Пример изображения лица на области и соответствующие этим областям гистограммы изображены на рис. 3.     

 

 

 

                                   Рис. 3. Гистограммы из областей изображения.

            Эффективность данного метода подтверждают исследования, которые проводились  базой  лиц исследовательской лаборатории Оливетти (ORL-Olivetti research laboratory). База состоит из 400  изображений  лиц 40 человек (по 10 разных  изображений  лица  одного  человека),  у которых разные выражения лица (например, с открытыми/закрытыми глазами, с улыбкой/без улыбки) и также наличие/отсутствие очков. Все изображения лиц находятся на темном фоне, в  фронтальной  позиции  с  наклонами  и  поворотами  головы  до 20 градусов  и  изменением масштаба до 10%. Все изображения полутоновые и имеют размер 92*112 пикселей. Эффективность выбранного метода по сравнению с оригинальным составляет 7-10%.

            Заключение.

            В работе рассмотрен процесс распознавания лиц методом Локальных бинарных шаблонов и приведено экспериментальное подтверждение повышенной эффективности использования модифицированных версий метода.

            Список литературы

            1. W. Zhao, R. Chellappa, P.J. Phillips, and A. Rosenfeld. Face recognition: A literature survey. ACM Computing Surveys, 35(4): 399 – 458, 2003.

            2. Ojala, T., Pietikainen, M., Harwood, D.: A comparative study of texture measures with classification based on Наукові праці ВНТУ, 2008, № 4 6 feature distributions. Pattern Recognition 29(1), 51–59 (1996).

            3. Ojala, T., Pietikainen, M., Maenpaa, M.: Multiresolution gray-scale and rotation invariant texture classification with local binary patterns. IEEE Transactions on Pattern Analysis and Machine Intelligence 24(7), 971–987 (2002).