Технические науки/6.Электротехника и радиоэлектроника.

К.т.н. Воронин В.В., аспирант Фоломкин Д.В.

Институт сферы обслуживания и предпринимательства

(филиал) ДГТУ, Шахты. Россия

Обзор методов трехмерного распознавания лиц на

видео потоке.

         Главной задачей в области распознавания зрительных образов является распознавание лиц. В настоящее время интенсивно развивается направление исследований, связанное с получением трехмерной информации об объекте. Алгоритмы 3D распознавания используют информацию о глубине и кривизне поверхности, в отличие от систем 2D распознавания, использующих признаки, основанные на яркости пикселей изображения. Следовательно, 3D дескрипторы имеют большую точность в описании особенностей поверхности; лучше подходят для описания свойств лица; инвариантны к ракурсу и освещению.

         Целью данной работы является рассмотрение современного состояния проблемы 3D распознавания лиц, представление распространенных способов получения трехмерной информации о лице и алгоритмов распознавания.

         Современное состояние проблемы 3D распознавания лиц. Существующие на данный момент системы 3D распознавания лиц используют специальное оборудование для реконструкции трехмерной модели лица (сенсорные системы). Они делятся на три категории:

         1. Стерео. Используются две камеры с известным взаиморасположением  для получения стереопары изображений объекта; на полученных изображениях находятся соответствующие точки и вычисляется положение сопоставленных точек в трехмерном пространстве.

         2. Структурированный свет. Этот подход использует камеру и световой проектор: структурированный свет проецирует на лицо специальную текстуру, а камера регистрирует искажения этой текстуры на объемном объекте. С помощью методов восстановления формы по текстуре вычисляется расположение точек в трехмерном пространстве.

         3. Лазерное сканирование. Лазерные сканеры применяют свет как источник для обнаружения расстояния до объекта сканирования. Они измеряют время отражения лазера от объекта и получают информацию о глубине расположения точек на его поверхности.

         Способы получения трехмерной информации о лице в литературе называются «shape from X», где Х — название  метода. Наиболее перспективные из них:

         1.Восстановление формы по теням (shape from shading, SFS). Задача восстановления формы объекта по изменению яркости пикселей изображения, использует визуальную информацию о характере отражения света на его поверхности. [1,2]

         2. Восстановление формы по стереопаре (shape from stereo). Построение 3D моделей по стереопаре рассматривается как две последовательные задачи: стереосопоставление и построение трёхмерных моделей по множеству точек. Задачей алгоритма является получение данных о расстоянии до объектов сцены, на основании которых строится карта смещений (disparity map).

         3. Восстановление формы по движению (shape from motion, SFM). Данный метод реконструкции трехмерных сцен использует относительное движение между камерой и сценой в последовательности тесно связанных  изображений, предоставляемых для анализа. [3]

         Алгоритмы трехмерного распознавания лиц. Среди различных подходов 3D распознавания можно выделить три основных:

         Анализ формы 3D поверхности. Методы данной группы используют локальные или глобальные характеристики поверхности, которая описывает лицо.

         Статистические методы используют одновременно комбинацию карт глубины и цвета. Одним из них является метод линейного дискриминантного анализа, в котором, объект задается набором моделей.

         Методы, использующие параметрическую модель лица. В данных методах 3D форма лица описывается параметрами модели, полученной при деформации набора антропометрических точек лица, извлеченных из фотографий. Эти параметры используются для распознавания в качестве признаков лица. [4,5]

         Заключение

         Рассмотренные выше способы восстановления трехмерной модели лица имеют ряд ограничений и недостатков, которые не позволяют решить задачу распознавания лиц эффективно, при использовании каждого метода самостоятельно. Таким образом, наиболее разумным представляется комбинирование различных подходов.

         Список литературы

         1. Вежневец В. Задача восстановления формы объекта по его закраске. [Электронный ресурс] / В. Вежневец // Online журнал «Графика и мультимедиа». – 2003. – Вып. 2. – Режим доступа : http://cgm.graphicon.ru/issue2/Paper_vvp2/

         2. William A.P. Smith. Statistical Methods For Facial Shape-from-Shading and Recognition / William A.P.Smith // PhD thesis. – University of York, 2007]

         3. Cantzler Helmut. An overview of shape from motion [Электронный ресурс] / Helmut Cantzler // Cvonline: The Evolving, Distributed, Non-Proprietary, OnLine Compendium of Computer Vision. – Режим доступа : http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/CANTZLER2/shape_motion.html

         4. Манолов А.И. Некооперативная биометрическая идентификация по 3D-моделям лица с использованием видеокамер высокого разрешения [Электронный ресурс] / А.И. Манолов, А.Ю. Соколов // Труды 19-й Международной конференции по компьютерной графике и зрению «ГрафиКон’2009», (Москва, 5 – 9 октября 2009 г.). – М. : МАКС ПРЕСС, 2009. – Режим доступа : http://gc2009.graphicon.ru/en/proceedings

         5. Шлянников А.В. Алгоритм генерации трехмерного макета лица по фотографии / А.В. Шлянников //Компьютерная оптика. – 2010. – Т. 34, № 2. – С. 272-277.