Современные информационные технологии/1. Компьютерная инженерия

 

К.ф.-м.н., доцент Капшаев И.Р., к.ф.-м.н. Султанбекова А.О.

Казахстанско-Британский технический университет

Концептуальная модель архитектуры подсистемы видеонаблюдения для автоматизированной идентификации личности в режиме реального времени

 

В данной работе рассматривается вопрос разработки концептуальной модели подсистемы видеонаблюдения для автоматизированной системы идентификации личности по изображению лица в режиме реального времени.

Предлагаемая к реализации подсистема видеонаблюдения выполняет следующие функции:

-                   сбор видеоинформации об объектах и субъектах наблюдения;

-                   преобразование аналогового видеопотока, поступающего с камер наблюдения, в цифровую форму в виде последовательности фреймов;

-                   предварительная обработка и передача видеофреймов по цифровым каналам связи.

Подсистема видеонаблюдения состоит из следующих компонентов:

-                   видеокамер наблюдения;

-                   средств аппаратного сопряжения (видеорегистраторов);

-                   серверных компьютерных станций (видеосерверов);

-                   оконечного оборудования передачи данных;

-                   программного обеспечения предварительной обработки видеоинформации.

Логически подсистема видеонаблюдения разбита на модули.

Таким образом, подсистема видеонаблюдения состоит из множества модулей различных конфигураций, объединенных с подсистемой идентификации телекоммуникационной инфраструктурой.

Архитектура проектируемой системы допускает использование в подсистеме видеонаблюдения видеокамер следующих типов:

-                   аналоговых и цифровых видеокамер (в том числе IP и web-камер);

-                   видеокамер для внутреннего и для наружного наблюдения;

-                   черно-белых и цветных видеокамер.

Основные технические требования, предъявляемые камерам видеонаблюдения, состоят в определении параметров получаемого качества и формата видеоизображения.

Аналоговые видеокамеры должны иметь следующие характеристики:

-                   использовать телевизионный стандарт видеосигнала PAL или NTSC;

-                   иметь разрешение (или пространственную информативность изображения) не менее 700 телевизионных линий при частоте обновления видеоизображения не менее 30 кадров в секунду;

-                   иметь чувствительность (или минимальную допустимую освещённость наблюдаемых объектов) не менее 0.01 Люкс;

-                   иметь широкий динамический диапазон (широта диапазона одновременно воспринимаемых яркостей);

-                   использовать напряжение питания 12В и потреблять мощность не более 160мА;

-                   иметь отношение сигнал/шум формируемого видеоизображения не более 50дБ;

-                   иметь встроенный объектив с фокусным расстоянием для камер внутреннего наблюдения 3.6мм и для камер наружного наблюдения 6.0мм;

-                   иметь инфракрасную подсветку и электронную функцию день/ночь;

-                   использовать стандартный аналоговый видеоинтерфейс.

Цифровые видеокамеры должны иметь в целом те же характеристики, что и аналоговые камеры, но в  силу специфики цифрового оборудования, должны

-                   иметь разрешение не менее 720*480 пикселей при частоте обновления видеоизображения не менее 30 кадров в секунду;

-                   использовать стандартный TCP/IP интерфейс.

Средства аппаратного сопряжения (или видеорегистраторы) – это компьютерные платы захвата видеоизображения, преобразования его (если необходимо) в цифровую форму и разбиения на кадры (или фреймы) для последующей обработки и передачи по цифровым каналам связи.

К видеорегистраторам, в рамках проектируемой системы, предъявляются следующие требования:

-                   поддержка стандартного PCI или PCI Express интерфейса;

-                   поддержка телевизионных стандартов NTSC и PAL;

-                   поддержка разрешения не менее 720*480 пикселей при частоте обновления не менее 30 кадров в секунду;

-                   поддержка одновременного захвата видеоизображения не менее чем с 16 независимых видеоисточников без потери качества захвата;

-                   совместимость с операционными системами семейства Windows XP 32 или 64 бита;

-                   наличие программируемого API интерфейса для решения задач компьютерного или машинного зрения;

-                   поддержка стандартных аналоговых или цифровых видеоинтерфейсов.

Серверные компьютерные станции (видеосерверы)

-                   выполняют сбор видеоинформации поступающей от видеорегистраторов;

-                   осуществляют предварительную обработку видеоинформации;

-                   передачу видеоинформации в подсистему идентификации посредством оконечного телекоммуникационного оборудования.

Основные технические требования, предъявляемые к видеосерверам, состоят в следующем:

-                   поддержка стандартного PCI или PCI Express интерфейса;

-                   совместимость с операционными системами семейства Windows XP 32 или 64 бита;

-                   наличие видеокарты с объемом видеопамяти не менее 4ГБ;

-                   наличие четырех сетевых Ethernet интерфейсов со скоростью передачи данных не менее 10Гбит/сек;

-                   наличие четырех-ядерного Intelx86 совместимого микропроцессора с тактовой частотой не менее 3 ГГц;

-                   наличие оперативной памяти объемом не менее 16ГБ.

Основная функция оконечного телекоммуникационного оборудования – прием видеоинформации от видеосерверов и ее передача по каналам связи в подсистему идентификации.

Функции оконечного оборудования передачи данных (в рамках разрабатываемой системы) могут выполнять DSL, GSM и WiMax модемы, Ethernet и WiFi сетевые устройства, в том числе сетевые коммутаторы.

ПО, осуществляющее предварительную обработку видеоинформации, реализует функции:

-                   поиска и определения позиций человеческих лиц в видеофреймах;

-                   трекинга изображений человеческих лиц в видеопотоке;

-                   сжатия (обрезки) видеофреймов для последующей передачи подсистеме идентификации.

Таким образом, ПО осуществляет поиск изображения человеческого лица (обнаружение) в каждом видеофрейме и определяет его позицию (локализация), т.е. координаты верхнего левого угла прямоугольника, содержащего изображение человеческого лица. Описание модуля, отвечающего за обнаружение и локализацию лица в изображении, приведено в следующем подразделе.

Если в видеофрейме присутствуют несколько изображений человеческих лиц, то программное обеспечение осуществляет поиск и определяет позицию каждого человеческого лица, присутствующего в изображении.

Далее производится обрезка видеофрейма до прямоугольника содержащего изображение человеческого лица.

Если видеофрейм содержит несколько изображений человеческих лиц, то обрезка осуществляется отдельно для каждого изображения человеческого лица, т.е. вместо исходного видеофрейма создаются несколько видеофреймов меньших размеров.

Затем каждый, «урезанный» таким образом, видеофрейм кодируется идентификационным номером видеокамеры, идентификационным номером субъекта наблюдения, текущими календарной датой и временем, и отправляется через телекоммуникационную инфраструктуру подсистеме идентификации.

Идентификационный номер видеокамеры – это постоянное целое 64-значное десятичное число, при помощи которого кодируется конкретный объект наблюдения (город или населенный пункт, улица, здание, этаж, крыло и номер видеокамеры).

Идентификационный номер субъекта наблюдения – это натуральное число, генерируемое случайным образом, для каждого нового субъекта наблюдения, появившегося в поле зрения видеокамеры и используемое системой в процессе трекинга и идентификации субъектов наблюдения.

Помимо функций поиска и локализации изображений человеческих лиц в видеофреймах, а также сжатия (обрезки) видеофреймов до прямоугольников, содержащих изображения человеческих лиц, ПО должно осуществлять нормализацию изображений человеческих лиц.

Нормализация необходима для обеспечения инвариантности идентификации субъектов наблюдения относительно различных условий освещения и поворотов изображений человеческих лиц в плоскости видеофреймов.

Первый этап нормализации – это поворот всех изображений человеческих лиц, присутствующих в видеофрейме, в нормальное положение – 00 относительно вертикальной оси видеофрейма.

Второй этап – преобразование цветного изображения человеческого лица в черно-белое, и следующие за этим, коррекция яркости и гистограммное выравнивание.

Таким образом, ПО подсистемы видеонаблюдения, осуществляя предварительную обработку (препроцессинг) видеоинформации, решает следующие задачи:

-                   во-первых, снижает нагрузку на телекоммуникационную инфраструктуру, за счет обрезки (сжатия) видеофреймов,

-                   во-вторых, снижает нагрузку на подсистему идентификации, за счет подготовки изображений человеческих лиц в наиболее удобном для идентификации личности формате.

 

Литература:

1.     Diamantaras K.I., Kung S.Y. Principal Component Neural Networks: Theory and Applications. John Wiley & Sons Inc. 1996. – 255 p.