Математика/5. Перспективы информационных систем.

 

магистрант Калыбаева А.К.

Атырауский институт нефти и газа, Республика Казахстан

Системы распознавания трехмерных объектов

 

Рассмотрим описание предлагаемой экспериментальной системы машинного видения. При разработке системы предполагалось, что она будет способна выполнять следующие операции:

1) на этапе обучения система получает несколько полутоновых изображений объекта (рассматривает его и знакомится с ним). Объект может иметь  криволинейные поверхности, и различные участки поверхности могут иметь различную отражательную способность. После того, как система ознакомилась с одним объектом, подается другой объект и т.д.

2) на этапе распознавания система получает полутоновое изо­бражение объекта, по которому она должна идентифицировать объекты - указать его приблизительное положение и ориентацию в простран­стве относительно ТВ – камеры (далее просто камера). Объекты, предъявляемые на этапе распознавания, тождественны объектам, показанным на этапе обучения. Однако, изображение объекта, получаемое на этапе распознавания, может соответствовать точке наблюдения, совершенно отличной от точек наблюдения, использованных на этапе обучения.

Рассмотрим работу системы. На этапе подготовки происходит построение моделей, соответствующих объектам, подаваемых на обучение и распознавание. На этапе распознавания набор моделей различных объектов, которые предъявляются при обучении, используется для идентифи­кации модели неизвестного объекта и определения его положения в пространстве. При этом ищется такая модель и такое положение модели в простран­стве, при которых проектирование на картинную плоскость  даёт изо­бражение, близкое к  фактически наблюдаемому изображению. Таким образом, на этапе распознавания реализуется принцип анализа через синтез. Такой подход хорошо соответствует современным представлениям о человеческом зрении [1].

Ниже приводится общее описание системы, а также описание используемых в системе вычислительных блоков.

Система состоит из ряда блоков – блок построения модели объекта, блок расцветки модели объекта, блок обучения распознаванию изображений объекта, блок распознавания изображений объекта, блок генерации изображений по модели.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Рисунок 1 - Диаграмма обобщенной системы распознавания трехмерных объектов

 

Блоки связаны между собой через базу данных. В базе данных могут  храниться изображения, модели и характеристики. Изображения и модели могут записываться в базу данных извне, изображения могут по­ступать, в частности, от камеры, модели могут вводиться поль­зователем и вырабатываться блоками системы случайно. Характеристики вырабатываются блоком обучения машины распознаванию изображений объектов и представляют собой простые признаки, помогающие выби­рать подходящую модель объекта на этапе распознавания.

Блок построения пространственной модели объекта по его изо­бражениям получает на входе несколько изображений объекта, пара­метры камеры, положения камеры при получении  исходных изобра­жений объекта в некоторой системе координат, связанной с объектом. Здесь и далее под изображением понимается центральное полутоновое изображение, представленное в виде двумерного массива яркостей. К параметрам камера относятся: фокусное расстояние, размеры растра, число элементов растра, число  градаций яркости, квантованная шкала значений яркости. Положение камеры определяется положени­ем относительной системы координат, центр которой совпадает с центром растра, одна из осей совпадает с направлением наблюдения, а две другие оси  параллельны сторонам растра.

В результате работы этого блока строится трёхмерная модель объекта. Под моделью объекта подразумевается многогранник, за­данный в виде набора плоских многоугольников, аппроксимирующих поверхность объекта. При этом возможна различная точность вос­произведения объекта в модели. Мы можем получать грубые модели объектов или строить модели, содержащие большое количество многоугольников, аппроксимирующих произвольные криволинейные поверхности объекта. В дальнейшем каждому многоугольнику при­писывается некоторая отражательная способность, воспроизводя­щая реальную отражательную способность соответствующего эле­мента поверхности объекта.

Модель объекта может быть построена разными способами. В системе применяется метод построения модели объекта по внешним контурам (силуэтам) объекта, представленным на изображениях, полученных из различных точек наблюдения. Для каждого изображения строится конус с вершиной в точке наблю­дения, направляющей для которого служит контур, а основание достаточно удалено (если контур аппроксимирован ломаной, то мы получаем пирамиду). Далее находится их общее пересечение. В ре­зультате будет построена модель, дающая правильные силуэты объекта из указанных точек наблюдения [2].

Блок обучения распознаванию изображений объекта получает на входе модель объекта, параметры камеры и те ус­ловия освещения, которые далее будут использованы при распозна­вании.

В результате работы этого блока формируется массив харак­теристик. В качестве характеристик используются отношения: площади, ограниченной контуром, к квадрату  периметра; макси­мального радиуса, проведённого из центра тяжести контура к пе­риметру; минимального радиуса, проведённого из центра тяжести контура, к максимальному радиусу; среднего радиуса к максималь­ному радиусу.

Блок обучения использует сгенерированные изображения объ­екта для того, чтобы вычислить ряд характеристик. Число точек наблюдения выбирается достаточно большое, обеспечивая всесторонний и равномерный осмотр модели. При этом характеристики, полученные для рассматриваемой модели объекта, добавляются к характеристикам моделей, которые ранее участвовали в обучении. Каждый набор характеристик запоминается вместе с наименованием модели, для которой она получена, и положением модели камеры относительно модели объекта при получении данного набора характеристик.

Блок распознавания изображений трехмерных объектов. На входе в этот блок задаётся изображение объекта. Рас­познавание проводится среди группы объектов, распознаванию каждого из которых машина была ранее обучена. Распознать объект на изображении - значит идентифициро­вать его и указать его приблизительное положение в простран­стве относительно  камеры при получении данного изображения. Расположение естественно указывать в координатах камеры. Но можно определить положение камеры в координатах объекта. Оба способа, очевидно, равноценны.

Блок распознавания ищет такую модель объекта и такое по­ложение модели камеры относительно модели объекта, при которых генерируемое изображение оказывается близким к факти­чески наблюдаемому изображению. Эта задача решается в 3 этапа, причём на каждом последующем этапе уточняется решение, полученное на предыдущем этапе. Близкий подход был использован в работах [3].

На первом этапе блок распознавания, используя массив характеристик, сформированный блоком обучения, выбирает те мо­дели объектов и те положения модели камеры, для которых сгенерированные изображения объектов дают характеристики, близкие к характеристикам, вычисленным для фактически наблюдаемого изображения. Совпадение значений характеристик, конечно, не гарантирует совпадения изображений. Однако, если значения характеристики не совпадают, то заведомо не совпадают и изобра­жения.

Задача второго этапа состоит в том, чтобы среди всех этих  изображений выбрать такие, которые дают форму силуэта объекта, близкую к форме силуэта объекта для фактически наблюдаемого изображения. Вопрос о близости формы силуэтов может решаться по-разному. В данном случае близость определяется  путём наилучшего совмещения двух контуров. Совпадение форм силуэтов (т.е. совпадение внешних контуров без обяза­тельного совпадения внутренних частей изображений) всё ещё не гарантирует совпадения изображений. Но несовпадение формы силуэтов, естественно, означает несовпадение изображений.

Для выбранных моделей объектов и уточненных положений модели камеры (которые вычисляются в соответствии с пово­ротом, сдвигом и изменением масштаба, которые получены при совме­щении контуров) генерируются  соответствующие изображения.

На третьем этапе осуществляется окончательное сопоставле­ние полных (с учётом яркостей) изображений объектов, получен­ных на втором этапе, с фактически наблюдаемым изображением. Поскольку изображения, участвующие в сопоставлении, таковы, что контуры объектов совмещены, то это сопоставление не вызыва­ет затруднений и сводится к некоторой разновидности простого поэлементного сопоставления. При этом выбираются изображения, у которых яркости в соответствующих точках близки к яркостям для фактически наблюдаемого изображения.

Заметим, что описанное сопоставление осуществляется толь­ко для изображений, полученных на втором этапе для расцвечен­ных моделей.

Наименование модели объекта, по которой было сгенерирова­но изображение, совпавшее с фактически наблюдаемым изображением и соответствующее положение модели камеры выдаются блоком распознавания в качестве наименования распознаваемого объекта и положения камеры относительно объекта при получении изо­бражения.

Блок генерации изображений по модели используется описан­ными вышеописанными блоками,  которые обращаются к нему всякий раз, когда требуется построить изображение какого - либо объекта.

На входе в этот блок задаются: модель объекта, параметры камеры, положение модели камеры в некоторой системе коор­динат, связанной с моделью объекта, условия освещения.  Сгене­рированное изображение выдаётся в виде двумерного массива яркос­тей. Алгоритм генерации изображения является растровым, т.е. в его основе лежит понятие окна растра, в пределах которого решается задача определения видимых поверхностей. В качестве окна растра может быть выбрана, например строка, и изображение выдается по строкам. При желании изображение может быть визуализировано посредством выдачи на экран компьютера.

Выводы: Исследованы системы распознавания трехмерных объектов. Дано описание предлагаемой экспериментальной системы машинного видения. Рассмотрен принцип работы системы. Построена диаграмма обобщенной системы распознавания трехмерных объектов

 

Литература

1. Мустафин С.А. Разработка и исследование математических методов, моделей и алгоритмов распознавания контуров трехмерных объектов//Автореф. диссертации канд. тех.наук. –Алматы: 2007. -23 с.

2. Роджерс Д. Алгоритмические основы машинной графики. – М.: Мир, 1989. – 503 с.

3.  Работы по машинному видению. - М.: Наука, 1988. - 222 с.