Математика/5. Перспективы информационных систем.
магистрант Калыбаева А.К.
Атырауский институт нефти и газа, Республика Казахстан
Системы распознавания трехмерных
объектов
Рассмотрим
описание предлагаемой экспериментальной системы машинного видения. При разработке системы предполагалось, что она будет
способна выполнять следующие операции:
1) на этапе обучения система получает
несколько полутоновых изображений объекта (рассматривает его и знакомится с
ним). Объект может иметь криволинейные
поверхности, и различные участки поверхности могут иметь различную
отражательную способность. После того, как система ознакомилась с одним
объектом, подается другой объект и т.д.
2) на этапе распознавания система получает
полутоновое изображение объекта, по которому она должна идентифицировать
объекты - указать его приблизительное положение и ориентацию в пространстве
относительно ТВ – камеры (далее просто камера). Объекты, предъявляемые на этапе
распознавания, тождественны объектам, показанным на этапе обучения. Однако,
изображение объекта, получаемое на этапе распознавания, может соответствовать
точке наблюдения, совершенно отличной от точек наблюдения, использованных на этапе
обучения.
Рассмотрим работу системы. На этапе
подготовки происходит построение моделей, соответствующих объектам, подаваемых
на обучение и распознавание. На этапе распознавания набор моделей различных
объектов, которые предъявляются при обучении, используется для идентификации
модели неизвестного объекта и определения его положения в пространстве. При
этом ищется такая модель и такое положение модели в пространстве, при которых
проектирование на картинную плоскость
даёт изображение, близкое к
фактически наблюдаемому изображению. Таким образом, на этапе
распознавания реализуется принцип анализа через синтез. Такой подход хорошо
соответствует современным представлениям о человеческом зрении [1].
Ниже приводится общее описание системы, а
также описание используемых в системе вычислительных блоков.
Система состоит из ряда блоков – блок
построения модели объекта, блок расцветки модели объекта, блок обучения
распознаванию изображений объекта, блок распознавания изображений объекта, блок
генерации изображений по модели.

Рисунок 1 - Диаграмма обобщенной системы распознавания
трехмерных объектов
Блоки связаны между собой через базу
данных. В базе данных могут храниться
изображения, модели и характеристики. Изображения и модели могут записываться в
базу данных извне, изображения могут поступать, в частности, от камеры, модели
могут вводиться пользователем и вырабатываться блоками системы случайно.
Характеристики вырабатываются блоком обучения машины распознаванию изображений
объектов и представляют собой простые признаки, помогающие выбирать подходящую
модель объекта на этапе распознавания.
Блок построения пространственной модели
объекта по его изображениям получает на входе несколько изображений объекта,
параметры камеры, положения камеры при получении исходных изображений объекта в некоторой системе координат, связанной
с объектом. Здесь и далее под изображением понимается центральное полутоновое
изображение, представленное в виде двумерного массива яркостей. К параметрам
камера относятся: фокусное расстояние, размеры растра, число элементов растра,
число градаций яркости, квантованная
шкала значений яркости. Положение камеры определяется положением относительной
системы координат, центр которой совпадает с центром растра, одна из осей
совпадает с направлением наблюдения, а две другие оси параллельны сторонам растра.
В результате работы этого блока строится
трёхмерная модель объекта. Под моделью объекта подразумевается многогранник, заданный
в виде набора плоских многоугольников, аппроксимирующих поверхность объекта.
При этом возможна различная точность воспроизведения объекта в модели. Мы
можем получать грубые модели объектов или строить модели, содержащие большое
количество многоугольников, аппроксимирующих произвольные криволинейные
поверхности объекта. В дальнейшем каждому многоугольнику приписывается некоторая
отражательная способность, воспроизводящая реальную отражательную способность
соответствующего элемента поверхности объекта.
Модель объекта может быть построена
разными способами. В системе применяется метод построения модели объекта по
внешним контурам (силуэтам) объекта, представленным на изображениях, полученных
из различных точек наблюдения. Для каждого изображения строится конус с
вершиной в точке наблюдения, направляющей для которого служит контур, а
основание достаточно удалено (если контур аппроксимирован ломаной, то мы
получаем пирамиду). Далее находится их общее пересечение. В результате
будет построена модель, дающая правильные силуэты объекта из указанных точек
наблюдения [2].
Блок обучения распознаванию изображений объекта
получает на входе модель объекта, параметры камеры и те условия освещения,
которые далее будут использованы при распознавании.
В результате работы этого блока формируется массив
характеристик. В качестве характеристик используются отношения: площади,
ограниченной контуром, к квадрату
периметра; максимального радиуса, проведённого из центра тяжести
контура к периметру; минимального радиуса, проведённого из центра тяжести
контура, к максимальному радиусу; среднего радиуса к максимальному радиусу.
Блок обучения использует сгенерированные изображения
объекта для того, чтобы вычислить ряд характеристик. Число точек наблюдения
выбирается достаточно большое, обеспечивая всесторонний и равномерный осмотр
модели. При этом характеристики, полученные для рассматриваемой модели объекта,
добавляются к характеристикам моделей, которые ранее участвовали в обучении.
Каждый набор характеристик запоминается вместе с наименованием модели, для
которой она получена, и положением модели камеры относительно модели объекта
при получении данного набора характеристик.
Блок распознавания изображений трехмерных объектов. На
входе в этот блок задаётся изображение объекта. Распознавание проводится среди
группы объектов, распознаванию каждого из которых машина была ранее обучена.
Распознать объект на изображении - значит идентифицировать его и указать его
приблизительное положение в пространстве относительно камеры при получении данного изображения.
Расположение естественно указывать в координатах камеры. Но можно определить
положение камеры в координатах объекта. Оба способа, очевидно, равноценны.
Блок распознавания ищет такую модель объекта и такое
положение модели камеры относительно модели объекта, при которых генерируемое
изображение оказывается близким к фактически наблюдаемому изображению. Эта
задача решается в 3 этапа, причём на каждом последующем этапе уточняется решение,
полученное на предыдущем этапе. Близкий подход был использован в работах
[3].
На первом этапе блок распознавания, используя массив
характеристик, сформированный блоком обучения, выбирает те модели объектов и
те положения модели камеры, для которых
сгенерированные изображения объектов дают характеристики, близкие к
характеристикам, вычисленным для фактически
наблюдаемого изображения. Совпадение значений характеристик, конечно, не гарантирует
совпадения изображений. Однако, если значения характеристики не совпадают, то
заведомо не совпадают и изображения.
Задача второго этапа состоит в том, чтобы среди всех
этих изображений выбрать такие, которые
дают форму силуэта объекта, близкую к форме силуэта объекта для фактически
наблюдаемого изображения. Вопрос о близости формы силуэтов может решаться
по-разному. В данном случае близость определяется путём наилучшего совмещения двух контуров. Совпадение форм
силуэтов (т.е. совпадение внешних контуров без обязательного совпадения
внутренних частей изображений) всё ещё не гарантирует совпадения изображений.
Но несовпадение формы силуэтов, естественно, означает несовпадение изображений.
Для выбранных моделей объектов и уточненных положений
модели камеры (которые вычисляются в соответствии с поворотом, сдвигом и
изменением масштаба, которые получены при совмещении контуров)
генерируются соответствующие
изображения.
На третьем этапе осуществляется окончательное
сопоставление полных (с учётом яркостей) изображений объектов, полученных на
втором этапе, с фактически наблюдаемым изображением. Поскольку изображения,
участвующие в сопоставлении, таковы, что контуры объектов совмещены, то это
сопоставление не вызывает затруднений и сводится к некоторой разновидности
простого поэлементного сопоставления. При этом выбираются изображения, у
которых яркости в соответствующих точках близки к яркостям для фактически
наблюдаемого изображения.
Заметим, что описанное сопоставление осуществляется
только для изображений,
полученных на втором этапе для расцвеченных
моделей.
Наименование модели объекта, по которой было
сгенерировано изображение, совпавшее с фактически наблюдаемым изображением и
соответствующее положение модели камеры выдаются блоком распознавания в
качестве наименования распознаваемого объекта и положения камеры относительно
объекта при получении изображения.
Блок генерации изображений по модели используется
описанными вышеописанными блоками, которые
обращаются к нему всякий раз, когда требуется построить изображение какого -
либо объекта.
На входе в этот блок задаются: модель объекта,
параметры камеры, положение модели камеры в некоторой системе координат,
связанной с моделью объекта, условия освещения. Сгенерированное изображение выдаётся в виде двумерного массива
яркостей. Алгоритм генерации изображения является растровым, т.е. в его основе
лежит понятие окна растра, в пределах которого решается задача определения
видимых поверхностей. В качестве окна растра может быть выбрана, например
строка, и изображение выдается по строкам. При желании изображение может быть
визуализировано посредством выдачи на экран компьютера.
Выводы: Исследованы системы распознавания
трехмерных объектов. Дано описание
предлагаемой экспериментальной системы машинного видения. Рассмотрен принцип
работы системы. Построена диаграмма обобщенной системы распознавания
трехмерных объектов
Литература
1. Мустафин С.А. Разработка и исследование математических методов,
моделей и алгоритмов распознавания контуров трехмерных объектов//Автореф.
диссертации канд. тех.наук. –Алматы: 2007. -23 с.
2. Роджерс Д. Алгоритмические основы машинной графики. – М.: Мир, 1989. –
503 с.
3. Работы по машинному видению. - М.: Наука, 1988. - 222 с.