Педагогические науки/2. Проблемы подготовки специалистов

К. ф.-м. н.  Гаджиев Т.С. 

Дагестанский государственный педагогический университет, Россия

О СИСТЕМЕ ДЛЯ ИЗУЧЕНИЯ

ПРОЦЕДУР РАСПОЗНАВАНИЯ

Теория распознавания образов – раздел информатики, развивающий теоретические основы и методы классификации и идентификации объектов, характеризующихся конечным набором некоторых свойств и признаков.

Распознавание образов – одна из самых распространенных задач, которую человеку приходится решать как в жизни, так и в практической деятельности.

Процесс распознавания представляет собой преобразование входной информации в выходную информацию, представляющую собой заключение об образе.

Примерами задач распознавания являются медицинская и техническая диагностики, некоторые проблемы прогнозирования ситуаций, сканирование и автоматический перевод текстов и т.д.

В зависимости от специфики проблемы и исходной информации  формулировки задачи распознавания очень разнообразны. В общем виде задача распознавания заключается в следующем: имеется совокупность объектов, в соответствии с выбранным принципом классификации она подразделена на ряд классов; разработан априорный словарь признаков, на языке которого описывается каждый класс; определена цель и описывающий ее показатель эффективности процесса распознавания; с учетом имеющихся  ограничений по ресурсам выбирается оптимальный набор признаков и строится алгоритм, позволяющий сопоставить апостериорные данные о неизвестном объекте с априорной информацией и на основе сопоставления определить, к какому классу он может быть отнесен.

В  работах [1], [2], [5], [7] дается достаточно подробное описание ряда алгоритмов распознавания разных типов: детерминированные алгоритмы, осно-ванные на проведении в признаковом пространстве разделяющих границ, вероятностные алгоритмы, основанные на построении решающих правил, алгоритмы распознавания в условиях неопределенности, связанные с вычисле-нием гарантированных оценок.

Наличие разных алгоритмов распознавания поставило вопрос о выборе в каждом конкретном случае наилучшего алгоритма. Эта задача была поставлена академиком РАН Ю.И. Журавлевым, предложившим и подход к ее решению, который получил название алгебраического подхода к решению задач распознавания и классификации. Рассмотрим кратко его суть.

Когда на вход системы распознавания поступает неизвестный объект, то процедура его отнесения к соответствующему классу может быть подразде-лена на два этапа.

На первом этапе вычисляется мера близости неизвестного объекта с каждым классом в соответствующей метрике, а на втором –  в  соответствии с тем или иным правилом принимается окончательное решение о принадлеж-ности объекта к соответствующему классу.

Соответственно этим этапам любой алгоритм распознавания  может быть представлен в виде последовательно выполняемых алгоритмов   и

Алгоритм  переводит исходную информацию об объектах в числовую матрицу размерности  где общее число объектов;  число классов.

Алгоритм  переводит полученную матрицу в матрицу ответов той же размерности, составляющую из символов  Ø. (объект принадлежит к данному классу, объект не относится к данному классу, Ø – не установлено, относится объект к данному классу или нет [6].

В работе  [3]  разработан метод построения плоских образов конечных точечных метрических конфигураций, а также создана программная система для изучения процедур распознавания на основе синтеза плоских представ-лений метрических конфигураций. 

В данной статье продолжаются исследования, изложенные в работе [3].

1.  Модули порождения тестовых конфигураций

Модули предназначены для порождения и синтеза плоских представ-лений конечных многомерных точечных конфигураций.

В диалоговом режиме на вход алгоритма порождения подаются значения размерности порождаемой конфигурации,  количества точек 1–го и  2–го классов, вид и параметры конфигурации, уровень шума.

Модуль порождения формирует, используя датчик случайных чисел, требуемый массив точек и записывает их в файл для дальнейшего использо-вания.

Модуль синтеза плоского представления конечной конфигурации, получая на вход имя файла, содержащего конфигурацию, формирует плоское представление, выводит его на экран и записывает плоские координаты представляющих точек в соответствующий файл.

Результаты работы модулей представлены на рис. 1, 2.

Рис. 1.  2 класса по 50 точек; размерность 3;

шары радиуса 300 с расстоянием между центрами 200

 

Рис. 2.  2 класса по 50 точек; размерность 4;

шары радиуса 300 с расстоянием между центрами 200

2.  Модули синтеза плоских представлений

Модули предназначены для синтеза плотных плоских представлений конечных многомерных точечных конфигураций.

В диалоговом режиме на вход алгоритма заполнения подается значение параметра  определяющего максимальную допустимую площадь треуголь-ника в триангуляции выпуклой оболочки начальной конфигурации.

На первом шаге процедура формирует выпуклые оболочки, а на втором шаге полученные слои подвергаются процедуре триангуляции. Далее всем треугольникам площади большей  сопоставляются новые точки в исходном пространстве, и производится их оптимальное размещение на представляющей плоскости.

Указанные шаги повторяются вплоть до ситуации, когда максимальная из площадей треугольников не превышает значения параметра 

Расширенная конфигурация и результат ее представления записывается при окончании работы в соответствующий файл.

Результаты работы модулей представлены на рис. 3, 4, 5.

Рис. 3.  Выпуклые оболочки: 2 класса по 50 точек; размерность 10;

шары радиуса 200 с расстоянием между центрами 100

 

Рис. 4.  Триангуляция конфигурации, изображенной на рис. 3 

Рис. 5.    плотная конфигурация, порожденная

по начальной конфигурации, представленной на рис. 3 

 

3.   Результаты работы алгоритмов распознавания

С точечными конфигурациями, порожденными описанными выше модулями проводились эксперименты по настройке и демонстрации результа-тов работы некоторых алгоритмов распознавания.

Следует отметить экспериментально наблюдающееся повышение качества решения при возрастании размерности задач.

Рис. 6.  Результат работы метода потенциальных функций

на конфигурации, представленной на рис. 5 

 

Литература:

1.   Вапник В.Н., Червоненкис А.Я. Теория  распознавания образов. – М, 1974.

2.   Горелик А.Л., Скрипкин В.А. Методы распознавания. – М ., 2004.

3.   Гаджиев Т.С. Методика изучения процедур распознавания на основе синтеза плоских представлений метрических конфигураций //Диссертация на соискание ученой степени к.ф.-м.н. – М., МПГУ, 1996.

4.   Матросов В.Л., Горелик В.А., Жданов С.А. Теоретические основы информатики. – М., 2009.

5.   Патрик Э. Основы теории распознавания образов. – М., 1980.

6.   Распознавание, классификация, прогноз // Под  ред. Ю.И. Журавлева. – М., 1989.

7.   Ту Дж., Гонсалес Р. Принципы распознавания образов. – М., 1978.