Гаджиев Т

Педагогические науки/2. Проблемы подготовки специалистов

К. ф.-м. н. Гаджиев Т.С.

Дагестанский государственный педагогический университет, Россия

О СИСТЕМЕ ДЛЯ ИЗУЧЕНИЯ

ПРОЦЕДУР РАСПОЗНАВАНИЯ

Теория распознавания образов – раздел информатики, развивающий теоретические основы и методы классификации и идентификации объектов, характеризующихся конечным набором некоторых свойств и признаков.

Распознавание образов – одна из самых распространенных задач, которую человеку приходится решать как в жизни, так и в практической деятельности.

Процесс распознавания представляет собой преобразование входной информации в выходную информацию, представляющую собой заключение об образе.

Примерами задач распознавания являются медицинская и техническая диагностики, некоторые проблемы прогнозирования ситуаций, сканирование и автоматический перевод текстов и т.д.

В зависимости от специфики проблемы и исходной информации формулировки задачи распознавания очень разнообразны. В общем виде задача распознавания заключается в следующем: имеется совокупность объектов, в соответствии с выбранным принципом классификации она подразделена на ряд классов; разработан априорный словарь признаков, на языке которого описывается каждый класс; определена цель и описывающий ее показатель эффективности процесса распознавания; с учетом имеющихся ограничений по ресурсам выбирается оптимальный набор признаков и строится алгоритм, позволяющий сопоставить апостериорные данные о неизвестном объекте с априорной информацией и на основе сопоставления определить, к какому классу он может быть отнесен.

В работах [1], [2], [5], [7] дается достаточно подробное описание ряда алгоритмов распознавания разных типов: детерминированные алгоритмы, осно-ванные на проведении в признаковом пространстве разделяющих границ, вероятностные алгоритмы, основанные на построении решающих правил, алгоритмы распознавания в условиях неопределенности, связанные с вычисле-нием гарантированных оценок.

Наличие разных алгоритмов распознавания поставило вопрос о выборе в каждом конкретном случае наилучшего алгоритма. Эта задача была поставлена академиком РАН Ю.И. Журавлевым, предложившим и подход к ее решению, который получил название алгебраического подхода к решению задач распознавания и классификации. Рассмотрим кратко его суть.

Когда на вход системы распознавания поступает неизвестный объект, то процедура его отнесения к соответствующему классу может быть подразде-лена на два этапа.

На первом этапе вычисляется мера близости неизвестного объекта с каждым классом в соответствующей метрике, а на втором – в соответствии с тем или иным правилом принимается окончательное решение о принадлеж-ности объекта к соответствующему классу.

Соответственно этим этапам любой алгоритм распознавания может быть представлен в виде последовательно выполняемых алгоритмов и

Алгоритм переводит исходную информацию об объектах в числовую матрицу размерности где общее число объектов; число классов.

Алгоритм переводит полученную матрицу в матрицу ответов той же размерности, составляющую из символов Ø. (объект принадлежит к данному классу, объект не относится к данному классу, Ø – не установлено, относится объект к данному классу или нет [6].

В работе [3] разработан метод построения плоских образов конечных точечных метрических конфигураций, а также создана программная система для изучения процедур распознавания на основе синтеза плоских представ-лений метрических конфигураций.

В данной статье продолжаются исследования, изложенные в работе [3].

1. Модули порождения тестовых конфигураций

Модули предназначены для порождения и синтеза плоских представ-лений конечных многомерных точечных конфигураций.

В диалоговом режиме на вход алгоритма порождения подаются значения размерности порождаемой конфигурации, количества точек 1–го и 2–го классов, вид и параметры конфигурации, уровень шума.

Модуль порождения формирует, используя датчик случайных чисел, требуемый массив точек и записывает их в файл для дальнейшего использо-вания.

Модуль синтеза плоского представления конечной конфигурации, получая на вход имя файла, содержащего конфигурацию, формирует плоское представление, выводит его на экран и записывает плоские координаты представляющих точек в соответствующий файл.

Результаты работы модулей представлены на рис. 1, 2.

Рис. 1. 2 класса по 50 точек; размерность 3;

шары радиуса 300 с расстоянием между центрами 200

Рис. 2. 2 класса по 50 точек; размерность 4;

шары радиуса 300 с расстоянием между центрами 200

2. Модули синтеза плоских представлений

Модули предназначены для синтеза плотных плоских представлений конечных многомерных точечных конфигураций.

В диалоговом режиме на вход алгоритма заполнения подается значение параметра определяющего максимальную допустимую площадь треуголь-ника в триангуляции выпуклой оболочки начальной конфигурации.

На первом шаге процедура формирует выпуклые оболочки, а на втором шаге полученные слои подвергаются процедуре триангуляции. Далее всем треугольникам площади большей сопоставляются новые точки в исходном пространстве, и производится их оптимальное размещение на представляющей плоскости.

Указанные шаги повторяются вплоть до ситуации, когда максимальная из площадей треугольников не превышает значения параметра

Расширенная конфигурация и результат ее представления записывается при окончании работы в соответствующий файл.

Результаты работы модулей представлены на рис. 3, 4, 5.

Рис. 3. Выпуклые оболочки: 2 класса по 50 точек; размерность 10;

шары радиуса 200 с расстоянием между центрами 100

Рис. 4. Триангуляция конфигурации, изображенной на рис. 3

Рис. 5. плотная конфигурация, порожденная

по начальной конфигурации, представленной на рис. 3

3. Результаты работы алгоритмов распознавания

С точечными конфигурациями, порожденными описанными выше модулями проводились эксперименты по настройке и демонстрации результа-тов работы некоторых алгоритмов распознавания.

Следует отметить экспериментально наблюдающееся повышение качества решения при возрастании размерности задач.

Рис. 6. Результат работы метода потенциальных функций

на конфигурации, представленной на рис. 5

Литература:

1. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. – М, 1974.

2. Горелик А.Л., Скрипкин В.А. Методы распознавания. – М ., 2004.

3. Гаджиев Т.С. Методика изучения процедур распознавания на основе синтеза плоских представлений метрических конфигураций //Диссертация на соискание ученой степени к.ф.-м.н. – М., МПГУ, 1996.

4. Матросов В.Л., Горелик В.А., Жданов С.А. Теоретические основы информатики. – М., 2009.

5. Патрик Э. Основы теории распознавания образов. – М., 1980.

6. Распознавание, классификация, прогноз // Под ред. Ю.И. Журавлева. – М., 1989.

7. Ту Дж., Гонсалес Р. Принципы распознавания образов. – М., 1978.