Современные информационные технологии/ 2. Вычислительная техника и программирование

 

Магистр естественных наук, Оспанов М.Г.

Костанайский государственный университет им. А.Байтурсынова, Казахстан

Распознавания рукописных арабских текстов

 

В последние десять лет появились несколько программ распознавания арабского языка, разработанных арабскими фирмами и использующихся арабоязычными странами, за исключением OMNI Page Pro от фирмы OMNI (США) выпускающей самую распространенную программу для распознавания английского языка. В настоящее время эти программы не пользуются спросом на рынке, за исключением Auto Reader компании Sakhr (Египет), дочерней корпорации Alamiya (Кувейт). Последние две версии этой программы продаются только со специальной электронной карточкой в целях защиты. Однако, в скором времени филиал всемирно известной компании IBM в Египте должен выпустить (или уже выпустил) свой продукт для распознавания арабского языка. [1]

Распознаванием образов называют задачи отнесения оцениваемых объектов к каким-либо классам. Когда говорить о компьютерном распознавании, то имеется в виду способность машины (компьютера), "понимать", что представлено ему на рассмотрение. Любая задача распознавания изображений сводится к самостоятельной классификации машиной изображения, без помощи человека.

Более формально задача распознавания (классификации) объекта может быть сформулирована следующим образом. Имеется некоторый способ кодирования объектов (например, рукописных букв), принадлежащих заранее известному конечному множеству классов, и некоторое конечное множество объектов (обучающее множество), про каждый из которых известно, какому классу он принадлежит. Нужно рассмотреть алгоритм, который по любому входному объекту, не обязательно принадлежащему обучающему множеству, решает, какому классу этот объект принадлежит, и делает это достаточно хорошо. Качество распознавания оценивается как вероятность ошибки классификации на другом конечном множестве объектов с заранее известными ответами (тестовом множестве).

Можно выделить три типа задач распознавания образов. Первый тип - точно знать описания классов, к которым требуется отнести объекты, при этом все классы задаются строго и однозначно. Второй тип - знать число и описания классов, к которым требуется отнести объекты, но описания самих классов заданы нестрого. Третий тип - не знаем, объекты каких классов предстоит распознавать. Задачи первого типа компьютер решает наиболее успешно, задачи второго типа - с разной степенью, задачи третьего типа практически не решает, так как число классов для компьютерного распознавания всего сильно ограничено.

На пути развития этой теории, в результате обобщения опыта решения: значительного числа прикладных задач распознавания и осмысливания их экспериментальных результатов, были предложены статистические, алгебраические и логические методы распознавания образов.

В формирование этих методов огромный вклад внесли ученые Айзерман М.А., Бонгард М.М., Браверман Э.М., Вайнцвайг М.Н., Вапник В.П., Васильев В.И., Глушков В.М., Горелик А.Л., Журавлев Ю.И., Завалишин Н.В., Загоруйко Н.Г., Ивахненко А.Г., Камилов М.М., Ковалевский B.A., Дучник И.Б., Розоноэр Л.И., Турбович И.Т, Харкевич A.A., Цыпкин Я.З., Червоненкис А.Я., Шлезингер М.И., и зарубежные - Дуда P.O., Нейман Дж., Нильсон, Розенблатт Ф., Розенфельд А., Ту Дж., Фу К;С., Хант Э., Харт П.Е., и другие.[2]

В рамках этих методов созданы различные распознающие системы, принципы распознавания которых основаны на детерминистских и статистических алгоритмах распознавания, включающие в себя различные аппроксимационные подходы регрессионного и корреляционного анализа, алгебры логики и т.д. Эти системы, главным образом, предназначены для распознавания исследуемых образов и выработки решения типа "да", "нет", "не знаю" о принадлежности распознаваемых образов к определенному классу. При этом, решение принимается по конечным числом признаков, характеризующим поведение образа с определенными численными значениями или же по распределениям вероятностей значений этих признаков. Иначе говоря, в этих системах распознавание осуществляется по количественным характеристикам образов.

Отмеченные выше методы решения задач распознавания образов, как показала практика, оказались плодотворными в решении задач "незрительного" типа и лишь весьма простые "зрительные" задачи например, чтение машинописного текста, удалось решать в рамках вышеприведенных методов.

Анализ работ по методам структурного распознавания кривых показал, что эти методы в основном различаются друг от друга по правилам конструирования "фраз" (предложений), дающих описаний форм исследуемых кривых. Обычно эти правила, базируясь на результатах предварительного изучения особенностей форм исследуемых кривых и степени их изменчивости, заранее задаются самим исследователем. Это, как известно, приводит к снижению гибкости и универсальности систем структурного распознавания.

Многообещающими системами структурного распознавания являются те системы, которые по обучающим выборкам автоматически выводят грамматику языка структурного описания образов. Такие распознающие системы являются самообучающимися системами с достаточной гибкостью и широкой сферой применения.

 

Литература:

1. Ю.Кучуганов В.Н., Салюм С.С. Распознавание текстов арабского языка // Перспективные информационные технологии и интеллектуальные системы . № 4(16), http://pitis.tsure.ru.11.Лэйси Д.М. Visual С++ 6 Desktop. СПб.: Питер, 2001. - 725 с.

2. Ганиев С.К., Сангинов P.C. Алгебраический метод синтеза аналого-дискретных каналов обработки экспериментальных кривых.- Вопросы кибернетики, Ташкент, 1981, вып.116, с.143-153.