Современные информационные технологии/2 вычислительная техника и программирование

К.т.н., прф. Пинт Э.М., к.т.н., доц. Романенко И.И., к.т.н., доц. Еличев К.А.

Пензенский государственный университет архитектуры и строительства

Основные особенности читающей системы

В статье рассматривается оригинальное устройство восприятия и распознавания печатных знаков разных шрифтов и других символов. Устройство состоит из фотоэлектронной системы считывания и компьютера. Достоинствами разработанного устройства являются: относительная простота реализации,  сравнительно небольшое количество операций, необходимых компьютеру для распознавания печатного знака и способность распознавать знаки разных печатных шрифтов и другие символы.

С помощью фотоэлектронной системы считывания изображение печатного знака преобразуется в электрические импульсы, поступающие в определенном порядке в запоминающее устройство компьютера. Печатный знак оказывается как бы вписанным в дискретную прямоугольную матрицу, состоящую из ячеек запоминающего устройства. В этой матрице заполненные ячейки соответствуют элементам изображения знака.

Для компьютера была разработана программа, реализующая оригинальный метод распознавания печатных знаков разных шрифтов [1]. Программа состоит из следующих основных частей: обход вписанного в матрицу печатного знака по главным направлениям, стирание заполненных ячеек, составляющих толщину элементов знака, ликвидация нехарактерных отклонений горизонтальных, вертикальных, наклонных линий знака, определение типа печатного знака. Рассмотрим кратко эти части, а затем – фотоэлектронную систему считывания.

По программе компьютер определяет в матрице заполненную ячейку с наименьшим номером. Затем, начиная с этой ячейки, компьютер обходит дискретно представленный в матрице знак по главным направлениям или по контуру. Поскольку линии контура знака имеют толщину, которая к тому же непостоянна для разных знаков, нужно выделять главные направления и совершать обход по ним, не учитывая направления, возникающие от толщины линий знака, от декоративных украшений, дефектов и пр. Главное направление выбиралось как направление, имеющее количество заполненных ячеек матрицы больше или равное весу, а вес (определенное количество ячеек матрицы) должен быть хотя бы на одну ячейку больше количества ячеек, составляющих толщину линий знака.

Было выбрано восемь главных направлений, которые идут по окружности под углом 450 друг к другу.  Каждое направление имеет свой номер. Компьютер для каждой заполненной ячейки матрицы отыскивает возможные направления, образуемые соседними с исследуемой заполненными ячейками по всем восьми направлениям с целью последующего перехода по главному направлению на соседнюю заполненную ячейку, для которой описанный процесс повторяется. Печатный знак после обхода по контуру представляется в виде последовательности, состоящей из номеров главных направлений.

Во время обхода знака по главным направлениям производится стирание содержимого заполненных ячеек, составляющих толщину линий знака. Это делается для того, чтобы толщина линий знака не изменяла направление обхода (в противном случае линия будет обходиться несколько раз). Стирание по толщине дало возможность распознавать печатные знаки с разными толщинами линий.

После обхода знака по контуру полученная последовательность направлений упрощается с целью исключения нехарактерных наклонов горизонтальных и вертикальных линий знака и исключения нехарактерных отклонений наклонных линий. Эти операции ликвидируют также определенные дефекты, например, размывы линий знака, наплывы.

Для определения типа знака полученная упрощенная запись знака по направлениям сравнивается со стандартными видами печатных знаков. Каждому печатному знаку одного смыслового символа и определенного стиля написания независимо от шрифта соответствует определенный стандартный вид. Стандартный вид определяется последовательностью номеров главных направлений, полученной после обхода идеального контура определенного типа знака.

При сравнении упрощенной записи знака по направлениям с каждым стандартным видом подсчитывается количество несовпадений номеров записи знака по направлениям и по наименьшему количеству несовпадений определяется тип печатного знака.

В результате эксперимента для восприятия печатных знаков была выбрана оптимальная матрица, состоящая из 31х31 ячеек запоминающего устройства компьютера по следующим соображениям: для матрицы, состоящей из 25х25 ячеек все печатные знаки разных шрифтов распознавались, количество стандартных видов печатных знаков  для этой матрицы (25х25 ячеек) сравнительно мало, матрица выбрана с запасом, т.е. из 31х31 ячеек на случай возможного смещения знаков по горизонтали или вертикали.

Структурная схема фотоэлектронной системы считывания включает следующие основные элементы: видикон, генераторы строчной и кадровой разверток, широкополосный усилитель, триггер Шмидта, пересчетное устройство, состоящее из счетчика импульсов и дешифратора, схему совпадений. Генераторы строчной и кадровой разверток создают растр на экране видикона. Электрические сигналы, соответсвующие изображению печатного знака, с нагрузки видикона поступают на усилитель, а с него – на триггер Шмидта, преобразующий эти сигналы в прямоугольные электрические импульсы. Под действием генератора запуска пересчетное устройство также вырабатывает прямоугольные электрические импульсы. На входы схемы совпадений поступают импульсы соответсвенно с триггера Шмидта и с пересчетного устройства. При совпадении этих импульсов во времени схема совпадений вырабатывает прямоугольные импульсы, поступающие в матрицу запоминающего устройства компьютера.

В системе считывания электрические сигналы, создаваемые генераторами строчной и кадровой разверток синхронизированы во времени. Когда исследовались различные матрицы на распознаваемость печатных знаков, синхронизация изменялась. Рассмотрим кратко синхронизацию сигналов для оптимальной матрицы, состоящей из 31х31 ячеек. Генераторы строчной и кадровой разверток по схеме включают в себя мультивибратор, работающий в режиме синхронизации и генератор линейно изменяющегося тока. На экране видикона генератором строчной развертки создается 31 строка за время действия импульса генератора кадровой развертки. Синхронизация осуществляется путем воздействия на мултивибраторы генераторов строчной и кадровой разверток импульсов, снимаемых соответственно с разных выходов дешифратора (для образования обратного хода линейно изменяющихся токов).

Разработанное устройство было исследовано экспериментально.

Предлагаемое авторами устройство может быть использовано для обработки информации, полученной в результате инженерных разработок в промышленности, на транспорте, при строительстве объектов. Разработанное устройство можно распространить на распознавание других образов, например, специальных знаков, что позволит автоматизировать работу дорожных машин, автомобилей [2].

 

Литературы:

1.           Пинт Э.М., Яшин А.В., Еличев К.А., Козицын В.С. Оригинальный алгоритм распознавания компьютером кодовой записи направлений контура печатного знака. MATERYALY VI MEDZYNARODOWEJ NAUKOWIPRAKTYCZNEJ KONFERENCI "NAUKOWA PRZESTRZECEUROPY – 2010". – Przemysl: Nauka i studia, 2010, - c. 104.

2.           Пинт Э.М., Романенко И.И., Петровнина И.Н., Еличев К.А.. Управление рабочими органами дорожных машин за счет устройства восприятия и распознавания печатных знаков и символов. Материалы международной научно-практической конференции «Новые дороги России» - Пенза: Изд. ПГУАС, 2011, - с. 606.