Современные информационные технологии/3. Программное обеспечение

 

К.т.н. Усманова И.В., Сафьянова М.Е., Соколова О.Г.

Пензенский государственный университет, Россия

Интеллектуальные компоненты автоматизированной системы аудита делопроизводства организации

 

Рациональная организация документооборота требует основательного анализа документальной и управленческой деятельности, а также всех сопровождающих ее процессов. Совершенствование документооборота приводит к значительной экономии рабочего времени и материальных ресурсов.

В ходе реализации бизнес-процессов образуются документы, которые оказывают непосредственное влияние на их эффективность. Такая зависимость, как правило, носит смысловой характер. Поэтому задача анализа документооборота заключается в применении эвристических правил, то есть эмпирических правил или упрощений, отражающих положительный опыт работы специалистов и значительно ограничивающих поиск решений. Эта задача может быть решена при помощи экспертных систем.

Основу экспертной системы составляет база знаний, информация в которой  накапливается все время существования системы. Знания выражаются в явном виде и организованы таким образом, чтобы упростить принятие решений. Они обладают такой же ценностью, как и любой большой объем знаний.

Очевидно, что основу базы знаний должны составлять общепринятые термины и понятия, понимаемые одинаково всеми специалистами в области документооборота [1]. Поэтому для выделения понятий следует использовать, прежде всего, сведения из ГОСТов, Федеральных Законов и нормативных документов различного уровня, а также из общепризнанных в данной области библиографических источников.

Кроме базы знаний, в экспертную систему входят следующие основные подсистемы:

1) подсистема логического вывода - обеспечивает формирование заключений о вводимых фактах, воспринимая их как часть правил, содержащихся в системе;

2) подсистема пополнения и редактирования знаний – позволяет автоматизировать процесс наполнения экспертной системы знаниями, осуществляемый пользователем-экспертом, и адаптации базы знаний системы к условиям ее функционирования. Подсистема пополнения и редактирования знаний предназначена для добавления в базу знаний новой информации и редактирования имеющейся. Цель экспертной системы – вывести некоторый новый, либо опровергнуть существующий факт. Поскольку в условиях рыночной экономики предприятия и организации стремятся расширять номенклатуру выпускаемых товаров и оказываемых услуг, для достижения поставленной цели база знаний также должна синхронно изменяться и соответствовать особенностям внутренней и внешней среды организации;

 3) подсистема объяснения - демонстрирует последовательность логического вывода, с помощью которой  получено решение задачи (или не получено). Это облегчает эксперту тестирование системы и повышает доверие пользователя к полученному результату.

Взаимодействие перечисленных компонентов показано на рисунке 1.

Рисунок 1 - Взаимодействие основных компонентов экспертной системы

Модель представления знаний применительно к анализу документооборота необходима для прогнозирования показателей эффективности работы организации, зависящих от особенностей движения документов.

Узлами семантической сети логического вывода являются семантические утверждения. Это предложения естественного языка, включающие понятия, актуальные для конкретной предметной области, в данном случае для документационного обеспечения управления, и фиксирующие некоторые нарушения. Рассмотрим следующие семантические утверждения: «Количество виз согласования избыточно», «Время на обработку документа увеличивается», «Подготовка учебного плана по специальности задерживается».

Причинно-следственные связи между этими узлами будут представлять собой выражения вида ЕСЛИ … ТО, например, ЕСЛИ «Количество виз согласования избыточно», ТО «Время на обработку документа увеличивается»; ЕСЛИ «Время на обработку документа увеличивается», ТО «Подготовка учебного плана по специальности задерживается».

Такая модель представления знаний позволяет установить взаимосвязь бизнес-процессов и операций, проводимых с документами, а также позволяет выявить недостатки работы организации и повысить эффективность показателей, уровень которых находится не на должном уровне.

Семантические утверждения могут принимать значения «истина» или «ложь» в зависимости от особенностей текущей ситуации. Формулировка семантических утверждений основывается на достоверной информации о составе и маршрутах движения документов в организации и позволяет оценить состояние документооборота организации «от документов» и «от процессов» [2].

Вычисление значений семантических утверждений может производиться различными способами:

1.                 Для семантических утверждений вида «Подготовка учебного плана по специальности задерживается» могут быть созданы обычные запросы базы данных.

2.                 Для вычисления значений семантических утверждений, содержащих нечеткие оценки типа «велико», «мало», необходима предварительная настройка экспертной системы на особенности конкретного предприятия и разработка специальных программных модулей.  

Для организации логического вывода в системах автоматизированного анализа документооборота наиболее пригоден прямой поиск в глубину с возможностью задания активного фокуса сети.

Одним из условий эффективности экспертной системы является поддержание базы знаний в актуальном состоянии. Ниже рассматриваются основные операции редактирования и пополнения знаний (добавление и удаление) на примере сферы документационного обеспечения управления.

Аппарат семантических сетей позволяет охарактеризовать смысловые отношения между отдельными понятиями. Смысл связей во многом определяется спецификой предметной области. Обратимся к ГОСТ Р 51141-98 «Делопроизводство и архивное дело. Термины и определения» и проанализируем структуру определения термина «документ»: «Документ – это зафиксированная на материальном носителе информация, с реквизитами, позволяющими её идентифицировать». Данное определение включает термины «носитель» и «реквизит» (связь типа «включает»).

Носитель – это материальный объект, используемый для закрепления и хранения на нем речевой, звуковой или изобразительной информации, в том числе в преобразованном виде. Поэтому выделим текстовую, звуковую, числовую и графическую информацию.

Информация может быть зафиксирована на бумажном и электронном носителе (многозначность – связь типа «может быть»).

В ГОСТ Р 51141-98 выделены несколько видов документов: графический документ, аудиовизуальный документ, фотодокумент, кинодокумент, текстовый документ (многозначность – связь типа «может быть»).

Реквизит – это обязательный элемент оформления официального документа. Данный термин входит в определение термина «документ» (связь типа «входит»).

Исходя из определения, документ не может существовать без информации. Понятие «информация» является вспомогательным для определения основного термина «документ» (связь – типа «описывает»).

Фрагмент семантической сети, описывающий компоненты определения понятия «документ», приведён на рисунке 2.

Рисунок 2 – Фрагмент семантической сети, описывающий понятие «документ»

Предположим, что необходимо добавить в базу знаний новое понятие, например, «электронный документ».

Сначала проверяем наличие этого понятия в базе знаний. Только после того, как убедились в отсутствии этого понятия, можно приступать к дальнейшим действиям.

Целесообразно производить анализ фрагментов сети с помощью математического аппарата теории графов.

Пусть D2 – подграф для понятия «документ», а D3 – подграф «электронный документ», тогда , где D1  - подграф «способ представления документа».

Для иллюстрации проанализируем определение термина «электронный документ».

В соответствии с проектом Федерального закона «Об электронном документе» электронный документ – форма подготовки, отправления, получения или хранения информации с помощью электронных технических средств, зафиксированная на магнитном диске, магнитной ленте, лазерном диске и ином электронном материальном носителе.

Данное понятие включает в себя термин «носитель» (связь –  типа «включает»). Согласно данному определению в качестве электронного носителя могут выступать магнитный диск, магнитная лента, лазерный диск, флеш-карта, дискета, внешний жесткий диск (связь типа «может быть»).

Исходя из определения, электронный документ также не может существовать без информации. Понятие «информация» является вспомогательным для определения основного термина «электронный документ» (связь – «описывает»). Кроме того, выделяются операции, производимые с информацией, такие, как подготовка, отправление, получение или хранение (связь типа «может быть»).

Электронный документ обязательно включает в себя реквизиты (связь типа «включает»). Данный термин входит в определение термина «электронный документ» (связь типа «входит»).

Фрагмент семантической сети, описывающий компоненты определения понятия «электронный документ» и представляющий собой подграф понятия «электронный документ», приведён на рисунке 3.

С помощью операции объединения подграфов понятий «документ» и «электронный документ» создана более широкая, наполненная новыми понятиями семантическая сеть, компонентами которой являются все составляющие данных терминов.

Таким образом происходит пополнение уже существующей базы знаний новыми элементами. Фрагмент семантической сети, описывающий понятие «способ представления документа», приведён на рисунке 4.

Рисунок 3 – Фрагмент семантической сети, описывающий понятие «электронный документ»

Предположим, что организация использует в качестве электронного носителя информации только лазерный диск, флеш-карту и внешний жесткий диск, а такие элементы, как магнитная лента, магнитный диск и дискета устарели и не применяются в ее деятельности. Следовательно, нет необходимости присутствия этих понятий в базе знаний и эти компоненты нужно удалить из семантической сети понятий.

 Рисунок 4 – Подграф «Способ представления документа»

Пусть D2 – подграф для понятия «носитель», а D3 – подграф «устаревшие носители», тогда D1=D2\D3, где D1  – подграф «используемые носители».

Проиллюстрируем операцию удаления понятий из базы знаний на примере подграфа D3.  Подграф «носитель» представляет собой отдельную часть подграфа «Способ представления документа» и представлен на рисунке 5.

Рисунок 5 – Подграф понятия «носитель»

Подграф «устаревшие носители», содержащий понятия, которые необходимо удалить из базы знаний, представлен на рисунке 6.

Чтобы исключить лишние понятия, используют операцию вычитания подграфов, в результате которой понятия, содержащиеся в подграфе  «устаревшие носители», будут удалены из подграфа «носитель».

Рисунок 6 – Подграф «устаревшие носители»

Фрагмент семантической сети, описывающий понятие носителей информации и представляющей собой подграф понятия «используемые носители», приведён на рисунке 7.

Рисунок 7 – Подграф «используемые носители»

Таким образом, из элементарных понятий собираются новые понятия, являющиеся результатом совершения некоторых  операций с исходными понятиями.

Использование аппарата теории графов и семантических сетей позволяет выполнить настройку используемых в системе показателей оценки состояния документооборота и поддерживать базу знаний в актуальном состоянии.

Литература:

1.                 Усманова И.В.  Сетевые модели представления знаний для решения задачи анализа документооборота организации – Известия ПГПУ им. В.Г. Белинского. № 26 – 2011- С. 412-417.

2.                 Усманова И.В., Баканова Н.Б. Автоматизация процедуры оценки состояния документооборота организации // Materiały VII Międzynarodowej naukowi-praktycznej konferencji «Perspektywiczne opracowania są nauką i technikami - 2011» Volume 57. Techniczne nauki.: Przemyśl. Nauka i studia - 104 str. – str. 73-78