К.т.н. Сазонов С.Ю., , к.т.н. Титенко Е.А., Гришин Д.С., Крипачев А.В.

Юго-Западный государственный университет, Россия

МОДИФИЦИРОВАННАЯ ПРОДУКЦИОННАЯ СИСТЕМА ДЛЯ ПАРАЛЛЕЛЬНЫХ СТРАТЕГИЙ

Одним из приоритетных направлений развития современной информатики являются теоретические и прикладные средства высокопроизводительной обработки знаний. Модели и методы обработки знаний ориентированы под решение слабо формализованных и проблемно-поисковых задач, доля которых постоянно растет в современных научных исследованиях (структурное распознавание образов, динамические экспертные системы, машинный перевод, естественно-языковые системы, базы знаний, интеллектуальный анализ данных  и их кластеризация, сжатие данных и др.) [1].

Общая объединяющая особенность данного класса задач связывается с ограниченной возможностью задания последовательности команд, приводящих к целевому результату, при этом наиболее важной компонентой результата является найденный путь в поисковом графе решений. Другая особенность проблемно-поисковых задач связана с тем, что они трактуются как задачи генерации новых объектов на основе имеющегося набора исходных данных и набора дискретных правил преобразования, имеющих разрешительный смысл исполнения, т.е. на основе исчислений. Наконец, третья значимая особенность рассматриваемых задач заключается в их преимущественно символьной постановке и выполнении аналитических преобразований над конструктивными объектами (списки, строки, деревья и др.).

В рамках теории алгоритмов для задания прикладных поисково-вычислительных процессов с неизвестной последовательностью команд адекватной моделью считаются исчислительные системы, задающие ветвящиеся конструктивные процессы [2]. Аппарат исчислительных систем или систем, использующих параллелизм потока данных, представляется различными формализмами: логические системы, продукционные исчисления, алгебраические исчисления, нейронные сети, генетические алгоритмы и др. [1].

Аппарат исчислительных продукционных систем (ПС) (грамматики Хомского, ассоциативные полусистема Туэ, системы Поста и др.) является исторически апробированным и доказавшим свою востребованность при решении проблемно-поисковых задач. Вычислительный формализм в виде ПС характеризуется однородностью состава правил, естественной модульностью, декомпозицией на подсистемы, достаточной гибкостью схемы управления и ее модифицируемостью. Данные конкурентные преимущества служат побудительным источником для исследования вопросов организации параллельной обработки символьной информации (ОСИ) на основе продукционных систем.

ПС имеют преимущественно программную реализацию (языки программирования SNOBOL-4, OPS-5 с поддержкой поиска по образцу, объектно-ориентированная среда CLIPS для разработки экспертных систем, язык Рефал и его модификация с поддержкой функций библиотеки MPI, инструментальные средства для задач искусственного интеллекта ART, KEE, G2 и др.) [3]. Программная реализация ПС на существующих традиционных архитектурах вычислительных устройств и систем  (ВУ и ВС) приводит к неудовлетворительным временным характеристикам при решении задач ОСИ реального уровня сложности. Основной причиной возникновения избыточных временных затрат являются стратегии последовательного с возвратами поиска по графу решений (поиск в глубину/в ширину, поиск от цели/от данных и их различные модификации). Данные стратегии выводов не учитывают естественный параллелизм потока данных, свойственный для исчислительных ПС. В тоже время многочисленные известные архитектуры параллельных ВУ и ВС, в первую очередь, ориентированы на разрешение конфликтов по управлению. Они не учитывают специфических (структурных) конфликтов по данным, возникающих при параллельном исполнении продукций и организации поиска по графу решений. Таким образом, создание модифицированных стратегий выводов с разрешением структурных конфликтов по данным является необходимым условием организации параллельных символьных вычислений на основе ПС.

В общем виде исчислительная ПС задается как

(A, Á )                                                                                                (1),

где A  рабочий алфавит, Áопределяющее множество продукций количеством t продукций.

Для обеспечения параллельных (ветвящихся) продукционных процессов в ПС вводится p- значное отношение равноправной выводимости (p<t), обеспечивающее реализацию p альтернативных направлений в графе решений по p копиям экземпляра текущего слова. Равноправная обработка нескольких копий приводит к генерации за один шаг вывода множества промежуточных слов-решений. Кроме того, дополнительно вводится p-значное отношение независимой выводимости (p<t) текущего слова-решения по p независимым вхождениям. Данное отношение выводимости определяет одновременное срабатывание набора структурно независимых, т.е. не конфликтующих, продукций над единственным экземпляром текущего обрабатываемого слова.

Работа модифицированной исчислительной ПС связана с рекурсивной генерацией в ширину множества слов и формирования тем самым графа решений. Каждый шаг вывода (каждый рекурсивный вызов ПС) осуществляется путем реализации одного из трех отношений вывода:

1) отношение линейного вывода (стандартный последовательный вывод);

2) p-значное отношения равноправного вывода (ИЛИ- вывод);

3) p- значное отношения независимого вывода (И- вывод).

Равноправное и независимое срабатывание продукций основано на использовании дополнительной информации о структурных конфликтах по данным между продукциями изÁ. Дополнительная информация представляется в виде счетного множества конфликтных слов I,  формируемых на основе анализа структурных отношений (вхождение, пересечение, дополнение) между продукциями. Главная особенность I заключается в том, что конфликтные слова формируются до начала генерации графа решений. По существу, они являются характеристикой  самой ПС и параллельных процессов, порождаемых ПС. Корректность синтеза конфликтных слов из I подтверждена доказательствами логических условий пересечения слов в рамках конструктивной логики [4].

В итоге, модифицированная ПС описывается как

(A, Á, I)                                                                                             (2).

Генерация ветвящихся продукционных процессов в (2) основывается на использовании вычисленных количественных оценок ветвлений. Достоверные значения коэффициентов ветвления, полученные до начала собственно вычислений, обеспечивают параллельную генерацию слов-потомков от текущего обрабатываемого слова, что создает основу безотступной технологии генерации графа решений.

Таким образом, в работе описана модифицированная исчислительная ПС, которая  имеет встроенные средства для естественной параллельной реализации ветвящихся продукционных процессов в виде счетного множества конфликтных слов. Данные конфликтные слова описывают специфические структурные конфликты между параллельно выполняющимися продукциями. Эти слова используются в наборе комплементаных стратегий выводов ( последовательная, ИЛИ-, И- параллельная стратегии).

Работа выполнена в рамках государственного задания Министерства образования и науки Российской Федерации №8.8482.2013.

Литература

1. Люгер Дж. Ф. Искусственный интеллект: стратегии и методы решения сложных проблем. - М.: Издательский дом «Вильямс». 2003. - 864 с.

2. Успенский, В.А. Теория алгоритмов: основные открытия и приложения  / В.А. Успенский, А.Л. Семенов. - М.: Наука, 1987. - 288с.

3. Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский.- СПб.: Питер, 2001. - 384 с.

4. Титенко Е.А. Исчислительная система продукций и процедура распознавания конфликтов данных // Вестник компьютерных и информационных технологий. 2012. - №2. - С.24-29.