Костанайский
государственный университет им.А. Байтурсынова
Для решения
задач поддержки принятия решений не редко используют методы искусственного
интеллекта: экспертные системы и искусственные нейронные сети. Экспертная
система, используя знания, полученные от специалистов в данной предметной
области, решает те же проблемы, экспертами в которых являются эти специалисты.
Искусственные нейронные сети обучаются на наборе обучающих данных, после чего
могут решать задачи для данных, которых не было в обучающем множестве. Выделяются
следующие причины, ограничивающие применение методов искусственного интеллекта
на предприятиях:
1.
Сложность
подготовки данных к использованию.
2.
Сложность
подготовки системы к эксплуатации.
3.
Сложность
проблем, которые решаются с помощью данных средств.
Предполагается, что применение экспертных
системы и нейронных систем в среде информационного пространства позволяет
снизить влияние данных причин [1]:
1. При использовании STEP в качестве
стандарта по представлению данных, все данные представляются единообразно.
Каждый элемент данных является одного типа. Для каждого типа данных можно определить
правила подготовки их в ЭС или НС.
2. Поскольку все данные аккумулируются в ЕИП,
то в наличии имеются большие массивы данных для обучения ЭС и НС.
3. Предполагается применять ЭС и НС для
решения достаточно малых по размерности задач, что позволит эффективно
контролировать их поведение.
4. Поскольку при создании ЕИП строится
информационная модель предприятия, то данные знания также могут эффективно использоваться.
Для целей
автоматизации управления сложными технологическими процессами используем
продукционные экспертные системы. Системы продукций являются одним из самых
распространенных способов представления знаний в экспертных системах. В таких
системах знания хранятся в виде правил (продукций), определяющих процесс
преобразования входных данных.
Цель экспертные
систем – вывести некоторый заданный факт, который называется целевым
утверждением (то есть в результате применения правил добиться того, чтобы этот
факт был включен в рабочее множество), либо опровергнуть этот факт (то есть
убедиться, что его вывести невозможно, следовательно, при данном уровне знаний
системы он является ложным). Целевое утверждение может быть либо «заложено»
заранее в базу знаний системы, либо извлекается системой из диалога с
пользователем.
Работа ПЭС
представляет собой последовательность итераций, в каждой из которых из базы знаний выбирается правило, которое
применяется к текущему содержимому контекста. Цикл работы ПЭС (логический вывод)
заканчивается, когда выведено либо опровергнуто целевое утверждение. Логический
вывод может функционировать по различным алгоритмам, наиболее распространенными
из которых являются прямой порядок вывода и обратный порядок вывода.
Качество решений, выдаваемых
экспертной системой тем выше, чем больше объем знаний системы. Соответственно,
проблема наполнения системы знаниями является одной из первоочередных для
получения работоспособной экспертной системы [2].
Из различных
архитектур нейронной сети выделим многослойные нейронные сети прямого
распространения, которые обладают рядом преимуществ при практическом
использовании:
– использует в качестве алгоритма обучения
алгоритм обратного распространения – первый эффективный алгоритм обучения
многослойных нейронных сетей;
– большое количество применений для решения
практических задач;
– широта области применения – может
применяться для распознавания образов, классификации, прогнозирования, синтеза
речи, контроля, адаптивного управления, построения экспертных систем [3].
Многослойные нейронные сети
прямого распространения представляют собой многослойные сети с
последовательными связями. Нейроны первого (входного) слоя выполняют только
распределительные функции. Они получают входные сигналы и передают их нейронам
второго. Нейроны второго слоя преобразуют сигнал и передают его нейронам третьего
слоя и т.д. до выходного слоя, который обрабатывает информацию от предыдущих
слоев и выдает выходной сигнал. В качестве функции активации нейронов обычно
используют гиперболический тангенс или сигмоид.
Определяющим
свойством нейронной сети является способность к обучению. Для решения
какой-либо задачи традиционным методом необходимо знать правила, по которым из
входных данных получаются решение задачи. С помощью нейронной сети можно найти
решение, не зная правил, а имея набор примеров, на которых можно обучить сеть.
Обучение
осуществляется по обучающей выборке. Функционирование сети улучшается в
процессе итеративной настройки весовых коэффициентов. Свойство сети обучаться
на примерах делает их более привлекательными по сравнению с системами, которые
следуют определенной системе правил функционирования, сформулированной
экспертами, на задачах, для которых существует большое количество примеров
решения, но не выявлены правила функционирования.
Для обучения
многослойных сетей используют «обучение с учителем». В обучающей выборке имеется правильный ответ на каждый входной
пример. Веса настаиваются так, чтобы сеть выдавала значения как можно более
близкие к известным правильным значениям.
Цель обучения
нейронной сети состоит в достижении возможности обобщения. Это значит, что сеть
выделяет особенности входных данных и начинает относить похожие образцы к
одному классу. Это также повышает устойчивость к помехам.
При обучении
сетей, как правило, используется один из двух следующих критериев завершения
обучения:
– завершение обучения при достижении
заданного в параметрах обучения значения функции ошибки;
– завершение обучения в случае, если для
всех примеров обучающей выборки сеть выдает значения, соответствующие
эталонным.
Перед
обучением выполняется инициализация нейронной сети, то есть присваивание
параметрам сети некоторых начальных значений. Как правило, эти начальные
значения – некоторые малые случайные числа.
Для проверки
навыков, приобретенных сетью в процессе обучения, используется имитация
функционирования (тестирование) сети.[4]
Преимущества
применения аппарата искусственных нейронных сетей перед другими решениями:
–
использование
обучения на наборе данных позволяет решать задачи, для которых не разработаны
формальные методы решения;
–
нейронные
сети можно легко переобучить в случае изменения (усложнения, переформулировки)
решаемой задачи;
–
быстродействие
обученной сети очень высоко, что объясняется высокой степенью распараллеливания
операций, простотой операций, выполняемых для обеспечения функционирования
нейронной сети, а также заранее известным объемом вычислений, необходимых для
решения задачи (последнее верно для сетей с последовательными связями).
Выбор
архитектуры многослойных нейронных сетей прямого распространения обусловлен
большим многообразием типов задач, решаемых данной архитектурой, а также
широким распространением данной архитектуры в коммерческих нейросимуляторах.
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1
Милаев В.,
Фаткин А., Рулева Т. Автоматизация управления // PC Week/RE. – 2001. – № 10. – С. 32–33.
2
Уотермен Д.
Руководство по экспертным системам. – М.: Мир, 1989.
3
Шемелин
В.К., Утросин В.В. Использование экспертных систем в среде информационной поддержки
жизненного цикла изделия // Объедин. науч журн. – М., 2005. – № 13 (141). – С. 65–67.
4
Головко В.А.
Нейронные сети: обучение, организация и применение: учеб. пособие для вузов / общ.
ред. А.И. Галушкина – М.: ИПРЖР, 2001.
– Кн. 4. – 256 с.