Д.т.н., проф. Садовская Т.Г, Шиболденков В.А.

 

МГТУ им. Н.Э. Баумана, Россия

 

Прогнозирование изменения организационно-экономических показателей предприятия на основе двухслойной карты Кохонена

 

 

Полноценная деятельность компании под воздействием динамического воздействия внешних сил может происходить только при хорошо обдуманных и своевременных стратегических решениях. С постоянным нарастанием скорости изменений ситуации на рынке, руководству компании требуются особые средства анализа финансовой информации, которые обладают не только удобством и простотой работы с ними, но и значительной оперативностью при взаимодействии с данными. А данное требование означает переход к радикально новым, частично или полностью автоматическим способам исследования информации. 

К таким алгоритмам относятся любые нетрадиционные подходы, использующие ту или иную парадигму искусственного интеллекта. Ключевая особенность всех этих приёмов в возможности обрабатывать «реальные» данные, в которых могут быть и ошибки, и пропуски, и любые другие неточности и неопределённости. При проработке задачи изучения неявной информации появился аппарат искусственных нейронных сетей, которые используют алгоритмы сходные с тем, что происходит в клетках биологического мозга.   

Принцип геометрического кодирования, как и все научные открытия, был подсмотрен человеком в природе: кора головного мозга человека обладает особой топологической структурой. В ней функционально близкие области находятся (геометрически) рядом, что обеспечивает колоссальное быстродействие и прямую связь между схожими зонами. Также работает и самоорганизующаяся карта Кохонена (Self-Organising Maps, SOM): она перестраивает своё геометрическое расположение с учётом закономерности распределения данных в обучающей выборке, напрямую ассоциируя элементы множества с положением своих нейронов [1,2].

После самоорганизации искусственные нейронные клетки образуют паттерны, копирующее устройство исследуемого массива данных, но упрощённые до наглядной «карты знаний» (knowledge maps). Если говорить сложным математическим языком, то карта является проекцией гиперплоскости, нелинейно разделившей на кластеры значительный и сложный объём данных.

Нейроны встраиваются в узлы решётки, обычно для простоты двумерной. В процессе работы карты нейроны выстраиваются относительно друг друга и создавая значимую систему координат, образовывая таким образом ИНС с топографической структурой. В них координаты (т.е. местоположение) узлов карты соответствуют наблюдаемым закономерностям во входных данных. Такая нейросеть очень проста и не обладает скрытыми слоями: в ней лишь входной слой, содержащий исследуемые данные, и выходной слой с описанным геометрическим устройством.

Это позволяет использовать их, как очень наглядный инструмент визуализации. Карта представляет собой двумерную дискретную матрицу с одной из часто употребляемых топологий, квадратной или гексагональной, что характеризует число ближайших соседей: 4 и 6 соответственно. На такой карте отчётливо видно положение изучаемых объектов относительно друг друга, так как элементы располагают в зависимости от установленной меры схожести (обычно геометрической меры расстояния): тогда образцы одного кластера будут сгруппированы и находится рядом, а противоположные и непохожие элементы наоборот далеко [3,4].

Карта опознаёт группы в предложенных образцах, различает их относительное положение между собой и образованные ими паттерны. SOM может как кластеризовать информацию без учителя, так и работать с классами заданными человеком, анализируя их родство по отдельности и между группками, формируя сложные нелинейные границы для разграничения кластеров.  [1,2]

Традиционный принцип организации сети Кохонена – «победитель забирает всё». Осуществляется, как придание выходам значений 0 или 1, для того, чтобы один объект принадлежал лишь одному классу. По сути победитель – это самый геометрически близкий к предложенному образцу нейрон.  В процессе обучения слоя Кохонена вычисляются скалярные произведения входного вектора и вектора весов. «Победителем» считают нейрон, обладающим самым большим значением, и подстраивают веса. Важно заметить, что весовые коэффициенты подстраиваться не только у победителя, но и у ближайших соседей, что делает подвижной целую окрестность (соседство нейронов), а не единичный элемент. Данный принцип передвижения всего ансамбля соседей гораздо эффективнее позволяет выстроиться нейронам по схожести с предложенным образом. В процессе обучения изменяется не только скорость обучения, но и окрестность ближайших соседей: со временем всё меньше и меньше нейронов реагируют на входные сигналы. [5]

Важная особенность организационно-экономических сведений в наличии временной размерности, что означает важность исследование не по факту, а в разрезе продолжительного периода. Карта Кохонена может анализировать поступающие образцы и в развёртке по времени.

 

Рисунок 1. Результаты кластеризации по данным разных лет и общая тенденция

В этом случае получают системы геометрических координат нейронов, которые сформированы нейрокартой для каждой временной серии, и следят за «траекторией» движения образцов, наблюдая изменение группировок во времени. Таким образом можно подмечать тенденции наметившихся изменений, оценивать их характер, и даже спрогнозировать последующее развитие ситуации.

Данный процесс можно также алгоритмизировать посредством SOM, создав каскадную сеть, т.е. сконструировав последовательность из двух самоорганизующихся карт Кохонена, где карта первого слоя анализирует входные данные и в итоге формирует карту расположения исследуемых образцов в двумерном пространстве, ориентацию которых впоследствии изучает уже карта второго слоя, для которой обучающим множеством становятся, координаты нейронов для каждого конкретного предприятия во времени.

Рисунок 2. Каскадная структура из нейрокарт Кохонена

В итоге функционирование каскада самоорганизующихся карт будет происходить по следующему принципу: сначала на карту первого слоя подают выборку за первый период, на котором сеть обучается структуре данных, затем последовательно на уже обученную сеть подают данные за другие временные промежутки, но уже как тестовую информацию, дабы не изменять установившиеся геометрические закономерности. Координаты нейронов полученных карт формируют обучающее множество для второго слоя, где карта может обладать другой топологией и предназначением. Например, она может быть гораздо меньше размером, и разделять объекты на статичные (т.е. которые не меняли сильно свои координаты) и на плавающие, которые далеко ушли за отпущенное время. Также на второй слой можно подавать не только абсолютные значения координат, но и отразить лишь относительное изменение, как некоторое смещение или скорость. 

         Описанная двухслойная архитектура позволяет визуально следить за динамикой, а также адекватно и при этом оперативно принимать решения о необходимых шагах.

Список используемой литературы

1.     Дебок Г., Кохонен Т. Анализ финансовых данных. Пер. с англ. М.: Альпина, 2001. 317 с.

2.     Kohonen, T. Self-Organizing Maps. 3 ed. Berlin-New York: Springer-Verlag, 2001.

3.     Hecht-Nielsen, R. Neurocomputing, Reading. MA: Addison-Wesley, 1990.

4.     Хайкин C. Нейронные сети: полный курс. 2-е издание. М: Вильямс, 2006. 1104с.

5.     Гаврилов А.И. Искусственные нейронные системы в задачах системного анализа. Ч. 1. 2000. 103с.