Баранский
И.В., к.т.н. Перцев А.А., к.т.н. Подобрий А.Н.
Федеральный
научно-производственный центр акционерное общество «Научно-производственное
объединение «Марс»
Подходы к построению модели
контента системы управления знаниями производственного предприятия.
Введение
С каждым годом в
организациях копится много документов, критически важных для работы,
большинство из которых существуют в электронном виде. Для работы с таким большим
количеством электронных документов нужна стройная взаимосвязанная система. Современный
уровень развития производственных предприятий таков, что одному человеку уже сложно
удержать в голове все взаимосвязи и всю логику организации информации и
процессов ее обработки. Поэтому возникает потребность в системе, которая могла
бы эту проблему решить.
Для современных
предприятий характерно иметь большой объем неструктурированной информации, который
включает в себя множество важных знаний экспертов предприятия. Эти знания
официально используются в производственной и хозяйственной деятельности и
основываются на актуальных организационных документах (ГОСТ, СТО, положения, и
т.д.). Для работы с неструктурированной информацией, до недавнего времени, использовались
лишь простые инструменты наподобие текстовых процессоров. Использование систем
извлекающих и вовлекающих в новый оборот накопленных знаний из
неструктурированной информации позволяет получить синергетический эффект отдачи
от инвестиций, вложенных в создание неструктурированной информации.
Существующая концепция
«knowledge management» и многочисленные отечественные аналоги «управления
знаниями», которые включают в себя различные подходы и технологии обращениям со
знаниями, представляют собой наборы технологий и универсальных правил, которые
необходимо адаптировать для нужд каждого предприятия индивидуально.
Одной из задач
построения системы управления званиями является хранение контента, настоящая
статья посвящена подходам к построению модели хранения контента.
Управление знаниями
Обзор
литературы [1-5] показал, что управление знаниями в организации – это
систематический процесс идентификации, использования и передачи информации,
знаний, которые люди могут создавать, совершенствовать и применять. Это
процесс, в ходе которого организация генерирует знания, накапливает их и
использует в интересах получения конкурентных преимуществ. Причем процесс
управления может проходить не явно и при этом не вся интеллектуальная ценность
знаний вовлекается в оборот организации.
С
учетом не явного управления рассмотрим основные процессы управления знаниями:
- генерирование
знаний – агрегирование информации из информационных источников;
- формализация
знаний – обработка полученной информации и превращение в знания;
- хранение
знаний – определение подходящего способа хранения.
Генерирование знаний
происходит в процессе повседневной деятельности в виде неструктурированной
информации, связанной с производственно-хозяйственной деятельностью:
инструкции, стандарты, методики, различные технические и организационные
решения и т.д. Все множество фактов и документов составляют содержимое
конкретного знания – контент. Для различных целей применяют разные виды моделей
хранения контента. По материалам, приведенным в [6], кратко рассмотрим модели
для представления знаний.
Фреймовая
модель
Фреймовая модель
основана на концепции Марвина Мински (Marvin Minsky) – профессора
Массачусетского технологического института, основателя лаборатории
искусственного интеллекта, автора ряда фундаментальных работ. Фреймовая модель
представляет собой систематизированную психологическую модель памяти человека и
его сознания.
Фрейм (англ. frame –
рамка, каркас) – структура данных для представления некоторого концептуального
объекта. Информация, относящаяся к фрейму, содержится в составляющих его слотах.
Слот (англ. slot –
щель, прорезь) может быть терминальным (листом иерархии) или представлять собой
фрейм нижнего уровня.
Каждый фрейм состоит из
произвольного числа слотов, причем несколько из них обычно определяются самой
системой для выполнения специфических функций, а остальные определяются
пользователем. Фреймы образуют иерархию. Иерархия во фреймовых моделях
порождает единую многоуровневую структуру, описывающую либо объект, если слоты
описывают только свойства объекта, либо ситуацию или процесс, если отдельные
слоты являются именами процедур, присоединенных к фрейму и вызываемых при его
актуализации. В целом фреймовая модель допускает представление всех свойств
декларативных и процедурных знаний. Глубина вложенности слотов во фрейме (число
уровней) зависит от предметной области и языка, реализующего модель.
Логическая
модель.
Основная идея при
построении логических моделей знаний заключается в следующем – вся информация,
необходимая для решения прикладных задач, рассматривается как совокупность
фактов и утверждений, которые представляются как формулы в некоторой логике.
Знания отображаются совокупностью таких формул, а получение новых знаний
сводится к реализации процедур логического вывода. В основе логических моделей
знаний лежит понятие формальной теории.
Основные достоинства
логических моделей знаний:
-
в качестве «фундамента» здесь
используется классический аппарат математической логики, методы которой
достаточно хорошо изучены и формально обоснованы;
-
существуют достаточно эффективные
процедуры вывода, в том числе реализованные в языке логического программирования
«Пролог»;
-
в базах знаний можно хранить лишь
множество аксиом, а все остальные знания получать из них по правилам вывода.
В логических моделях
знаний слова, описывающие сущности предметной области, называются термами
(константы, переменные, функции), а слова, описывающие отношения сущностей –
предикатами.
Предикат – логическая
N-арная пропозициональная функция, определенная для предметной области и
принимающая значения либо истинности, либо ложности. Пропозициональной
называется функция, которая ставит в соответствие объектам из области
определения, одно из истинностных значений («истина», «ложь»). Предикат
принимает значения «истина» или «ложь» в зависимости от значений входящих в
него термов.
Способ описания
предметной области, используемый в логических моделях знаний, приводит к потере
некоторых нюансов, свойственных естественному восприятию человека, и поэтому
снижает описательную возможность таких моделей.
Продукционная
модель
Продукционные модели
можно считать наиболее распространенными моделями представления знаний.
Продукционная модель – это модель, основанная на правилах, позволяющая
представить знание в виде предложений типа: «ЕСЛИ условие, ТО действие». Продукционная
модель обладает тем недостатком, что при накоплении достаточно большого числа
(порядка нескольких сотен) продукций они начинают противоречить друг другу. Системы
обработки знаний, использующие продукционную модель, получили название
«продукционных систем».
Существуют два типа
продукционных систем – с «прямыми» и «обратными» выводами. Прямые выводы
реализуют стратегию «от фактов к заключениям». При обратных выводах выдвигаются
гипотезы вероятностных заключений, которые могут быть подтверждены или
опровергнуты на основании фактов, поступающих в рабочую память. Существуют
также системы с двунаправленными выводами.
Основные достоинства
систем, основанных на продукционных моделях, связаны с простотой представления
знаний и организации логического вывода. К недостаткам таких систем можно
отнести следующее:
-
отличие от структур знаний, свойственных
человеку;
-
неясность взаимных отношений правил;
-
сложность оценки целостного образа
знаний;
-
низкая эффективность обработки знаний.
При разработке
небольших систем (десятки правил) проявляются в основном положительные стороны
продукционных моделей знаний, однако при увеличении объёма знаний более
заметными становятся слабые стороны.
Сетевые
модели.
Однозначное определение
семантической сети в настоящее время отсутствует. В инженерии знаний под ней
подразумевается граф, отображающий смысл целостного образа. Узлы графа
соответствуют понятиям и объектам, а дуги – отношениям между объектами.
Семантическая сеть как
модель наиболее часто используется для представления декларативных знаний. С
помощью этой модели реализуются такие свойства системы знаний, как
интерпретируемость и связность, в том числе по отношениям IS-A и PART-OF. За
счет этих свойств семантическая сеть позволяет снизить объем хранимых данных,
обеспечивает вывод умозаключений по ассоциативным связям.
Одной из первых
известных моделей, основанных на семантической сети, является TLC-модель
(Teachaple Languge Compre-hender – доступный механизм понимания языка),
разработанная Куиллианом в 1968 году. Модель использовалась для представления
семантических отношений между концептами (словами) с целью описания структуры
долговременной памяти человека в психологии.
Модель
контента
В ходе анализа
существующих подходов было принято решение использовать, для формализации и
хранения неструктурированной информации (текстовые документы), модель контента
на базе фреймовой модели со следующей модификацией:
1. Создание
фиксированного слота для задания вида двусторонней связи между остальными
слотами, основная задача которой заключается в описании смысла объединения всех
слотов в рамках одного фрейма. Это описание того, в каком отношении,
описываемые слотами, находятся между собой сущности.
2. Роль
каждого слота в составе фрейма задается описанием операции. Таким образом,
слоты фрейма являются операндами, а вид связи – некой определенной операцией.
3. Использование
справочной системы, основанной на данных информационных систем, для описания
связей между слотами. Это связано с тем, что современные информационные системы
перестали ограничиваться использованием базовых типов данных (таких как число,
стока и т.д.), а используют данные с аналитическими признаками, значения
которых содержатся в специальных справочниках и имеют свой определенный смысл.
Представление об использовании справочной системы для фреймовой модели приведено
на рисунке 1.
4. Использование
иерархической структуры документа, т.к. актуальные организационные документы
имеют иерархическую структуру, состоящую из разделов, подразделов, причем
каждый элемент структуры содержит законченный элемент контента, представляющий
ценность в части знаний.
Введенные модификации
позволяют «добывать» знания из существующего на предприятии множества
неструктурированных и неформализованных актуальных документов для текущей
производственно-хозяйственной деятельности с одной стороны и организовать
хранение знаний в формальном представлении – в базе данных. Причем, формат или
вид базы данных не является определяющим фактором для хранения представленных в
таком виде знаний.

Рис. 1. Использование
справочной системы в фреймовой модели.
Для извлечения знаний
из документов, возможно реализовать двухступенчатая процедуру:
1. Разбор
документа на разделы и подразделы для обеспечения формализованного представления
документа и максимального разбиения документа на составные части, которые
содержат минимальный, но в тоже время достаточный объем знаний.
2. Разбор
текста с целью получения на его основе заполненного фрейма, который и будет
считаться формализованным знанием и, который возможно преобразовать обратно в
текстовое представление.
Заключение
Таким образом, для
обеспечения хранения контента в системе управления знаниями предлагается
использовать модифицированную фреймовую модель обеспечивающую связь со
справочной подсистемой в информационной системе предприятия, использующую
иерархическую структуру документа. Для обеспечения двусторонней связи задается
специализированный слот в модели.
Введенные ограничения и
довески в классическую модель позволяют организовать неструктурированную и
неформализованную информацию привычными средствами базы данных.
Литература
1. Управление
знаниями: учебное пособие / В. В. Ефимов. - Ульяновск: УлГТУ,2005.-111с.
2. Управление
знаниями и интеллектуальным капиталом : [учеб. пособие] / С.В. Паникарова, М.В.
Власов; М-во образования и науки Рос. Федерации, Урал. федер. ун-т. —
Екатеринбург : Изд‑во
Урал. ун-та, 2015. — 140 с.
3. Менеджмент
знаний : учеб. пособие / Н.В. Моргунова, М.А. Шумилина; Владим. гос. ун-т имени
Александра Григорьевича и Николая Григорьевича Столетовых. − Владимир :
Изд-во ВлГУ, 2012. − 87с.
4. Л.
Г. Батракова, А. Г. Колпакова, Стратегия и тактика процесса управления
знаниями, Ярославский педагогический вестник – 2012 – № 1 – Том I (Гуманитарные
науки).
5. Хуан
Луис Ларрабуре, Управление знаниями в системе организации объединенных наций,
Организация Объединенных Наций, Женева, 2007 год.
6. Официальный
сайт портала искусственного интеллекта «Aiportal.ru» http://www.aiportal.ru/articles/knowledge-models