Подобрий А.Н.

Ульяновский государственный технический университет, Россия

Унифицированная интеграция корпоративных хранилищ данных для проектирования автоматизированных систем

 

Информационной основой интегрированной информационной системы управления предприятием должна являться единая распределенная база данных, в которой каждый пользователь, обладающий соответственными правами доступа, может своевременно получить информацию из разных информационных источников. Построение эффективных и надежных информационных инфраструктур  должно основываться на применении формальных моделей структурирования метаданных, функционирования и разграничения доступа к информационным ресурсам.

Для создания единого облака представления информации об этапах реализации жизненного цикла изделия и создания базы опыта проектной организации необходима интеграция корпоративных хранилищ данных. Для этого необходимо создать единую федеративную архитектуру хранения данных. Данная архитектура позволит разграничить хранилища данных с учетом потребностей и назначения информационных и автоматизированных систем, и объединить их за счет единой структуры взаимосвязей.  Для построения данной архитектуры необходимо выделить основные составные компоненты информационных и автоматизированных систем, т.е. провести унификацию корпоративных хранилищ данных. Унифицированное представление корпоративных хранилищ данных и их описаний в метаданных позволит максимально автоматизировать построение сервисов, которые смогут выполнить выборку и обработку набора данных, удовлетворяющих заданным условиям и ограничениям. В основу предлагаемой интеграции информационных ресурсов автоматизированных систем положены наборы данных хранящихся в самостоятельных корпоративных хранилищах данных.

Информационная система по своей сути есть совокупность объектов, взаимодействующих друг с другом. Исходя из этого, можно выделить основные типы объектов:

- документы – информация, зафиксированная в информационной системе;

- справочники – объект для хранения информации имеющую одинаковую структуру и списочный характер;

- Регистры – таблицы для накопления оперативных данных и получения сводной информации;

- Постоянные – зарезервированные значения каких-либо переменных.

Каждый тип объекта включает в себя список родительских объектов, т.е. элементов того же типа. В состав родительского объекта входят элементы описывающие данный объект. Эти элементы могут ссылаться на объект первоисточник, представляя тем самым зависимость между одним дочерним элементом и другим родительским. На основании вышесказанного предлагается схема зависимостей между информационными объектами (рис. 1).

Рис. 1 Унифицированная структура информационных систем

         Под это описание подходят большинство информационных и автоматизированных систем исходя из вышеописанных терминов «документ» и «справочник».

         Таким образом, для приведенной в пример КИС 1С 7.7, в документе «заказ Изделия» есть поле «Изделие» которое ссылается на справочник «Изделия», объекты которого в свою очередь ссылаются на другой справочник и т.д.

На уровне базы данных предлагается выделить три основные таблицы для хранения метаданных (рис. 2):

         - META_SYSTEM_PARAM – список информационных систем

         - META_OBJECT – список объектов информационных систем и их связи

         - META_DICT – справочник для расшифровки характеристик структуры метаданных

Рис. 2 Структура метаданных на уровне базы данных

         Справочник  списка информационных систем включает в себя наименование, описание и учетные данные для подключения к хранилищу данных данной системы. Таблица списка объектов информационных систем представляет из себя неориентированный граф, вершинами которого являются объекты информационных систем, а ребрами – связи между объектами.

На основании данной струтуры метаданных можно спроектировать запрос к набору данных с учетом структуры написания запросов на языке Transact SQL. Основными элементами которого являются: Select, Join,Where (рис. 3).

Рис. 3  Структура проектирования sql запроса на основе метаданных

Елемент select формируется на основании набора полей описанных в таблице META_OBJECT, расшифрованный в атрибуте LINK_OBJ. Таблица связей join формируется на оснании ссылочных полей LINK_DICT и LINK_DICT_COL.  Таблица параметров where включает в себя условия применяемые к наборам полей для ограничения вывода данных. После заполнения основных элементов генератора запросов, формируется SQL-function к которой можно применить функции манипуляции с наборами данных. В результате описанных манипуляций получаем финальный текст запроса Transact SQL ссылающийся на самостоятельные корпоративные хранилища данных.

Вся информация о говом запросе хранится в таблице метаданных и представляет из себя наборы полей и их связей с другими объектами как внутри одного корпоративного хранилища данных, так и другого (рис.4).

Рис. 4 Хранение информации на уровне базы данных

         К готовому запросу можно применить оставшие два элемента проектирования запроса: таблица сортировок и таблица группировок, которые реализуются аналогично языку Transact SQL.

Таким образом, учитывая специфику производственного предприятия можно представить результат интеграции как модуль представления данных, который предоставляет информацию и для создания базы опыта проектной организации реализованной на основе инструментария WIQA (Working In Questions and Answers) [4, 5], обслуживающего потоки работ «Взаимодействие с Опытом» на этапе концептуального проектирования АС и для отслеживания жизненного цикла изделия. Данный модуль на основании метаданных получает информацию из основных корпоративных хранилищ данных (рис. 5).

Рис. 5 Структура интеграции унифицированных корпоративных хранилищ

Модуль представления ланных может быть предствлен в виде сервиса позволяющего производить выборку и обработку набора данных по заданным условиям и ограничениям. На основании структуры модуля, реализованного на базе MS SQL, данные можно представлять как в виде набора данных, так и в виде веб страниц.

Сервисы представляют из себя накапливаемую "базу знаний" – библиотеку данных, которой может воспользоваться каждый. То есть, каждая решаемая задча может выступать в виде наработки для других задач. Таким образом, данный подход удовлетворяет основным требования сервисно - ориентированных архитектур. Результатом работы сервиса могут выступать "витрины данных" – набор данных необходимый для решения конкретной задачи.

В результате, была проведена унифицированная интеграция корпоративных хранилищ данных, объекты которых представлены в структуре метаданных.  Представлена схема интеграции хранилищ данных на примере производственного предприятия. Описан модуль представления данных реализованный на базе СУБД MS SQL Server. Структура хранения метаданных позволяет использовать методы OLAP представления данных и включать в структуру новые самостоятельные хранилища данных.

 

Литература

1.     Стандарт ISO/IEC 2382-1

http://www.morepc.ru/informatisation/iso2381-1.html

2.     Н. Лисин. Лоскутная автоматизация, или как управлять «зоопарком» программ //BYTE Россия, 2009

http://www.bytemag.ru/articles/detail.php?ID=14862

3.     Воройский Ф. С. Информатика. Новый систематизированный словарь-справочник (Вводный курс по информатике и вычислительной технике в терминах). — 2-е изд., перераб. и доп.. — Издательство Либерия, 2001.

4.     Маклаев В.А., Перцев А.А. Нормативы профессиональной зрелости проектной организации. – Ульяновск : УлГТУ, 2012. – 300 с.

5.     Соснин П.И. Вопросно-ответное программирование человеко-компьютерной деятельности. – Ульяновск:УлГТУ, 2010. – 240 с.