Подобрий А.Н.

Ульяновский государственный технический университет, Россия

Методы интеграции корпоративных хранилищ данных

 

Одной из основных задач  промышленного предприятия является своевременный выпуск продукции. Для выполнения данной задачи необходимо отслеживать жизненный цикл изделий с момента заключения договора на разработку изделия до проведения испытаний и сдачи готовой продукции заказчику. Сам цикл включает в себя отслеживание заявок на закупку материалов, сдачи конструкторско-технологической документации и т.д.

Проблема, которая возникает при проектировании автоматизированной системы по отслеживанию жизненного цикла изделия – разрозненность источников хранения данных.  В роли данных источников выступают самостоятельные корпоративные хранилища данных [2].

Корпоративные хранилища данных представляют собой организованные интегрированные коллекции данных, которые собраны из разных информационных источников. Хранилище данных обеспечивает возможность анализа накопленных данных и становится основой для построения систем принятия решений.

Существует множество готовых решений помогающих в той или иной мере решить данную задачу: PDM системы (Product Data Management — система управления данными об изделии) и PLM системы (Product Lifecycle Management – жизненный цикл изделия) [3,4]. Как правило, данные системы слишком дорогостоящие или решают задачу в общем виде. В любом случае, для максимальной отдачи данных систем необходима интеграция всех корпоративных хранилищ данных в единое информационное пространство предприятия.

К основным интеграционными подходами можно отнести: интеграция данных, бизнес-процессов, приложений и взаимодействий пользователей.

Интеграция данных обеспечивает получение единого представления обо всех информационных объектах предприятия на всех уровнях производства и бизнес-процессов.

Уровень интеграции разнородных приложений позволяет управлять потоками событий и координации работы приложений  в разрезе контекста транзакций, сообщений или данных.

         Интеграции бизнес-процессов необходима для определения и реализации процессов обмена и реализации корпоративной информации между корпоративными хранилищами данных.

Интеграция взаимодействия пользователей обеспечивает их единым интерфейсом доступа к корпоративным хранилищам данных с учетом персонализированного и безопасного уровня доступа. Данная интеграция позволяет наладить совместную работу пользователей со всем набором представляемых данных.

В основе всех перечисленных интеграционных подходов лежит интеграция данных. Интеграция данных является основой, от которой зависит успешность интеграции на всех других уровнях информационной системы. Основными методами интеграции корпоративных хранилищ данных являются: консолидация, федерализация и распространение [1].

При использовании метода консолидации данные собираются из нескольких первичных систем и интегрируются в одно постоянное хранилище. При использовании метода федерализации данных образуется единое виртуальное информационное пространство, данные в котором могут храниться в различных источниках, однако информация о расположении данных недоступна запрашивающей стороне. Наконец, метод распространения, при котором осуществляется перенос данных из одной системы в другую. 

У каждого из перечисленных выше методов есть свои достоинства и недостатки. При использовании метода консолидации возможна некоторая задержка между моментом обновления информации в первичных системах и временем, когда данные изменения появляются в конечном месте хранения. А преимуществом данного метода является то, что он позволяет агрегировать (привести в соответствие) данные в процессе передачи информации в конечное хранилище.  Преимуществом федеративного подхода является то, что он обеспечивает доступ к необходимым данным и исключает необходимость переноса информации из одного хранилища в другое. Минусом данного метода есть затраты на производительность и доступ к многочисленным хранилищам данных. Большим преимуществом метода распространения является то, что он может быть использован для перемещения данных в режиме реального времени или близком к нему. Другие достоинства включают гарантированную доставку данных и двустороннее распространение данных.

Существует и гибридный метод интеграции данных, включающий в себя несколько из описанных выше методов. Данный метод используется в тех случаях, когда использование одного из перечисленных самостоятельных методов не является возможным.

Использование, какого либо из перечисленных методов на производственном предприятии не позволяет в полной мере решить вопрос интеграции самостоятельных корпоративных хранилищ данных.  Это связано с такими факторами как самостоятельность, производительность, распределенность корпоративных хранилищ и т.д. В связи с этим необходим метод включающий в себя все из выше перечисленных методов и возможность интеграции корпоративных хранилищ физически находящихся в разных сетях.

Как вариант решения данной проблемы, использование гибридного метода консолидации, федерализации и распространения (рис 1). В основе данного метода лежит структура метаданных, которая объединяет в себе разные самостоятельные корпоративные хранилища.

Рис. 1 Гибридный метод интеграции корпоративных хранилищ данных

Метод консолидации используется для сбора информации из дочерних хранилищ, а распространения для интеграции с хранилищами, которые территориально или физически находятся в разных сетях. Для связи с последними возможно использовать механизм xml выгрузок (рис. 2).

 

Рис. 2 Структура представления информации для веб ресурсов

В основе данного механизма лежит алгоритм выгрузки данных в xml формате, позволяющий обновлять информацию и синхронизировать структуру корпоративного хранилища. Сам xml файл включает в себя:

- Список таблиц;

- Список полей таблиц;

- Ключевые поля таблиц;

- Метод загрузки данных;

- Набор данных.

Таким образом, предложенный метод позволяет создать единую структуру хранения данных за счет интеграции самостоятельных хранилищ данных в единое информационное пространство предприятия. За счет механизма xml выгрузок можно поддерживать интеграцию как с информационными система доступ к базе данных, которых запрещен, так и к удаленным хранилищам данных, таких как сеть Интернет. Отслеживать жизненный цикл изделия и своевременно реагировать на возможные отставания и проблемы в выпуске продукции.

 

Литература:

1.     Таненбаум Э. Распределенные системы. Принципы и парадигмы / Э. Таненбаум, М. ван Стеен. – СПб.: Питер, 2003. – 877 с.

2.     Хранилище данных как основа корпоративной интеграции Автор: А.Кудинов Издание: PC Week/RE Дата: 2006, Intersoft Lab

3.     Н. Дубова. Системы управления производственной информацией. «Открытые системы», 1996, №3

4.     Кеворков С. Поддержка жизненного цикла изделия /  «Открытые системы»,  12, 2005