К.т.н., ст.преподаватель Исмаилов Х.Б., Алимбекова А.Т.

Южно-Казахстанский государственный университет

им. М. Ауезова, Казахстан

Проектирование распределенных баз данных

информационных систем

 

Построение современных распределенных баз данных сегодня на прямую связано с реляционными и объектно-ориентированными СУБД, которые в последнее время утвердились как основные средства для обработки данных в информационных системах различного масштаба - от больших приложений обработки транзакций в банковских системах до персональных систем на РС.

Под распределенной обычно подразумевают базу данных, включающую фрагменты из нескольких баз данных, которые располагаются на различных узлах сети компьютеров и  управляются различными СУБД. Распределенная база данных выглядит с точки зрения пользователей и прикладных программ как обычная локальная база данных. В этом смысле слово «распределенная» отражает способ организации базы данных, но не внешнюю ее характеристику.

 

 

 

 

 

 

 

 

 

 


Рисунок 1. Свойства и качества идеальной РДБ

Одной из оптимальных определений распределенных баз данных (РДБ) предложил Дэйт, установивший 12 свойств или качеств идеальной РДБ (рисунок 1).

Одним из главных направлений совершенствования системы управления крупными промышленными предприятиями в настоящее время является разработка и внедрение интегрированных автоматизированных систем управления, информационных и управляющих систем. Массовое управление технологическими процессами и предприятиями весьма остро ставит проблемы повышения эффективности использования ЭВМ и систем передачи информации. Специфика этих систем заключается в том, что вычислительные, информационные ресурсы и средства передачи данных размещаются на территории некоторого региона. При этом возникает необоснованное дублирование информации, затрудняется доступ пользователей к накопленной информации. Непрерывное развитие рыночных экономических отношений требует решения все более сложных и трудоемких задач управления. При отсутствии развитой информационной системы невозможно обеспечить адекватные управленческие технологии, соответствующие динамике сегодняшнего дня.

        Создание автоматизированных систем управления и информационных систем связано с широким внедрением сетей ЭВМ, распределенных баз данных и систем передачи информации. РБД отличает функциональная и структурная сложность [1], процесс их проектирования характеризуется большой длительностью, высокой трудоемкостью и значительными финансовыми затратами. Имеющийся в настоящее время аппарат для разработки логических и физических структур РБД недостаточно формализован и базируется в основном на использовании опыта и интуиции разработчиков, что не позволяет оптимизировать процессы проектирования и функционирования РБД. Более того, при проектировании никак не учитываются ни особенности химической технологии, ни, тем более, особенности работы цепочки взаимосвязанных и размещенных на значительной территории производств. Вопросы формирования методики синтеза эффективных структур распределенных баз данных для создания интегрированных АСУ предприятиями химической технологии в настоящее время разработаны недостаточно, решены только отдельные вопросы проектирования структур РБД, не содержащие общих подходов к созданию такого рода систем. Одной из важных компонент распределенных систем являются системы, которые обладают развитым аппаратом обработки больших объёмов информации, структурированной в базы данных. В настоящее время применение концепции баз данных в распределенных системах является общепринятым. По мере развития таких систем постоянно возрастают сложность решаемых ими задач и объёмы обрабатываемой информации [2]. При этом распределенные системы должны обладать средствами оперативной обработки больших объёмов информации. Современные тенденции развития информационной системы состоят в переходе от централизованных вычислительных систем к распределенным. Стратегии распределения данных по узлам сети диктуются как управленческими, так и производственными задачами конкретных химических производств.

Можно рассмотреть несколько альтернативных стратегий распределения данных [3,4,5], каждая из которых имеет как преимущества, так и недостатки. Основным преимуществом централизованной базы данных является простота. Все операции выполняются под контролем единственного узла. Все запросы на выборку и обновление данных направляются в центральный узел. Недостатком данной стратеги является то, что размер базы данных ограничивается объемом внешней памяти в центральном узле. Кроме того, центральный узел может стать узким местом всей системы с точки зрения надежности, поскольку база данных становится недоступной при появлении ошибки в системе связи и полностью выходит из строя при выходе из строя центрального узла. Это является недопустимым для экологически опасных химических производств.

Стратегия расчленения, при которой единственная копия базы данных в виде непересекающихся подмножеств распределяется по многим узлам сети, не допускает существования копий отдельных частей базы данных. При этом на первый план выдвигается процесс проектирования расчлененных данных с целью получения преимуществ за счет распределения запросов на выборку и обновления по тем узлам, где расположены запрашиваемые данные. В этом случае стоимость связи может быть снижена за счет того, что большая часть запросов к базе данных будет осуществляться в локальных узлах. С другой стороны, запрос может потребовать доступа ко всем узлам сети, и это приведет к большой стоимости связи и к большему времени задержки, чем в случае централизованной базы данных, что для ряда производств химической технологии может быть недопустимо, поскольку сопряжено с риском появления аварийных ситуаций. Однако надежность может быть повышена по сравнению с централизованным подходом, поскольку в случае выхода из строя системы база данных все же может оказаться частично работоспособной. При распределении данных с использованием стратегии дублирования в каждом узле сети размещается полная копия базы данных. Основное преимущество этой стратегии относится к области надежности и эффективности выборки, что требует, однако, значительных затрат памяти. Кроме того, с целью согласования множественных копий базы данных необходимо поддерживать их изменения, что является трудно выполнимой задачей, отвлекающей значительные ресурсы системы. Смешанная стратегия распределения данных объединяет подходы, связанные с расчленением и дублированием данных, и приобретает как все их преимущества, так и недостатки. При этом подходе любая часть базы данных может быть дублирована произвольное число раз, и в каждом узле может содержаться желаемая часть базы данных. Недостаток подхода - сложность обработки, оптимизации запросов.

В связи с вышеизложенным, сокращение сроков и стоимости создания РБД, необходимость эффективного использования ресурсов РБД определяют целесообразность разработки формализованных моделей и методов, позволяющих автоматизировать наиболее трудоемкие этапы проектирования РБД, выбрать решения, оптимизирующие их состав и структуру.

 

Литература

1.     Фаронов В.В., Шумаков П.В. 4. Руководство разработчика баз данных - М.: "Нолидж", 1999. - 560 с., ил.

2.     Г.Хансен, Д.Хансен Базы данных: разработка и управление: Пер. с англ. - М.: ЗАО "Издательство БИНОМ", 1999. - 704 с.: ил.

3.     С.Дунаев Доступ к базам данных и техника работы в сети. Практические приемы современного программирования. - М.: ДИАЛОГ-МИФИ, 1999 - 416 с.

4.     Овчинников Е.М. Корпоративные информационные системы и технологии / Конспект лекций - М.: Учебный Центр ОАО Газпром, 1999. - 78 с.

5.     Е.Голенцова Три основных вопроса СУД. ОАО "Весть". 1998.