Современные информационные технологии /1. Компьютерная инженерия

Сазонов Г.В., Аждер Т.Б.

Московский технологический университет, Россия

Анализ стратегий распределения данных 

Современные тенденции развития информационной системы состоят в переходе от централизованных вычислительных систем к распределенным. Увеличение потребностей в приложениях и требований к оперативности и своевременности информации делает актуальной задачу создания распределенных информационных систем. Для повышения производительности распределенных приложений, работающих с базами данных (БД), необходимы эффективные методы проектирования распределенных БД.

При проектировании распределенных БД одной из основных проблем является распределение данных в логических узлах обработки информации. Выбор стратегии распределения данных по узлам сети ЭВМ зависит от количества узлов, содержащих данные, и необходимости  дублирования информации. Также на выбор влияет архитектура системы и программное обеспечение СУБД.

Централизация баз данных. Централизованный метод (или метод извлечения данных вручную) – самый простой в реализации метод.

Рисунок 1 – Централизованное распределение

Единственная копия БД располагается на единственном сервере, который обеспечивает все операции с данной базой. С помощью удаленного запроса или удаленной транзакции выполняется доступ к данным.

Преимуществом метода является простота актуализации данных в БД.

Недостатки метода:

̶            ограничение базы размером внешней памяти;

̶            обращение всех запросов к единственному серверу;

̶            ограничение на параллельную обработку;

̶            недоступность базы при возникновении ошибок связи;

̶            полная неработоспособность системы при выходе из строя центрального сервера.

Расчленение распределенной базы данных. При этом подходе есть одна копия БД, а в отдельных узлах размещены локальные БД. Размер распределенной БД ограничен требуемым объемом вторичной памяти, которая имеется во всей информационной сети. Эффективность данной стратегии тем выше, чем выше степень локализации ссылок.

Рисунок 2 – Метод расчленения

Преимущества метода:

̶            увеличение объема БД;

̶            сокращение времени ответов при удовлетворении большинства запросов локальными базами;

̶            сокращается время ответа большинства запросов локальными базами;

̶            повышение доступности и надежности;

̶            уменьшение стоимости запросов на выбор и обновление по сравнению с централизованным распределением;

̶            сохранение частичной работоспособности системы при выходе из строя одного сервера.

Недостатки метода:

̶            увеличение времени ожидания и стоимости в случае потребности части удаленных запросов или транзакций в доступе ко всем серверам;

̶              требование информированности о размещении данных в БД.

При этом увеличиваются доступность и надежность. Расчлененные БД чаще применяются при совместном использовании локальных и глобальных сетей ЭВМ.

Дублирование распределенных баз данных. При использовании данного метода полная БД располагается на каждом сервере сети ЭВМ.

Рисунок 3 – Метод дублирования

Использование данной стратегии предполагает создание нескольких копий БД, при этом полная в каждом логическом узле располагается копия всех данных.

Преимущества метода:

̶            высокая надежность информационной базы к простоте ее восстановления;

̶            надежный способ хранения данных;

̶            обеспечение быстрого доступа вследствие локального выполнения запросов. 

Недостатки метода:

̶            строгие требования к объему внешней памяти;

̶            необходимость синхронизации для согласования копий при корректировке баз.

Дублирование БД применимо в случае критичности фактора надежности, небольшом размере базы и низкой интенсивности обновления.

Смешанная стратегия. Метод смешанного распределения сочетает способ дублирования и расчленения данных.

Рисунок 4 – Смешанное распределение

При использовании данной стратегии необходимо хранить информацию о месте нахождения данных в сети.

Преимущества метода:

̶            гибкость системы;

̶            легкая реализация параллельной обработки. 

Недостатки метода:

̶            взаимозависимость влияющих на производительность системы факторов;

̶            повышенные требования к памяти.

Смешанная стратегия применяется при наличии сетевой СУБД, обеспечивающей реализацию распределенной БД.

Проектирование является процессом трудоемким и может занять до нескольких месяцев. От опыта и интуиции проектировщика БД напрямую зависит качество решения.

Литература:

1.       Арсеньев Б.П., Яковлев С.А. Интеграция распределенных баз данных. - СПб.: Лань, 2001.

2.       Кузнецов С.Д. Основы баз данных. 2-е изд. М.: Бином, 2007.

3.       Таненбаум Э., Ван Стеен М. Распределенные системы. Принципы и парадигмы. СПб.: Питер, 2008.