Современные информационные технологии /1. Компьютерная
инженерия
Сазонов
Г.В., Аждер Т.Б.
Московский
технологический университет, Россия
Анализ стратегий распределения данных
Современные
тенденции развития информационной системы состоят в переходе от централизованных
вычислительных систем к распределенным. Увеличение потребностей в приложениях и
требований к оперативности и своевременности информации делает актуальной
задачу создания распределенных информационных систем. Для повышения
производительности распределенных приложений, работающих с базами данных (БД),
необходимы эффективные методы проектирования распределенных БД.
При
проектировании распределенных БД одной из основных проблем является распределение
данных в логических узлах обработки информации. Выбор стратегии распределения
данных по узлам сети ЭВМ зависит от количества узлов, содержащих данные, и необходимости
дублирования информации. Также на выбор
влияет архитектура системы и программное обеспечение СУБД.
Централизация баз данных. Централизованный метод (или
метод извлечения данных вручную) – самый простой в реализации метод.

Рисунок 1 – Централизованное
распределение
Единственная
копия БД располагается на единственном сервере, который обеспечивает все
операции с данной базой. С помощью удаленного запроса или удаленной транзакции
выполняется доступ к данным.
Преимуществом
метода является простота актуализации данных в БД.
Недостатки
метода:
̶
ограничение
базы размером внешней памяти;
̶
обращение
всех запросов к единственному серверу;
̶
ограничение
на параллельную обработку;
̶
недоступность
базы при возникновении ошибок связи;
̶
полная
неработоспособность системы при выходе из строя центрального сервера.
Расчленение распределенной базы данных. При этом подходе есть одна
копия БД, а в отдельных узлах размещены локальные БД. Размер распределенной БД
ограничен требуемым объемом вторичной памяти, которая имеется во всей
информационной сети. Эффективность данной стратегии тем выше, чем выше степень
локализации ссылок.

Преимущества
метода:
̶
увеличение
объема БД;
̶
сокращение
времени ответов при удовлетворении большинства запросов локальными базами;
̶
сокращается
время ответа большинства запросов локальными базами;
̶
повышение
доступности и надежности;
̶
уменьшение
стоимости запросов на выбор и обновление по сравнению с централизованным
распределением;
̶
сохранение
частичной работоспособности системы при выходе из строя одного сервера.
Недостатки
метода:
̶
увеличение
времени ожидания и стоимости в случае потребности части удаленных запросов или
транзакций в доступе ко всем серверам;
̶
требование
информированности о размещении данных в БД.
При этом увеличиваются доступность и надежность. Расчлененные БД чаще
применяются при совместном использовании локальных и глобальных сетей ЭВМ.
Дублирование распределенных баз данных. При использовании данного
метода полная БД располагается на каждом сервере сети ЭВМ.

Рисунок 3 – Метод
дублирования
Использование
данной стратегии предполагает создание нескольких копий БД, при этом полная в
каждом логическом узле располагается копия всех данных.
Преимущества
метода:
̶
высокая
надежность информационной базы к простоте ее восстановления;
̶
надежный
способ хранения данных;
̶
обеспечение
быстрого доступа вследствие локального выполнения запросов.
Недостатки
метода:
̶
строгие
требования к объему внешней памяти;
̶
необходимость
синхронизации для согласования копий при корректировке баз.
Дублирование БД
применимо в случае критичности фактора надежности, небольшом размере базы и
низкой интенсивности обновления.
Смешанная
стратегия.
Метод смешанного распределения сочетает способ дублирования и расчленения
данных.

Рисунок
4 – Смешанное распределение
При
использовании данной стратегии необходимо хранить информацию о месте нахождения
данных в сети.
Преимущества
метода:
̶
гибкость
системы;
̶
легкая
реализация параллельной обработки.
Недостатки
метода:
̶
взаимозависимость
влияющих на производительность системы факторов;
̶
повышенные
требования к памяти.
Смешанная
стратегия применяется при наличии сетевой СУБД, обеспечивающей реализацию
распределенной БД.
Литература:
1.
Арсеньев
Б.П., Яковлев С.А. Интеграция распределенных баз данных. - СПб.: Лань, 2001.
2.
Кузнецов
С.Д. Основы баз данных. 2-е изд. М.: Бином, 2007.
3.
Таненбаум
Э., Ван Стеен М. Распределенные системы. Принципы и парадигмы. СПб.: Питер,
2008.