Д.Е. Ефремов, А.Н. Подобрий
Формирование
регламента обслуживания защищенного центра обработки данных в условиях
ограниченного доступа.
Растущая зависимость от информационных
технологий заставляет предприятия искать способы повышения надежности и
доступности этого критически важного инструмента. И одним из таких способов
стало строительство центров обработки данных (ЦОД). Даже идеально спроектированный
и построенный ЦОД не сможет нормально функционировать, если процедура его
эксплуатации не организована должным образом.
Большинство проблем возникает вследствие
ошибок на стадии проектирования, особенно
в условиях ограниченного доступа, из-за которых эксплуатация ЦОД оказывается
затруднительна, а иногда совершенно невозможна. Самыми распространенными
недочетами являются узкие эксплуатационные проходы, малые габариты
распределительных щитов и отсутствие в них места под резервные автоматы, недостаток
места для установки оборудования с нетиповыми габаритами и нестандартным
электропитанием, а также неправильно проложенные коммуникации под фальшполом,
препятствующие эксплуатации кабельной системы.
Многие
организации для формирования регламента обслуживания сталкиваются со следующими
вопросами[1]:
1. Проведение
регламентных работ.
Перечень
инженерных систем требующих ухода и необходимых действий с расписанием и
сроками выполнения.
2. Формирование
обслуживающего персонала[2].
Как
правило, решение данного вопроса сводится к заключению контракта с
эксплуатирующей организацией или содержание собственного штата инженеров.
Каждый из представленных подходов имеет свои преимущества, однако содержание
квалифицированного штата сотрудников обходится недешево, к тому же приходится
нести дополнительные затраты, связанные с повышением квалификации персонала и
ежегодными аттестациями.
3. Формирование
алгоритма действий.
Для
оптимизации процесса эксплуатации и скорости реакции на возникающие проблемы
рекомендуется выбрать единый алгоритм действий, начиная от обнаружения проблемы
до ее устранения.
4. Формирование
рабочей документации[3].
Необходимый
перечень документации для формализации процедуры эксплуатации, регламентирующий
все события, происходящие в ЦОД. Среди данных документов можно выделить: журнал
регламентных работ, проектная документация, техническая документация на
инженерное оборудование, инструкция к действиям в нештатных ситуациях, журнал
нештатных ситуаций, штатное расписание работы оборудования, штатное расписание
эксплуатирующего персонала, оперативный журнал.
5. Организация
склада запасных частей.
Перечень
наиболее уязвимых деталей инженерного оборудования, список которых должен
приводиться в инструкции по его эксплуатации. В соответствии с этими списками
следует держать на складе расходные материалы в количестве, достаточном для
замены в оборудовании в течение года.
6.
Системы диспетчеризации и мониторинга.
Внедрение
систем диспетчеризации и мониторинга для повышения эффективности работы
персонала и скорости его реакции на нештатные ситуации. Система диспетчеризации
вкупе с грамотно организованной службой эксплуатации позволит значительно
повысить надежность функционирования ЦОД.
На основании сформированного списка вопросов, а также
с учетом условий ограниченного доступа к ЦОД можно предложить следующее
решение:
1.
Два времени обслуживания: «Online» и «Offline». Время
обслуживания «Online» совпадает с графиком работы специалистов, которые в этот
момент находятся на предприятии и могут получить доступ к ЦОД. «Offline» - время, в которое ЦОД
обслуживается только из сети Интернет. В это время осуществляется мониторинг
основных параметров ЦОД с помощью сторонних сервисов и собственных решений.
2.
Регламентные работы, которые включают еженедельные проверки
журналов серверов, анализ отчетов безопасности шлюза и работоспособности
оборудования. Также раз в 3 месяца планируются работы по обслуживаю серверных
стоек, еще реже работы по диагностике и обслуживаю охлаждающего оборудования и
сетей электропитания.
3.
В
штатное расписание включено трое сотрудников. Связист, который отвечает за
доступность каналов доступа к сети. Системный администратор, в обязанности
которого входит мониторинг систем, их внедрение и поддержка. Программист
отвечает за внедрение новых и поддержку уже существующих сервисов.
4.
Алгоритм
действий при возникновении нештатных ситуаций, которые необходимо выполнить для
выявления и устранения проблемы. В этот перечень входят действия по анализу
систем мониторинга, коммутационного оборудования, охлаждающих систем и др.,
замене каких-либо компонентов ЦОД. Также алгоритмы действий по восстановлению
сервисов (миграции, восстановление из резервных копий и др.).
5.
Проектная
(рабочая) документация описывающая логику работы подсистем ЦОД, среди которой
электросхема, содержащая информацию об узлах электропитания, внутренняя
структура, представленная в виде схем внешней и внутренней маршрутизации.
6.
Создание
«узкого входного горлышка», позволяющего ограничить доступ на основные сервера
ЦОД, реализованого в виде физического сервера с
программным шлюзом на базе Debian.
Таким образом, решение задачи формирования регламента
основано на компромиссе между реакцией на возникновение нештатных ситуаций и
безопасности обрабатываемой информации.
Список литературы
1. Андрей Павлов.
Правила текущей эксплуатации центра обработки данных. – «Журнал сетевых
решений/LAN», № 07, 2007.
2. Алексей Дегтярев,
журнал «ЦОДы.рф», выпуск №1.
3.
www.seagate.com «Управление ЦОД: тенденции и сложности»,
2014.