Д.Е. Ефремов, А.Н. Подобрий

Формирование регламента обслуживания защищенного центра обработки данных в условиях ограниченного доступа.

Растущая зависимость от информационных технологий заставляет предприятия искать способы повышения надежности и доступности этого критически важного инструмента. И одним из таких способов стало строительство центров обработки данных (ЦОД). Даже идеально спроектированный и построенный ЦОД не сможет нормально функционировать, если процедура его эксплуатации не организована должным образом.

Большинство проблем возникает вследствие ошибок на стадии проектирования,   особенно в условиях ограниченного доступа, из-за которых эксплуатация ЦОД оказывается затруднительна, а иногда совершенно невозможна. Самыми распространенными недочетами являются узкие эксплуатационные проходы, малые габариты распределительных щитов и отсутствие в них места под резервные автоматы, недостаток места для установки оборудования с нетиповыми габаритами и нестандартным электропитанием, а также неправильно проложенные коммуникации под фальшполом, препятствующие эксплуатации кабельной системы.

Многие организации для формирования регламента обслуживания сталкиваются со следующими вопросами[1]:

1.     Проведение регламентных работ.

Перечень инженерных систем требующих ухода и необходимых действий с расписанием и сроками выполнения.

2.     Формирование обслуживающего персонала[2].

Как правило, решение данного вопроса сводится к заключению контракта с эксплуатирующей организацией или содержание собственного штата инженеров. Каждый из представленных подходов имеет свои преимущества, однако содержание квалифицированного штата сотрудников обходится недешево, к тому же приходится нести дополнительные затраты, связанные с повышением квалификации персонала и ежегодными аттестациями.

3.     Формирование алгоритма действий.

Для оптимизации процесса эксплуатации и скорости реакции на возникающие проблемы рекомендуется выбрать единый алгоритм действий, начиная от обнаружения проблемы до ее устранения.

4.     Формирование рабочей документации[3].

Необходимый перечень документации для формализации процедуры эксплуатации, регламентирующий все события, происходящие в ЦОД. Среди данных документов можно выделить: журнал регламентных работ, проектная документация, техническая документация на инженерное оборудование, инструкция к действиям в нештатных ситуациях, журнал нештатных ситуаций, штатное расписание работы оборудования, штатное расписание эксплуатирующего персонала, оперативный журнал.

5.     Организация склада запасных частей.

Перечень наиболее уязвимых деталей инженерного оборудования, список которых должен приводиться в инструкции по его эксплуатации. В соответствии с этими списками следует держать на складе расходные материалы в количестве, достаточном для замены в оборудовании в течение года.

6. Системы диспетчеризации и мониторинга.

Внедрение систем диспетчеризации и мониторинга для повышения эффективности работы персонала и скорости его реакции на нештатные ситуации. Система диспетчеризации вкупе с грамотно организованной службой эксплуатации позволит значительно повысить надежность функционирования ЦОД.

На основании сформированного списка вопросов, а также с учетом условий ограниченного доступа к ЦОД можно предложить следующее решение:

1.                 Два времени обслуживания: «Online» и «Offline». Время обслуживания «Online» совпадает с графиком работы специалистов, которые в этот момент находятся на предприятии и могут получить доступ к ЦОД. «Offline» - время, в которое ЦОД обслуживается только из сети Интернет. В это время осуществляется мониторинг основных параметров ЦОД с помощью сторонних сервисов и собственных решений.

2.                 Регламентные работы, которые включают еженедельные проверки журналов серверов, анализ отчетов безопасности шлюза и работоспособности оборудования. Также раз в 3 месяца планируются работы по обслуживаю серверных стоек, еще реже работы по диагностике и обслуживаю охлаждающего оборудования и сетей электропитания.

3.                 В штатное расписание включено трое сотрудников. Связист, который отвечает за доступность каналов доступа к сети. Системный администратор, в обязанности которого входит мониторинг систем, их внедрение и поддержка. Программист отвечает за внедрение новых и поддержку уже существующих сервисов.

4.                 Алгоритм действий при возникновении нештатных ситуаций, которые необходимо выполнить для выявления и устранения проблемы. В этот перечень входят действия по анализу систем мониторинга, коммутационного оборудования, охлаждающих систем и др., замене каких-либо компонентов ЦОД. Также алгоритмы действий по восстановлению сервисов (миграции, восстановление из резервных копий и др.).

5.                 Проектная (рабочая) документация описывающая логику работы подсистем ЦОД, среди которой электросхема, содержащая информацию об узлах электропитания, внутренняя структура, представленная в виде схем внешней и внутренней маршрутизации.

6.                 Создание «узкого входного горлышка», позволяющего ограничить доступ на основные сервера ЦОД, реализованого в виде физического сервера с программным шлюзом на базе Debian.

         Таким образом, решение задачи формирования регламента основано на компромиссе между реакцией на возникновение нештатных ситуаций и безопасности обрабатываемой информации.
Список литературы

1.   Андрей Павлов. Правила текущей эксплуатации центра обработки данных. – «Журнал сетевых решений/LAN», № 07, 2007.

2.   Алексей Дегтярев, журнал «ЦОДы.рф», выпуск №1.

3.   www.seagate.com «Управление ЦОД: тенденции и сложности», 2014.