ПРОГРАММНАЯ СИСТЕМА ДЛЯ ВЕДЕНИЯ МОНИТОРИНГА СОСТОЯНИЯ РЕСУРСОВ И НОСИТЕЛЕЙ ДАННЫХ ТЕЛЕКОММУНИКАЦИОННОЙ СИСТЕМЫ

 

Куандыков А.А., Зыкин Е.Л.

 

1. Актуальность решения проблемы

Большие компании нуждаются в мониторинге технических ресурсов своей телекоммуникационной системы (ТКС) таких как:

1)      Свободные места на жестких дисках;

2)      Свободные места в таблицах СУБД (систем управления баз данными);

3)      Проверять персональные компьютеры на наличие LAN-соединений;

4)      Проверять на соединение с СУБД;

и т.д.

В случае возникновения инцидента, т.е. отклонения состояния указанных средств ТКС от нормальных состояний системный администратор, точнее бригада из системных и сетевых администраторов, должен оперативно определить возникшей проблемы и добиться нормального функционирования ТКС и выполнения порученной системе (поставленной перед нею) бизнес-задачи. Для ТКС бизнес-задачей или поддерживаемым бизнес-процессом является оказание качественных телекоммуникационных услуг своим клиентам или населению в целом.

В случае большого объема технических средств у компании ручное выполнение действий по администрированию требует очень большого объема человеческого ресурса и времени [1].

Недостатком ручного выполнения администраторских функции заключается в том, что во-первых приведет к большим производственным потерям и во-вторых в период длительного времени восстановления могут возникать новые инциденты и патологий. В результате могут возникать очередь из не обслуженных инцидентов и патологий, которые в конце концов могут привести к катастрофическим ситуациям [2].

 

2. Задача мониторинга ресурсов и носителей данных

телекоммуникационной системы

Одним из пути решения указанной проблемы может быть достигнуто автоматическим или автоматизированным выполнением процессов мониторинга и восстановления нормального функционального состояния ТКС.

Данную проблему представим в виде задачи проведения мониторинга и восстановления нормального рабочего режима ТКС при минимизации затраты времени на ее восстановления в составе более общей задачи управления функциональность ТКС. В данном варианте интерпретации задачи проведение мониторинга и восстановления рассматривается как разновидность, частный вариант (или составляющей) задачи обеспечения функциональности ТКС.

Формальная постановка задачи такова [3-4].

Представление исходного состояния ТКС. Пусть на ТКС в текущий момент функционирования t возникло состояние Сtek или С(t), в котором эффективность функционирования ТКС определена как Q = Q(С(t).

Тогда, согласно заданной IТ-стратегии «обеспечение и управление функциональностью ТКС» следует переходит на такое состояние функционирования ЕКС: Сother, Î С, для которого выполняются условия:

-         достижимости в рамках ресурсов, заданных IT-стратегией (внутренних ресурсов);

-         эффективности функционирования ТКС: Qother) в нем выше чем в других достижимых состояниях на величину Dw (задаваемой IТ-стратегией), возможно, что Qother) = 0;

-         затраты на его достижение ниже, чем в других достижимых состояниях.

Кроме того, согласно IТ-стратегии «обеспечение и управление функциональностью ТКС» требуется, что в состояние Сother система «Сбу-ТКС» не должна потеряет свойства системности. Системность сводится к выполнению условия сохранения надежности, защищенности, безопасности, корректности, устойчивости.

Введем ряд условий (оформляемые в виде метапредикатов эвристики или правил, аксиомы), исходя из которых следует сформулировать задачу управления функциональностью ТКС.

1. Предпочтительным состоянием ТКС является такое, которое предусмотрено IТ-стратегией.

2. В случае отсутствия пополнения внутренних функциональных ресурсов является предпочтительным то новое состояние, которое ближе к тому состоянию, в котором находилось до момента времени функционирования.

3. При формулировке системной задачи управления предполагается, что поведение РКС описывается цепью Маркова. Тогда решение задачи по восстановлению состояния ТКС осуществляется по последнему состоянию ТКС.

Решение прикладных задач и качество функционирования ТКС можно демонстрировать таким образом.

Если ТКС представить, как оператор А, преобразующий исходные данные прикладных задач в выходные данные. Тогда оператор А имеет определенные характеристики, а в формулировке системной задачи управления определяются требования к значениям этих характеристик при различных состояниях внешней среды.

На основе представленной IТ-стратегии и введенных метаправил можно сформулировать задачу с различным синтаксисом, семантикой и прагматикой. Приведем два варианта формулировки системной задачи управления ТКС среди возможных.

Расширенный вариант формулировки задачи. Расширенный вариант формулировки задачи управления функциональностью РКС на системном уровне представим таким образом.

Системную задачу управления рассматриваем в трех временных разрезах: T = {t-, t, t+}, где t- - момент времени до возникновения инцидента, t-Î(-¥, t), t - момент времени, соответствующий моменту возникновения инцидента, точнее интервалу момента возникновения tÎ(t, Dt); t+ - момент времени после возникновения инцидента, t+Î(t, ¥).

Момент времени t-. Исходное состояние ТКС в момент времени t- таково:

ТКС функционирует в нормальном рабочем режиме С(t) Î Сz(t).

Ведется решение прикладных задач: PZ(t) = {pz1, pz2, …, pzi, …, pzm};

Показатели качества решения PZ(t) не ниже, чем: Wз(t) = (wз1, wз2, wз3, …, wзi, …, wзh, …, wзk), которые заданы в начале запуска задач (и хранятся в метомодели), исходя из требований поддерживаемого БП.

Уровень исходных функциональных ресурсов. Процесс решения этих задач поддерживается исходной или начальной функциональностью РКС: Yи(t) = {jиi(t)}, которые достаточно для поддержания показателей на уровне: Wз(t).

Или текущее состояние функциональности задается показателями: Yи(t) = {jиi(t)}.

Момент времени t. Пусть в текущий момент t работы РКС возникло состояние С(t) (т.е. инцидент), при котором качество решения задачи стало ниже чем: Wф(t) < Wз(t), т.е. либо прекратилось решение задач, либо стало неудовлетворительной (это последствие или фатальное состояние).

Момент времени t+. Тогда необходимо управлять функциональными ресурсами Y(t) = {ji(t)}, т.е. перевести в такое новое состояние Yн(t) = {jнi(t)}, так, чтобы в момент времени t+ (обеспечить или повысить уровень активной функциональности на основе использования пассивных функциональностей). Для этого требуется:

·        во-первых, решалось максимальное количество задач: PZ(t) = {pz1, pz2, …, pzi, …, pzm} поддерживаемого БП (путем перевода нового работоспособного состояния ТКС в такое Cj и путем создания достаточной функциональности), т.е. |PZ(t)| ® max;

·        во-вторых, для качества решения этих задач выполнялись условия: между Wф(t) = (wф1, wф2, wф3, …, wфi, …, wфh, …, wфk) и Wз(t) = (wз1, wз2, wз3, …, wзi, …, wзh, …, wзk) было (Wф(t) - Wз(t)) ® min или (Wф(t) - Wз(t)) > 0.

Если представленные два варианта формулировки системной задачи управления сравнивать с точки зрения адекватности и семантической силы, отражающие особенности проблемы управления функциональностью ТКС, то второй вариант задачи является шире и охватывает, как пространство функционирования ТКС, так и пространство работы ТКС.

Сформулированные варианты системной задачи вызывают различные форматы выполнения процессов управления функциональностью ТКС.

Среди различных вариантов формулировки системной задачи при создании системы управления выбирается тот вариант, который наиболее подходит поставленной цели и особенностям ТКС, функционированием которых планируется управлять. Кроме того, вариант формулировки определяется еще возможностью автоматического выполнения действий по управлению, а также определяет выполняемые операций, которые должен выполнять человек-администратор. Операции, выполняемые человеком определяются, исходя из его способности воспринять и запоминать информацию и скорости реагирования на реакцию системы.

Для решения данной задачи разработана программная система.

Данная программная система оказывает сервис администратору по мониторингу и восстановлению состояния системы ее технических ресурсов в реальном масштабе времени.

При этом осуществляет систематизацией и упорядочиванием данных и формирует отчеты о проделанной работе и подтверждать их реальными фактами для администратору системы для принятия решений им.

 

3. Программная система мониторинга ресурсов и носителей данных телекоммуникационной систем

Общая структура программы решения данной задачи такова. Программа состоит из трех пунктов, т.е. разделов:

1) определение адрес и параметры компьютера: рабочая станция или сервер, имеющего RAID массива носителей информаций. Это операция осуществляется путем выбора характеристик, проверяемого компьютера из таблицы, которая заранее составлена и хранится в системе;

2) выбор dll, осуществляющего проверку состояния носителей информации выбранного компьютера. Для этого в данный dll передается данных о характеристиках носителей информации проверяемого компьютера;

3) оформление результата проверки состояния носителей выбранного компьютера для выдачи на экран в виде отчета администратору.

Для решения выше отмеченной задачи кроме dll для мониторинга состояния носителей компьютера используется еще другие dll.

В работе созданы следующие dll:

 

Наименования

Особенность

Назначения

MonDevice.dll

Работает с технологией WMI (Windows Management Instrumentation)

Мониторинг технических ресурсов удаленных ПК

MonSQL.dll

Работает с SQL запросами для различного видов баз данных

Мониторинг данных баз данных

Служба.exe

Сервис (Service)

Осуществляет запуск задач в указанное для них время. Уведомляет администраторов о неполадках. Ведет историю сообщений.

Редактор Задач.exe

Приложение (Application)

Позволяет администратору быстро и удобно установить задачу и метод решения

Клиент.exe

Приложение (Application)

Позволяет получать сообщения со Службы мониторинга

 

В ходе решения задачи мониторинга программа выполняет следующие функций:

1)      Обеспечить быстрый мониторинг

2)      Автоматизировать все виды мониторинга

3)      Установить связь с администраторами которые будут использовать данную систему (почта)

4)      Использовать уже имеющие технологии для получения информации по техническим ресурсам компании

5)      Обеспечить удобный вид отчетов

6)      Вести статистику

7)      Использовать модульное подключение для быстрого расширения функционала основной программы.

Данная программа допускает создать программный комплекс, состоящего из взаимосвязанных программных модулей, обеспечивающий решение более масштабной задачи администрирования.

Работу данной программной системы назовем службой.

Служба будет запускать задачи в реальном времени и через указанный в настройках интервал.

Редактор службы, который является приложением, позволяет заполнять, установить или настроит параметры задачи нашей службы.

Клиентская программа, которая также является приложением, работает на стороне клиентов. Клиентами в нашей службе является администраторы. Для клиентов данная программа будет предоставляет отчеты о состояний ресурсов данных и их носителей.

База данных для работы программы построена на Firebird 2.1

Структура таблицы TASKS базы данных такова:

 

Наименование поля

Смысл значения полей

ID

Инкрементное поле

NAME

Название задачи

TIMEREPEAT

Время повтора задачи

COMMANDS

Поле Команды. Объединяет в себе:

1 Используемую dll;

2 Настройки подключения;

3 SQL Запрос;

4 Условие при котором отправляется сообщение;

5 Текст сообщения.

PREV_DT

Время последнего выполнения

 

Пример, заполнения Таблицы TASKS.

Наименование поля

Смысл значения полей

ID

1

NAME

WMI (GET SPACE HARD DISK)

TIMEREPEAT

00:05:00

COMMANDS

<task>

   <library name="MonDevice.dll"/>

   <params>

     <param name="computer" value="127.0.0.1"/>

     <param name="username" value=""/>

     <param name="password" value=""/>

     <param name="command" value="SELECT * FROM Win32_LogicalDisk WHERE Name = 'C:' or name='D:'"/>

   </params>

   <result>

     <field name="FreeSpace" condition="&lt;" alert="15000" message="Объем диска %DeviceID% меньше допустимого значения"/>

     <field name="Size" condition="&gt;" alert="10000" message="Диск заполнен больше допустимого значения серийный номер =%ValumeSeriaNumber% "/>

     <field name="Size" condition="&gt;" alert="48484" message="На диске %DeviceID% осталось свободного места %FreeSpace%."/>

   </result>

</task>

PREV_DT

20.07.2009: 00.00.00

 

Примечание: При выводе сообщений мы можем использовать данные с SQL запросов. Для этого нужно взять в «%» нужное поля ПРИМЕР: %FreeSpace%

 

Примеры, полученных сообщений:

п/п

Смысл сообщения – значения параметра сообщения

1.1.

Условие совпало: 104750641152>10000

1.2.

Разъяснение: Диск заполнен больше допустимого значения и серийный номер: FC4389DE

2.1.

Условие совпало: 104750641152>48484

2.2.

Разъяснение: На диске C: осталось свободного места: 83054571520.

3.1.

Условие совпало: 104853504>10000

3.2.

Разъяснение:  Диск заполнен больше допустимого значения серийный номер: FC4389DE

4.1.

Условие совпало: 104853504>48484

4.2.

Разъяснение:  На диске D: осталось свободного места: 75063296.

 

4. Заключение

Созданная программная система показала свою работоспособность. Она обеспечивает высокую оперативность при мониторинге и обследовании состояния ресурсов и их носителей. Тем самым обеспечивает полной информацией о текущих состояниях технических средств хранения информации по каждой компьютерной системе ТКС.

Программная система допускает расширение и совместимость с другими программными модулями. Это позволяет создавать более масштабную систему с широкими и развитыми возможностями на базе данной программной системы, которая обеспечивает решение более масштабной задачи администрирования – задачи администрирования всей телекоммуникационной системы компании.

 

Литература

1.      Куандыков А.А. Принципы автоматизации процессов управления распределенной компьютерной системы на основе аксиоматического подхода. Труды Международной научно-практической конференции "ИНФОРМАЦИОННО-ИННОВАЦИОННЫЕ ТЕХНОЛОГИИ: ИНТЕГРАЦИЯ НАУКИ, ОБРАЗОВАНИЯ И БИЗНЕСА".27-28 ноября 2008. С.289-294.

2.      Куандыков А.А. Вопросы создания системы управления функционированием компьютерной системы на основе скриптов. Труды Международной научно-практической конференции "ИНФОРМАЦИОННО-ИННОВАЦИОННЫЕ ТЕХНОЛОГИИ: ИНТЕГРАЦИЯ НАУКИ, ОБРАЗОВАНИЯ И БИЗНЕСА".27-28 ноября 2008. С. 269-273.

3.      Куандыков А.А. Аксиоматическая теория ситуационного управления. MATERIAŁY IV MIĘDZYNARODOWEJ NAUKOWI-PRAKTYCZNEJ KONFERENCJI, 1-14 lutego 2008 roku, «NOWOCZESNYCH NAUKOWYCH OSIĄGNIĘĆ – 2008», Techniczne nauki Budownictwo I architektura, Tym 17, Przemyśl, Nauka i studia. 2008. str.56-65.

4.      Куандыков А.А. Теоретические основы ситуационного управления. MATERIÁŁY IV MEZINÁRODNÍ VĚDECKO-PRAKTIСKÁ KONFERENCE, 1-15 brezen 2008 roku, «VĚDA A NECHNOLOGIC: KROK DO BUDOUCNOSTI – 2008», Díl 12. Matematika, Fyzika, Moderní informační technologie, Výstavba a architektura, Praha, Publishing House "Education and Science" s.r.o. 2008. str.8-16.