Бейсенбаева М.Ш.
Университет
Туран-Астана
Анализ развития корпоративных
сетей
Сегодня
трудно представить себе крупное образовательное учреждение, научную
организацию, фирму и т. д., которые не имели бы подключения к сети Интернет. С
одной стороны, сеть Интернет открывает доступ к огромному объему информации, с
другой стороны, предоставляет возможность разместить собственные информационные
ресурсы. Однако, успешное использование сети Интернет в деятельности
организации невозможно при невысоком качестве ее Интернет-подключения. В
будущем следует ожидать все более глубокого проникновения сети Интернет во все
сферы человеческой деятельности, так что «качество» подключения к сети Интернет
выходит на первый план.
Изначально,
первыми начали разрабатываться методы и средства контроля качества соединения
между двумя точками сети Интернет. Действительно, с точки зрения пользователя,
Интернет-подключение сети является качественным, если оно обеспечивает
бесперебойный и быстрый доступ к определенным интересующим его сетевым
ресурсам. Производилось наблюдение за значениями таких характеристик (сетевых
метрик) соединения между двумя точками сети Интернет, как время доставки,
коэффициент потерь IP пакетов, доступность, максимальная скорость передачи данных по
определенному протоколу и т.д., а также за их флуктуациями во времени.
Однако,
за последние 10-15 лет сеть Интернет претерпела значительный рост. Это касается
количества подключенных сетей, пользователей, компьютеров, используемых в сети
приложений и передаваемого по сети трафика. Например, количество
зарегистрированных доменных имен на июль 2005 года, по данным InternetSoftwareConsortium,
достигло 353284187. Все это привело к тому, что среднее число пользователей в
сети организации и количество ресурсов, потенциально интересных для
пользователей, многократно возросло. С учетом того факта, что все
вышеперечисленные простейшие сетевые метрики зависят от времени и, в силу
децентрализации управления сетью Интернет, от множества других независимых
подсетей, входящих в глобальную сеть Интернет, контроль качества
Интернет-подключения в рамках традиционного подхода становится для системного
администратора непростой задачей. Возникает необходимость в аналитическом
описании происходящих в сети процессов, причем этот анализ должен проводиться в
рамках системного подхода.
Действительно,
глобальная компьютерная сеть Интернет представляет собой совокупность отдельных
подсетей (рассматривая сеть Интернет с различной степенью детализации, можно
выделить сети континентов, стран, поставщиков услуг Интернет, организаций и их
подразделений), обменивающихся друг с другом информацией, передаваемой по
объединяющих их каналам передачи данных. Таким образом, сеть Интернет можно
рассматривать как систему, состоящую из множества тесно
объединяющих их каналам
передачи данных. Таким образом, сеть Интернет можно рассматривать как систему,
состоящую из множества тесновзаимодействующих подсистем - отдельных входящих в
нее подсетей, объединенных в иерархическую структуру.
Согласно одному из
основных принципов системного подхода, всегда существует функция ценности
системы в виде зависимости ее эффективности от условий построения и
функционирования.
Данная
работа посвящена аналитическому описанию процессов, происходящих в
Интернет-канале крупной организации или поставщика услуг Интернет, как основной
составляющей глобальной компьютерной сети Интернет, и отысканию критерия
«качества» Интернет-подключения корпоративной сети с точки зрения интересов
всех пользователей сети, в виде некоторой «интегральной» характеристики.
Получив,
в рамках математических моделей, аналитические выражения для данной
«интегральной» характеристики через основные параметры сети и параметры
Интернет-подключения этой сети, становится возможным решение основных задач,
возникающих перед сетевыми администраторами и инженерами, таких как поддержка,
прогнозирование развития и оптимизация сетей.
Первая
задача возникает в повседневной практике сетевых администраторов и предполагает
обнаружение и устранение аномалий в работе сети. Также для обслуживающего
персонала сети необходимо иметь возможность предсказывать поведение сети при
изменении различных параметров, как-то: количества пользователей, подключенных
к сети, характеристик Интернет-подключения, запуске новых сетевых приложений и
т.д. Данная информация может быть использована при планировании развития сети
для удовлетворения потребностей пользователей в сетевых услугах.
Также,
системный администратор должен иметь возможность выбрать поставщика услуг
Интернет и оптимальную скорость Интернет- канала при заданных параметрах сети.
Применение
математических моделей Интернет-подключения сети не ограничивается
вышеприведенными примерами. Можно представить, что вычисление в реальном
масштабе времени метрик, характеризующих текущее состояние сети, может быть
использовано в сетевых устройствах (коммутаторах, маршрутизаторах) для
динамического перераспределения ресурсов или изменения алгоритмов работы для
обеспечения заданного качества функционирования сети.
Вообще,
математических моделей поможет глубже понять процессы, происходящие в сети, и
пути совершенствования существующих протоколов, приложений, сетевых архитектур
для достижения максимальной производительности сетей.
Как
уже было замечено выше, традиционный
подход в обслуживании и поддержке сетевой инфраструктуры
состоит в наблюдении за простейшими сетевыми метриками. Международные стандарты
описывают и классифицируют данные метрики, а также устанавливают среду для их
измерения.
Элементарные
метрики можно разделить на 2 большие группы:
•
метрики,
служащие для оценки качества соединения между двумя удаленными точками;
•
метрики для
мониторинга канала между двумя маршрутизаторами.
Существует
множество работ, посвященных использованиюэлементарных метрик в эксплуатации
каналов связи. Также разработано множество средств для измерения элементарных и
более сложных сетевых метрик.
Существуют
методики, формализующие и автоматизирующие процесс оценки качества Интернет
каналов. Измеряются 3 характеристики:
•
доступность;
•
максимальную
эффективную производительность;
•
среднее время
реакции.
Доступность
- показатель, характеризующий надежность работы канала связи, получается в
данной методике измерением времени ответа на запросы по протоколу ICMP. Максимальная
эффективная производительность измеряется как максимальная скорость передачи
данных на уровне протокола TCP. Среднее время реакции, мера того насколько быстро
канал связи работает во время его ежедневной эксплуатации, измеряется с помощью
программ, установленных в тестируемой сети и автоматически генерирующих запросы
на доступ к внешним ресурсам по протоколам TCP (в этом случае необходима установка
специального программного обеспечения на площадке тестируемого поставщика услуг
Интернет) или HTTP (для тестирования может использоваться любой WWW сервер). Все измерения производятся с помощью
общедоступных программ SelfTrend и PageLoadRobot.
Хотя,
принципиально, аккуратное наблюдение за сетевой инфраструктурой и анализ
элементарных метрик сетевого трафика позволяет сетевым инженерам отслеживать
"узкие места" в сети, обнаруживать некоторые проблемы, прежде чем они
наступают и предупреждать перегрузку сети, перераспределяя ресурсы и
оптимизируя конфигурацию сети, однако, это чрезвычайно трудоемкий процесс,
требующий от сетевых инженеров высокой квалификации и большого опыта, и в то же
время такой подход позволяет отслеживать только грубые тенденции сетевого
трафика и не дает возможности предсказывать поведение сети при изменении ее
параметров и/или конфигурации.
Большая
часть трафика в сети Интернет передается с помощью протокола TCP, поэтому, • имея аналитическую модель
протокола TCP, можно надеяться, что ее удастся применить к описанию процессов,
происходящих в Интернет- канале организации.
На
настоящий момент было представлено несколько моделей одного соединения по
протоколу TCP. Часть из них дает выражение для пропускной способности TCP соединения в
установившемся режиме как функцию времени доставки пакета от источника к пункту
назначения и обратно (RoundTripTime, RTT) и коэффициента потерь пакетов. В данных
работах рассматривается TCP соединение, передающее большой объем данных в
установившемся режиме работы протокола TCP (Congestionavoidance). В работах учитывается влияние на скорость
передачи данных TCP соединения только механизма быстрой повторной передачи (fastretransmit), в
учитывается также влияние механизма тайм-аута.
В
связи с увеличением популярности протоколов прикладного уровня, в которых за
время одной TCP сессии передается сравнительно небольшой объем информации (порядка
нескольких десятков килобайт, HTTP - наиболее популярный из таких протоколов, см.
исследованиетрафика в, так что TCP не успевает прийти в установившийся режим, появились
работы, ориентированные на описание коротких TCP сессий, которые не могут быть адекватно
представлены моделями, предложенными вработах представлены модели для коротких TCP соединений при
условии (весьма нереалистичном) отсутствия потерь пакетов. В работе дается
выражение для длительности короткого TCP соединения, передающего данные в режиме
"медленный старт" как функции времени доставки и ответа (RTT), коэффициента потерь
пакетов, объема передаваемых данных и времени тайм-аута.
Наряду
с моделями, описывающими одно TCP соединение, в работах рассмотрен случай, когда
несколько TCP сессий работают одновременно, разделяя одну линии связи, находящуюся в
режиме перегрузки. В работе
рассматривается случай фиксированного количества источников, попеременно
инициирующими TCP сессии и остающимися неактивными в течение случайного интервала
времени. В работе предлагается похожая модель, но для случая, когда приход
новых сессий образует пуассоновский процесс. В работах изучается процесс передачи нескольких TCP сессий и делается
вывод о пригодности модели разделения процессора, если приход новых TCP сессий образует
пуассоновский поток событий. Статья посвящена изучению совместной работы
нескольких TCP сессий, когда в сети существует не одна, а несколько перегруженных
линий связи. В работе суммируются результаты предыдущих исследований и делается
вывод о применимости моделей, предложенных в них, в реальных условиях.
Описанные
выше модели дают пропускную способность, занимаемую при передаче нескольких TCP сессий. К сожалению,
данные модели трудно использовать на практике для управления сетью, так как они
не учитывают другие транспортные протоколы, такие как UDP , требуют сложных вычислений и основаны на
предположении, что время доставки и ответа (RTT) постоянно для всех TCP сессий.
Развитием
традиционногометода тестирования производительности
Интернет-подключения с помощью сетевых метрик является метод,
описанный в. Предлагаемый метод тестирования включает три шага:
•
Составить список
Интернет ресурсов, к которым пользователи сети обращаются наиболее часто.
Количество ресурсов в списке должно быть большим, но ограниченным. Автор
утверждает, что список из 1000 ресурсов (IP адресов) покрывает 70% интересов большой
группы пользователей.
•
Для каждого
ресурса из списка измерить три сетевые метрики: доступность (connectivity), задержку -
интервал времени между посылкой запроса и приемом ответа (RoundTripTime, RTT), коэффициент потерь
пакетов. Для измерения этих метрик автор разработал свою собственную программу jping, которая посылает к
каждому тестируемому ресурсу UPD запросы на сервис Echo, который является стандартным типом
"малых сервисов". В случае если сервис Echo отключен, принимается ICMP ответ "порт
недоступен" (portunreachable).
•
По измеренным
метрикам сетевого уровня определить производительность конкретных приложений.
Предлагается вычислять верхнюю границу скорости передачи по протоколу TCP, зависящую от
задержки и коэффициента потерь пакетов, и возможность функционирования
приложений реального времени, таких как передача аудио и видео информации,
строя график доступности ресурсов для приложений реального времени в
зависимости от времени суток, где критерием доступности являются значения
коэффициента потерь пакетов (меньше 5%) и вариации задержки (в пределах 200
мс).
Среди
преимуществ данного подхода можно отметить то, что методика учитывает интересы
пользователей в сети (наиболее посещаемые ресурсы) и то, что данная методика
является формальной, то есть она свободна от субъективного мнения персонала,
занимающегося тестированием.
К
сожалению, у методики существует несколько серьезных недостатков:
•
Производится
активное тестирование сети, что, во-первых, дополнительно загружает сеть,
во-вторых, тестовый трафик искажает картину измерений, причем, тем больше, чем
больше ресурсов тестируется (производится более точное тестирование).
•
Часто, из
соображений безопасности, сервис UDPEcho отключается, в результате по протоколу ICMP посылается ответ
"порт недоступен". Поскольку ICMP трафик трактуется особым образом (его
приоритет обычно ниже, чем приоритет UDP или TCP трафика), в данном случае вносятся
дополнительные искажения в измерения.
•
Оценки, даваемые
для производительности конкретных приложений, являются слишком общими и не учитывают
особенностей различных приложений и интересов пользователей.
В
работах предложен и развит подход, основанный настатистическом
анализе временных рядов, где в качестве значений
временного ряда используется объем трафика сети - объем информации в единицу
времени, проходящий через каналы связи сети.
Авторы
работ исследуют трафик российской национальной научно-образовательной сети Rbnet (предложенный
подход является общим и может быть использован для любой сети) и ставят перед
собой следующие цели и задачи:
1.
Поддержка
детальной базы данных сетевой активности, которая позволит получать информацию
о текущей загрузке сети, сбоях, активности отдельных подсетей и т.д.
2.
Разработка
методик, алгоритмов и программ обработки собранных данных и построение на их
базе объективных прогнозов развития сети.
3.
Агрегация и
визуализация информации о текущем состоянии сети в целях оперативного контроля
и регулярной подготовки кратких аналитических отчетов.
4.
Подготовка
рекомендаций для принятия стратегических решений развития сети по результатам
накопленной информации.
Авторы
делают вывод, что характерной чертой моделей временных рядов, описывающих
трафик, является их нестационарность. При этом детерминированная компонента
трафика как правило включает тренд (плавный рост/падение, обусловленные
долговременными причинами), различные сезонные компоненты (то есть колебание в
течение суток, недели, месяца года), циклические компоненты (нерегулярные
подъемы и спады с различной периодичностью и интенсивностью), а так же
интервенции (то есть резкие изменения в условиях функционирования сети).
Тренд
обычно задается в виде достаточно простой аналитической зависимости. Его
наличие в трафике связано с процессом развития телекоммуникационных технологий,
увеличением скорости доступа к сети, числа пользователей, ресурсов и т.п. На
базе этой компоненты трафика авторы предлагают осуществлять долговременный
прогноз загрузки канала, причем на разных стадиях развития канала могут быть
использованы различные модели тренда: линейные, полиномиальные,
экспоненциальные, Б-образные (логистические, Гомперца) и др.
Сезонная
компонента трафика возникает за счет цикличности присущей человеческой
деятельности. Анализ трафика канала в течение суток обычно показывает наличие
спада загрузки канала в ночные часы. Иногда может наблюдаться и несколько
заметных спадов трафика в различное время суток. Анализ трафика канала в
течение недели показывает спад загрузки канала в выходные дни.
Авторы
предлагают три модели:
1.
Модели динамики
среднесуточной загрузки магистральных каналов телекоммуникационных сетей
Авторы
показывают, что в загрузке всех исследуемых каналов можно выделить несколько
характерных однотипных стадий. При этом каждая стадия описывается и прогнозируется
моделью, включающей параболический (на стадии роста) или линейный (на стадии
падения загрузки) тренд и авторегрессионую компоненту.
2.
Модель роста
числа хостов в научно-образовательных сетях России в 2000 г.
Для
описания динамики роста числа хостов как функции времени авторы используют
параболическую модель линейной регрессии с отрицательным коэффициентом при
квадратичном члене.
3.
Модель скорости
передачи данных конечным пользователям сетей на канале RBnet-Teleglobe.
Математическая
модель в этой задаче представляет множественную линейную регрессию, в которой в
качестве предикторов выступают: доля протокола http в совокупном трафике на "входе"
канала, доля "request" по протоколу http на "выходе" канала и совокупные
времена соединений по протоколу http на "входе" и "выходе" канала. В
зависимости от структуры загрузки канала в качестве предикторов могут
выступать
и другие характеристики трафика: объем переданной информации, число соединений,
общее число переданных пакетов и пр.
Главное
достоинство описанного выше подхода - это возможность давать прогнозы развития
сети, однако, можно отметить и следующие его недостатки:
•
Для разных сетей
необходим пересчет параметров моделей, причем возможна такая ситуация, при
которой предложенные модели не будут адекватно описывать сеть и будет
необходима их корректировка (оставаясь в рамках предложенного подхода).
•
Для вычисления
параметров моделей необходим длительный сбор статистики, причем, модели будут
тем точнее, чем дольше производится наблюдение.
•
Не указано
влияние конкретных сетевых параметров на наблюдаемые закономерности. Вообще,
можно сделать вывод, что в рамках данного подхода это сделать сложно.
•
Принципиально, в
рамках данного подхода можно давать прогноз, только если характер зависимости
значения сетевого параметра от времени остается тем же самым, как на предыдущем
интервале наблюдения. Если же изменение наблюдаемого сетевого параметра вызвано
другими причинами, чем его изменение в предшествующий период, то данный подход
будет не в состоянии дать верный прогноз.
В работах предлагаетсямодель для незагруженного
магистрального канала связи, передающегоIP трафик. Авторы ставят перед собой
задачу создания модели, достаточно простой (чтобы ее могли
использовать сетевые администраторы), и, насколько это возможно, независимой от
используемых протоколов и приложений.
Сетевой
IP
трафик рассматривается на уровне потоков данных (flow) - потоком может быть TCP или UDP соединения,
описываемые IP адресами источника и назначения (или даже подсетями источника и
назначения), номерами портов и т.д.
Модель
построена на двух основных предположениях:
1.
Приходы новых
потоков данных образуют однородный пуассоновский процесс конечной скорости Я.
2.
Функции скорости
потоков независимы друг от друга и одинаково распределены. Из независимости
функций скорости потока также следует независимость последовательностей
длин и длительностей потоков.
Выражение
для дисперсии (Уя) зависит от формы функции скорости потока. Авторы
рассматривали прямоугольную, треугольную и степенные формы функции скорости
потока. При экспериментальной проверке своей модели авторы использовали
параметризированную по двум коэффициентам степенную функцию скорости потока.
Коэффициенты параметризации находились по опытным данным так, чтобы минимизировать
ошибку между экспериментально полученными средним значением и дисперсией
скорости магистрального канала, и оценками этих величин, вычисляемым по модели.
Основные
достоинства предложенного в данной работе подхода: простота и общность. В то же
время этот подход является достаточно мощным и отвечает на многие вопросы,
возникающие при эксплуатации магистральных (и не только) 1Р каналов.
Однако,
в данной работе можно отметить серьезные недостатки: в модели не учитываются
особенности конкретных протоколов, использующихся на сегодняшний момент в
глобальной компьютерной сети Интернет. Рассмотрен только случай незагруженного
магистрального канала связи, в то время как для реальных сетей существенно
важной задачей является нахождение границы, разделяющей состояния незагруженной
и перегруженной сети. Так как коэффициенты параметризации функции скорости
потока в модели находятся по экспериментальным данным, можно утверждать, что
эти коэффициенты придется пересчитывать отдельно для каждой конкретной сети и
возможно для разных ее состояний.
Выводы:
анализируя достоинства и недостатки каждого из описанных выше подходов
применительно к задачам поддержки, прогнозирования развития и оптимизации
сетей, можно сделать вывод, что эти задачи не решены полностью как в рамках какого-либо
одного подхода, так и объединением различных существующих уже моделей.
Список использованной литературы:
1.
Афанасьев Ф.В.,
Петров A.B., Сухов A.M. Проверка качества
каналов Интернет // Сети и системы связи, №6(98), 5 мая 2003 г., с. 92-94.
2.
Безрукавный
Д.С., Домрачев В.Г., Калинина Э.В., Ретинская И.В. Моделирование
скачкообразного изменения среднего значения загрузки сети с использованием
функций принадлежности: Материалы конференции RELARN-2005. М: 2005.
3.
Беляев JI.C. Решение сложных
оптимизационных задач в условиях неопределенности. - Новосибирск: Наука, 1978.
- 128 с.
4.
Бочаров П.П.,
Печинкин A.B. Теория массового обслуживания. - М.: Изд-во РУДН, 1995. - 529 с.
5.
Брахман Т.Р.
Многокритериальное^ и выбор альтернативы в технике. - М.: Радио и связь, 1984.
- 228 с.
6.
Бронштейн И.Н.,
Семендяев К.А. Справочник по математике. - М.: 1967 г.
7.
Васенин В.А.,
Макаров A.A. Проблемы и методики анализа трафика телекоммуникационных
компьютерных сетей. Международная научно-практическая конференция "Новые
информационные технологии в университетском образовании", Новосибирск,
25-27 марта 1997г., с. 173.
8.
Вегешна Ш.
Качество обслуживания в сетях IP. - М.: Издательский дом "Вильяме", 2003. -
368 с.
9.
Вентцель Е.С.,
Овчаров JI.A. Теория вероятностей и
ее инженерные приложения. - М.: Высш. шк., 2000. - 480 с.
10.
Гмурман В.Е.
Теория вероятностей и математическая статистика. - М.: Высш. шк., 2000. - 479с.
11.
П.Гнеденко Б.В.,
Коваленко И.Н. Введение в теорию массового обслуживания. - М.: Наука. Гл. ред.
Физ.-мат. Лит. - 1987. - 336 с.