География и геология/2.Наблюдение, анализ и прогнозирование

                         метеорологических условий

Заведующий кафедрой «Информационные технологии»

д.т.н., профессор Заурбеков Н.С., магистрант Бейбитжан М.Б.,

 магистрант Женисбек М.

Алматинский технологический университет, Алматы, Казахстан

Типизация атмосферных процессов с целью определения неизвестных функции, входящих в уравнения турбулентной диффузии

 

Для исследования локальных атмосферных процессов происходящих в пограничном слое, т.е. для решения уравнении турбулентной диффузии необходимо использовать математическую модель, основанную на системе уравнений гидротермодинамики, то есть надо рассмотреть совместно с  основным уравнением множество других уравнений: движения, неразрывности, состояния, притока тепла, удельной влажности, в которых участвуют искомые функции вектор скорости, температура, потенциальная температура, давления, плотность, удельная влажность, тензор вязких напряжений потока, тепла и влаги, являющимися функциями координаты и время и других,  до 26-28 уравнений. При решении такой модели возникает множество проблем, связанные с ее реализацией, например, единственность и устойчивость решения огромных количеств уравнений и т.д. В данной работе предложен другой подход решении этих проблем, а именно типизация атмосферных процессов, c целью определения неизвестных функции, входящих в уравнения турбулентной диффузии, которые сами могли бы самостоятельно находится из других уравнений.

Синоптические ситуации, определяющие уровень загрязнения воздуха, успешно предсказываются существующими способами. Однако анализ синоптических условий загрязнения связан с определенными трудностями. Чаще всего они зависят от большой изменчивости синоптических процессов, а иногда их нечеткой выраженности. Поэтому, для оценки загрязнения атмосферы на срок от 3 до 5 суток от объекта, находящегося в Западном  Казахстане, целесообразно пользоваться типизацией синоптических процессов.

Принципы типизации атмосферных процессов. В настоящей работе для целей типизации полей  Н-500 естественно-синоптических (е.с.) периодов, характеризующих циркуляционные условия среднего уровня тропосферы применяется известный в метеорологии алгоритм классификации [128].  Использование этого алгоритма обосновывается предположением, что набор эталонных объектов однозначно определяет разбиение объектов X G (i=1,2,...,n) на k классов, а количество возможных наборов объектов при больших n и k значительно меньше количества различных разбиений множества n объектов на k  подмножеств. Это предположение справедливо в случае осуществования в пространстве признаков совокупностей классифицируемых объектов, группирующихся вблизи своих центров  (эталонов).

Постановка задачи классификации состоит в следующем. Имею-щееся множество G объектов X (j=1,2,...,n) требуется разбить на  k непустых подмножеств. Пара объектов  i  и  j характеризуется величиной близости  S,  отвечающей аксиоме метрики.  Выделим в каждом подмножестве по одному объекту, сумма величин близости между которыми и остальными объектами подмножества минимальна. Выделенные объекты являются эталонными.

Разбиение на k подмножеств можно характеризовать суммой n величин близости между каждым объектом и эталоном того класса, в который  входит данный объект, т.е. суммой F(k) из k чисел, каждое из которых представляет сумму величин близости между всеми объектами какого-либо подмножества и эталонным объектом этого подмножества.

                                     F(k) =  .

Здесь k - множество индексов эталонных объектов, Q- множество индексов объектов, входящих в подмножество с эталонным объектом X, i k.

Очевидно, что с уменьшением  F(k)  качество разбиений повышается, так как происходит объединение объектов с малыми величинами близости    и распределение по разным подмножествам объектов с большими значениями  .

Наилучшим считается разбиение, соответствующее равенству

F(k) = F(k).                                    

Линейный характер  и  простота  показателя  F(k)  позволяют строить эффективные вычислительные схемы, когда полный перебор или другие алгоритмы,  требующие значительных ресурсов классифицируемого устройства, реализовать невозможно.

Рассмотрим схему классификации предложенную в [128]. Пусть из множества объектов  (j=1,...,n) выделено   объектов, которые можно рассматривать в качестве эталонов, причем   >> k,  где  k  - итоговое число классов. Построим матрицу близости | S | размером  x n  (i=1,.., ;  j=1,...,n)  и каждый объект X отнесем к ближайшему эталону из набора    по принципу минимума величины   . Полученное разбиение  на 

  подмножеств  характеризуется  величиной    

F() =   .

Переход к разбиению на  - 1 классов осуществляется  следующим образом.  Исключая каждый раз какой-либо эталонный объект из набора  , построим   разбиений множества  n  объектов    на  -1  подмножеств.  Окончательно из  разбиений исключается такое,  для которого показатель качества классификации  F( -1) является минимальным. Минимальное значение F (-1) свидетельствует о том, что i-й эталон является наименее предпочтительным из данного текущего набора эталонов. Действительно, в  этом случае объекты  i-го класса можно с наименьшими потерями "рассортировать" по другим классам,  и следовательно,  i-й класс является  наименее компактным и удаленным подмножеством из имеющихся  подмножеств. Таким образом, получаются новый из  - 1 эталонов и соответствующее ему разбиение.  Выполнив  - k  таких шагов,  получим разбиение множества G на k подмножеств.

Величина F не убывает с каждым шагом.

F(c-1) F(c);              c= , - 1, ... , k.

Исходный набор  можно определить ранговыми методами. На основе критерия сходства   при задании порогового значения    производится ранжирование всех строк матрицы  S  размером  n x n. Рангом M  строки (объекта)  i  называется число ситуаций,  удовлетворяющих условию  . Чтобы классы были представительны,  ранги эталонов должны быть достаточно велики, т.е. M  .

T обычно берется равным 0.10.  Нетрудно определить значение  ,  при котором средний ранг объектов равен 10% объема исходной  выборки n.  Величина    принимается в качестве пороговой:  = .  Можно полагать, что  объект, ранг  которого   0.10n,  является возможным эталоном.  Однако во  избежание ошибок, связанных  с  возможностью пропуска истинного эталона, предлагается возможными эталонами считать те объекты, ранг которых  0,05n  при  том  же пороге ,  который соответствует среднему рангу объектов M=0.10n.

Цель описанной предварительной процедуры состоит в исключении объектов, которые из-за своей нетипичности эталонами быть не могут.

В качестве входного параметра поставленной задачи классификации используется величина k (число итоговых подмножеств).

Если никаких сведений о  k   у  исследователя  не  имеется, предлагается использовать следующий метод. Зададим k равным единице. Программа счета, реализующая алгоритм классификации, позволяет на каждом шаге, начиная с  , строить классификацию, оптимальную с  точки зрения минимума F(). Получается набор из   - к + 1 классификации.

При решении практических задач было замечено, что графики хода показателя  F(k) имеют следующую особенность:  на участке от     до какого-то     F(k)  медленно и равномерно увеличивается, а затем,  начиная с  , рост его происходит быстро и интенсивно. Исходя из этого, разумно предположить, что число классов k  нужно выбирать  там,  где  впервые  происходит резкий скачок в значении F(k). Действительно большая величина  F()  свидетельствует о том,  что при исключении даже наименее предпочтительного эталонного объекта из набора   качество  классификации существенно ухудшается.

Однако нужно учитывать, что с уменьшением   возрастает число членов в классах i-й классификации. Поэтому для объективного суждения выборе числа классов k предлагается использовать показатель

Здесь  - число членов расформировываемого класса при переходе от i-й классификации к   (i-1) -й. Величина    показывает, как увеличится "расстояние" от среднего объекта расформировываемого класса  до  оставшихся  k  -1  эталонов по сравнению с "расстоянием" до бывшего эталона.  Тогда очевидно, что число классов  k  нужно выбирать таким, при  котором  в первый раз величина     существенно превысит предыдущие значения. Здесь и в дальнейшем для проверки статистических гипотез о существенности отличия тех или иных величин будет применяться  5% -ный уровень  значимости  как наиболее употребительный в практике метеорологических исследований. В качестве меры близости между двумя объектами (метеорологическими полями) i  и j используется линейная комбинация известных индексов аналогичности   p,  и  cos, характеризующих различные, с синоптической точки зрения, стороны связи метеорологических полей.представляется в виде

здесь             

Параметры

                         и     

характеризуют совпадение меридиональной и зональной составляющей поля H-500. По величине    можно судить о совпадении  очагов аномалий двух полей. Поэтому     называют  критерием геометрического подобия метеорологических ситуаций.

Если поля H-500, заданные в N фиксированных точках, рассматривать как векторы N-мерного пространства = и={}, то их линейную связь можно характеризовать косинусом угла между ними

) ( )

где скобки обозначают скалярное произведение векторов, а штрих -  знак  транспонирования. Параметры     и  cos  изменяются  от -1  (обратные поля) до +1 (полностью идентичное поле).

Результаты машинной реализации алгоритма явились основой типизации среднепериодных полей H-500 в каждом сезоне. В последующем они подвергались синоптическому анализу и корректировке, так как до сих пор не существует метода автоматизированной классификации, полностью совпадающего с методологией синоптической типизации, основанной на опыте, интуиции и других качествах синоптика - специалиста. Вместе с тем следует указать, что эта корректировка оказалась незначительной, что в очередной раз свидетельствует о пригодности описанного алгоритма для метеорологических исследований.

 

 

Литература:

 

1.     Айдосов А.А., Айдосова Г.А., Заурбеков Н.С. Модельная оценка экологической обстановки окружающей среды при аварийных ситуациях. - Алматы, 2010. – 414 с.

2.     Айдосов А.А., Айдосова Г.А., Заурбеков Н.С. Модели экологической обстановки окружающей среды при реальных атмосферных процессах. - Алматы, 2010. –  368 с.

3.     Айдосов А.А., Заурбеков Н.С. Теоретические основы прогнозирования природных процессов и экологической обстановки окружающей среды  // Теорет. основы прогнозирования атмосфер.процессов, эколог. обстановки окруж. среды и построение геоэколог. карты на примере КНГКМ. – Кн.3.– А.: Қазақ университеті, 2000. – 220 с.