География и геология/2.Наблюдение, анализ и прогнозирование
метеорологических условий
Заведующий кафедрой «Информационные технологии»
д.т.н., профессор Заурбеков Н.С., магистрант Бейбитжан М.Б.,
магистрант Женисбек М.
Алматинский технологический университет, Алматы, Казахстан
Типизация атмосферных
процессов с целью определения неизвестных функции, входящих в уравнения
турбулентной диффузии
Для исследования локальных атмосферных процессов
происходящих в пограничном слое, т.е. для решения уравнении турбулентной
диффузии необходимо использовать математическую модель, основанную на системе
уравнений гидротермодинамики, то есть надо рассмотреть совместно с основным уравнением множество других
уравнений: движения, неразрывности, состояния, притока тепла, удельной
влажности, в которых участвуют искомые функции вектор скорости, температура,
потенциальная температура, давления, плотность, удельная влажность, тензор
вязких напряжений потока, тепла и влаги, являющимися функциями координаты и
время и других, до 26-28 уравнений. При
решении такой модели возникает множество проблем, связанные с ее реализацией,
например, единственность и устойчивость решения огромных количеств уравнений и
т.д. В данной работе предложен другой подход решении этих проблем, а именно
типизация атмосферных процессов, c целью определения неизвестных функции,
входящих в уравнения турбулентной диффузии, которые сами могли бы
самостоятельно находится из других уравнений.
Синоптические ситуации, определяющие уровень загрязнения воздуха, успешно предсказываются существующими способами. Однако анализ синоптических условий загрязнения связан с определенными трудностями. Чаще всего они зависят от большой изменчивости синоптических процессов, а иногда их нечеткой выраженности. Поэтому, для оценки загрязнения атмосферы на срок от 3 до 5 суток от объекта, находящегося в Западном Казахстане, целесообразно пользоваться типизацией синоптических процессов.
Принципы
типизации атмосферных процессов. В настоящей работе для целей типизации
полей Н-500 естественно-синоптических
(е.с.) периодов, характеризующих циркуляционные условия среднего уровня
тропосферы применяется известный в метеорологии алгоритм классификации [128]. Использование этого алгоритма обосновывается
предположением, что набор эталонных объектов однозначно определяет разбиение
объектов X![]()
G (i=1,2,...,n) на k классов, а количество возможных
наборов объектов при больших n и k значительно меньше количества различных
разбиений множества n объектов на k
подмножеств. Это предположение справедливо в случае осуществования в
пространстве признаков совокупностей классифицируемых объектов, группирующихся
вблизи своих центров (эталонов).
Постановка
задачи классификации состоит в следующем. Имею-щееся множество G объектов X
(j=1,2,...,n) требуется разбить на k непустых подмножеств. Пара объектов i
и j характеризуется величиной
близости S, отвечающей аксиоме метрики.
Выделим в каждом подмножестве по одному объекту, сумма величин близости
между которыми и остальными объектами подмножества минимальна. Выделенные
объекты являются эталонными.
Разбиение на k
подмножеств можно характеризовать суммой n величин близости между каждым
объектом и эталоном того класса, в который
входит данный объект, т.е. суммой F(k) из k чисел, каждое из которых
представляет сумму величин близости между всеми объектами какого-либо
подмножества и эталонным объектом этого подмножества.
F(k) =
.
Здесь k - множество индексов
эталонных объектов, Q
- множество индексов объектов, входящих в подмножество
с эталонным объектом X
, i
k.
Очевидно, что с
уменьшением F(k) качество разбиений повышается, так как
происходит объединение объектов с малыми величинами близости
и
распределение по разным подмножествам объектов с большими значениями
.
Наилучшим
считается разбиение, соответствующее равенству
F(k)
=
F(k).
Линейный
характер и простота показателя F(k)
позволяют строить эффективные вычислительные схемы, когда полный перебор
или другие алгоритмы, требующие
значительных ресурсов классифицируемого устройства, реализовать невозможно.
Рассмотрим схему
классификации предложенную в [128]. Пусть из множества объектов
(j=1,...,n)
выделено
объектов,
которые можно рассматривать в качестве эталонов, причем
>> k,
где k - итоговое число классов. Построим матрицу близости | S
| размером
x n (i=1,..,
;
j=1,...,n) и каждый объект X
отнесем к ближайшему эталону из набора
по принципу
минимума величины
. Полученное
разбиение на
подмножеств характеризуется величиной
F(
) =
.
Переход к
разбиению на
- 1 классов осуществляется следующим образом.
Исключая каждый раз какой-либо эталонный объект из набора
, построим
разбиений
множества n объектов
на
-1
подмножеств. Окончательно из
разбиений
исключается такое, для которого
показатель качества классификации F(
-1) является минимальным. Минимальное значение F (
-1) свидетельствует о том, что i-й эталон является
наименее предпочтительным из данного текущего набора эталонов. Действительно,
в этом случае объекты i-го класса можно с наименьшими потерями
"рассортировать" по другим классам,
и следовательно, i-й класс
является наименее компактным и
удаленным подмножеством из имеющихся
подмножеств.
Таким образом, получаются новый из
- 1 эталонов и соответствующее ему разбиение. Выполнив
- k таких шагов, получим разбиение множества G на k подмножеств.
Величина F не
убывает с каждым шагом.
F(c-1)
F(c); c=
,
- 1, ... , k.
Исходный набор
можно
определить ранговыми методами. На основе критерия сходства
при задании
порогового значения
производится
ранжирование всех строк матрицы S размером
n x n. Рангом M строки
(объекта) i называется число ситуаций,
удовлетворяющих условию ![]()
![]()
. Чтобы классы были представительны, ранги эталонов должны быть достаточно
велики, т.е. M ![]()
.
T обычно берется
равным 0.10. Нетрудно определить
значение
, при котором средний ранг объектов равен 10%
объема исходной выборки n. Величина
принимается в
качестве пороговой:
=
. Можно
полагать, что объект, ранг которого
![]()
0.10n, является возможным эталоном. Однако во
избежание ошибок, связанных
с возможностью пропуска
истинного эталона, предлагается возможными эталонами считать те объекты, ранг
которых ![]()
0,05n при
том же пороге
, который
соответствует среднему рангу объектов M=0.10n.
Цель описанной
предварительной процедуры состоит в исключении объектов, которые из-за своей
нетипичности эталонами быть не могут.
В качестве
входного параметра поставленной задачи классификации используется величина k
(число итоговых подмножеств).
Если никаких
сведений о k у исследователя не
имеется, предлагается использовать следующий метод. Зададим k равным
единице. Программа счета, реализующая алгоритм классификации, позволяет на
каждом шаге, начиная с
, строить классификацию, оптимальную с точки зрения минимума F(
). Получается набор из
- к + 1 классификации.
При решении
практических задач было замечено, что графики хода показателя F(k) имеют следующую особенность: на участке от
до какого-то
F(k) медленно и равномерно увеличивается, а
затем, начиная с
, рост его происходит быстро и интенсивно. Исходя из
этого, разумно предположить, что число классов k нужно выбирать там, где
впервые происходит резкий скачок
в значении F(k). Действительно большая величина
F(
)
свидетельствует о том, что при
исключении даже наименее предпочтительного эталонного объекта из набора
качество классификации существенно ухудшается.
Однако нужно
учитывать, что с уменьшением
возрастает
число членов в классах i-й классификации. Поэтому для объективного суждения
выборе числа классов k предлагается использовать показатель
![]()
Здесь
- число членов
расформировываемого класса при переходе от i-й классификации к (i-1) -й. Величина
показывает,
как увеличится "расстояние" от среднего объекта расформировываемого
класса до оставшихся k -1
эталонов по сравнению с "расстоянием" до бывшего эталона. Тогда очевидно, что число классов k
нужно выбирать таким, при
котором в первый раз
величина
существенно
превысит предыдущие значения. Здесь и в дальнейшем для проверки статистических
гипотез о существенности отличия тех или иных величин будет применяться 5% -ный уровень значимости как наиболее
употребительный в практике метеорологических исследований. В качестве меры
близости между двумя объектами (метеорологическими полями) i и j используется линейная комбинация
известных индексов аналогичности p,
и cos
, характеризующих различные, с синоптической точки
зрения, стороны связи метеорологических полей.
представляется в виде
![]()
здесь
![]()
Параметры
и ![]()
характеризуют совпадение
меридиональной и зональной составляющей поля H-500. По величине
можно судить о
совпадении очагов аномалий двух полей.
Поэтому
называют критерием геометрического подобия
метеорологических ситуаций.
Если поля H-500,
заданные в N фиксированных точках, рассматривать как векторы N-мерного
пространства
=
и
={
}, то их линейную связь можно характеризовать косинусом
угла между ними
![]()
) (![]()
![]()
![]()
)![]()
где скобки обозначают
скалярное произведение векторов, а штрих -
знак транспонирования.
Параметры
и cos
изменяются от -1 (обратные поля) до +1 (полностью идентичное
поле).
Результаты
машинной реализации алгоритма явились основой типизации среднепериодных полей
H-500 в каждом сезоне. В последующем они подвергались синоптическому анализу и
корректировке, так как до сих пор не существует метода автоматизированной
классификации, полностью совпадающего с методологией синоптической типизации,
основанной на опыте, интуиции и других качествах синоптика - специалиста. Вместе
с тем следует указать, что эта корректировка оказалась незначительной, что в
очередной раз свидетельствует о пригодности описанного алгоритма для
метеорологических исследований.
Литература:
1.
Айдосов А.А., Айдосова Г.А., Заурбеков
Н.С. Модельная оценка экологической обстановки
окружающей среды при аварийных ситуациях. - Алматы, 2010. – 414 с.
2. Айдосов А.А., Айдосова
Г.А., Заурбеков Н.С. Модели
экологической обстановки окружающей среды при реальных атмосферных процессах. -
Алматы, 2010. – 368 с.
3.
Айдосов А.А., Заурбеков
Н.С. Теоретические основы прогнозирования природных процессов и экологической
обстановки окружающей среды // Теорет.
основы прогнозирования атмосфер.процессов, эколог. обстановки окруж. среды и
построение геоэколог. карты на примере КНГКМ. – Кн.3.– А.: Қазақ университеті, 2000. – 220 с.