ОЦЕНКА ПОГРЕШНОСТЕЙ ВЫЧИСЛЕНИЯ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК, ПРИ ИСПОЛЬЗОВАНИИ МЕТОДА СТОХАСТИЧЕСКОГО КОДИРОВАНИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ.

 

Г.Г. ГАЛУСТОВ

Приведено описание оценки погрешности вычисления математического ожидания случайных процессов, подвергнутых стохастическому кодированию с одноразрядным квантованием, при этом статистические характеристики кодированных процессов рассматриваются как эффективные признаки для решения задачи их распознавания

 

       Успех  решение задачи распознавания случайных сигналов (процессов) связан с выбором системы эффективных признаков, часто связанных нелинейной зависимостью с первичной системой признаков [1].  

Использование нелинейного преобразования первичных признаковых пространств позволяет, с одной стороны, укрупнить описание классифицируемых сигналов, то есть отобразить исходное многомерное пространство признаков в одномерное пространство функционалов, с другой стороны – с применением в качестве функции преобразования функции распределения некоторого вспомогательного процесса – позволяет как бы “обобщить” или представить более компактно свойства всех сигналов одного класса.

         Рассмотрим один из методов реализации алгоритма стохастического кодирования сигналов [2], ориентированного на классификацию сложных сигналов с непараметрической априорной неопределенностью, в котором, в общем случае реализовано нелинейное преобразование признаковых пространств.

         Предположим, что анализируется с целью выделения признаков некоторый стационарный сигнал (процесс) , имеющий одномерную плотность вероятности .

         Будем формировать процесс

,                                          (1)

где  - некоторый опорный процесс с плотностью вероятности .

         В этом случае

.                                     (2)

         Так как при фиксированном значении ,

,                                     (3)

где  - интегральный закон распределения случайной величины .

          является функцией аргумента распределения сигнала, следовательно, можно сделать вывод, что интервал распределения опорного сигнала должен быть по крайней мере не меньше, чем интервал распределения анализируемого сигнала . На основании (3) и (2) запишем:

.

         Известно [3], что

,

или окончательно запишем

,                      (4)

где  - интервал распределения анализируемого сигнала .

        

В частном случае, когда

и значения процесса лежат также в интервале , то, а

                       (5)

где - интервал дискретизации процесса . Выражение (5) является  оценкой первого начального момента. Для получения начального момента -го порядка, как это видно из (5), функция распределения опорного процесса должна быть ,  при этом

                                 (6)

         Таким образом, в зависимости от вида функции распределения опорного сигнала, не изменяя структуры измерителя, мы можем получать оценки моментов различных порядков. Кроме того, можно синтезировать опорный процесс с таким распределением, чтобы получить заданное математическое ожидание  при известной плотности распределения анализируемого сигнала .

         Можно видеть, что использование оценок вида (6) в качестве аргумента векторов признаков классифицируемых процессов эффективно в случае классификации процессов с отличающимися одномерными плотностями вероятностей.

Особый интерес представляет  связь статистических характеристик анализируемого процесса  с процессом , полученным в результате сравнения с опорным распределением. При этом наибольший интерес представляет случай равномерного распределения опорного сигнала , так как в этом случае, в соответствии с (5), статистические характеристики процесса будут совпадать с начальными моментами его распределения.

         Будем исходить из того, что анализируемый процесс  является стационарным эргодическим и распределен в интервале . Тогда, полагая, что опорный процесс  распределен равномерно в интервале , выражение (1) перепишем в виде

         Составим ряд для дискретной случайной величины :

0

1

 

P

 

         Переходя к непрерывной случайной величине , можно сразу записать:

;                                          (7)

.                                (8)

         Для ошибки представления случайной величины  в результате ее одноразрядного квантования  также запишем ряд распределения, который будет иметь вид

 

P

 

         Откуда при переходе к непрерывным случайным величинам имеем

.                            (9)

         Таким образом, математическое ожидание ошибки в результате одноразрядного квантования независимо от вида распределения анализируемого процесса  равно нулю.

         Теперь определим дисперсию ошибки :

                   (10)

         Среднеквадратическое отклонение ошибки  запишется как

.                                        (11)

         В соответствии с (5), математическое ожидание

;

                                (12)

         Таким образом, дисперсия случайной величины  может быть определена на основе выражения (12). Дисперсия оценки (5) может быть определена следующим образом:

                            (13)

         Оценим теперь погрешности, вносимые стохастическим кодированием, для случая равномерного распределения опорного сигнала .

         Оценка  по стохастическому отображению  представляет собой оценку вероятности  события , () по его частоте  в  независимых опытах. Дисперсия оценки  равна

.

         Тогда с вероятностью  можно утверждать, что величина погрешности  определения  по стохастическому отображению  определяется выражением

.

         Суммарная погрешность вычисления математического ожидания случайной функции по его стохастическому отображению равна [3]

,                        (14)

где     - количество некоррелированных выборок из функции ;

         -функция, обратная нормальной функции распределения [5].

         В таблице 1 и на рисунке 1 приведены значения, графики для  при различных  и .

         Таким образом, можно заключить, что при использовании метода стохастического кодирования возрастает дисперсия оценок измеряемых моментов, однако к положительным моментам можно отнести сокращение избыточности описания исходного процесса в  раз [3],

где    - разрядность представления  двоичным кодом;

          - порядок определяемой моментной функции процесса .

         Например, если , , то .

         Кроме того, при математической обработке процессов , полученных в результате применения метода стохастического кодирования, операции сложения и умножения сводятся к простейшим операциям - конъюнкции и счету импульсов. Это позволяет строить относительно простые вероятностные процессоры для статистической обработки данных с целью выделения эффективных признаков.

 

 

Таблица 1

 

 

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

100

8,6

13,1

15

15,9

16,2

15,9

15

13,1

8,6

400

4,3

6,6

7,5

7,95

8,1

7,95

7,5

6,6

4,3

900

2,87

4,38

4,99

5,3

5,4

5,3

4,99

4,38

2,87

4900

1,23

1,88

2,14

2,27

2,31

2,27

2,14

1,88

1,23

10000

0,86

1,3

1,5

1,59

1,62

1,59

1,5

1,3

0,86

 

Рисунок 1. Зависимость погрешности  от значений   и .

 

 

Библиографический список

1. Фукунага К. Введение в статистическую теорию распознавания образов.    Пер. с англ.-М.: Наука. 1979, 368с.

2.Г.Г. Галустов, В.Г. Цымбал, М.В. Михалев. Принятие решений в условиях неопределенности. М.: Радио и связь, 2001. 196 с.

3.В.С. Гладкий. Вероятностные вычислительные модели. М.: Наука, 1973. 298с.