Математические науки / 3. Теория вероятностей и математическая статистика

Акимов С. С.

Оренбургский государственный университет, Россия

Применение коэффициентов асимметрии и эксцесса для определения закона распределения вероятности

 

На сегодняшний момент существует целый ряд способов восстановления закона распределения вероятности по выборке из генеральной совокупности.  

Необходимость в восстановлении закона распределения обусловлена особенностями всех современных статистических пакетов и программ: для проведения анализа данных закон распределения задается вручную. Незнание  же закона распределения, которому подчиняется выборка, приводит к тому, что исследователь, берет за основу нормальное распределение, и далее анализирует совокупность, исходя из параметров нормального распределения [1].

Одним из наиболее известных и применяемых методов восстановления закона распределения служит гистограммный метод, подробно описанный в [2]. Однако данный метод, при всей его простоте использования является весьма субъективным. Для снижения субъективности данного способа оценивания необходимо использовать математические методы.

Гистограммный метод дает исследователю графическое отображение экспериментальных данных, и по виду построенной гистограммы исследователь принимает гипотезу о виде закона распределения вероятности. Однако сам вид гистограммы зависит от ряда характеристик, из которых  основными являются (для одновершинных распределений) сдвиг параметров относительно центра (асимметрия) и кривизна полученной гистограммы (эксцесс). Как известно, эти параметры рассчитываются как центральные моменты третьего и четвертого порядка.

Целый ряд отечественных и зарубежных ученных описывают применение методов коэффициента асимметрии и эксцесса для проверки нормальности распределения [3,4,5]. Однако ряд авторов, также, признают несостоятельность использования данного метода для проверки нормальности [6]. Основная причина несостоятельности заключается в том, что существует ряд распределений, имеющих коэффициент асимметрии и эксцесса аналогичный нормальному закону распределения.

Таким образом, использование коэффициентов асимметрии и эксцесса не может дать однозначного ответа на вопрос о нормальности закона распределения в частности и виде закона распределения в целом. Однако этот метод весьма действенен, если использовать его как критерий для сортировки законов распределений.

Рассмотрим этот процесс более подробно. Для начала необходимо перечислить все наиболее часто встречающиеся распределения: распределение Коши, Фишера, Стьюдента, Пуассона, Вейбулла, Бернулли, Рэлея, нормальное, логнормальное, логистическое, равномерное непрерывное и дискретное, биноминальное, отрицательное биноминальное, геометрическое, гипергеометрическое, экспоненциальное, гамма, бета и хи-квадрат.

Прежде, чем исследовать коэффициенты асимметрии и эксцесса, необходимо отметить главную сложность этого процесса: в ряде распределений с изменением параметра изменяются и моменты третьего и четвертого порядков. Потому отнесем такие распределения в «зону неопределенности».

Итак, разобьем перечисленные выше законы распределения согласно коэффициенту асимметрии, представив данные в таблице.

 

Симметричные

Асимметричные

Неопределенные

Биноминальное

Экспоненциальное

Коши

Нормальное

Фишера

Бета

Логистическое

Геометрическое

Хи-квадрат

Стьюдента

Логнормальное

Гамма

Равномерное непрерывное

 

Гипергеометрическое

Равномерное дискретное

 

Отр. Биноминальное

 

 

Пуассона

 

 

Вейбулла

 

 

Рэлея

 

 

Бернулли

 

Как видно из таблицы, в зону определенности попадает гораздо больше законов распределений, чем во все другие. Отрицательный момент заключается в том, что при оценке коэффициента асимметрии «зону неопределенности» придется учитывать как в симметричных, так и асимметричных распределениях, отсюда следует, что данный коэффициент лишь поможет отбросить те законы распределения, которые точно не являются симметричными или асимметричными.

Такая же ситуация обстоит и с коэффициентом эксцесса.

 

Нормальный эксцесс

Ненормальный эксцесс

Неопределенные

Биноминальное

Коши

Бета

Гипергеометрическое

Экспоненциальное

Хи-квадрат

Нормальное

Фишера

Гамма

Стьюдента

Геометрическое

Логистическое

Равномерное непрерывное

Логнормальное

Отр. Биноминальное

Равномерное дискретное

 

Пуассона

 

 

Вейбулла

 

 

Бернулли

 

 

Рэлея

 

Замечание, написанное для коэффициента асимметрии, справедливо и для коэффициента эксцесса – расчет коэффициента поможет лишь отбросить законы, не попадающие в «нормальную зону».

Из приведенных таблиц видно, что совмещение этих коэффициентов не дает особого результата: в большинстве случаев симметричные распределения имеют нормальный эксцесс и наоборот. Поэтому наиболее информативными станут случаи, когда закон распределения симметричный, а эксцесс не соответствует нормальному или наоборот – в этих случаях отсеивается примерна половина приведенных законов распределения

Кроме того, из приведенных таблиц видна несостоятельность использования коэффициентов асимметрии и эксцесса для проверки нормальности. Однако их использование для определения вида закона распределения позволяет отсеять от 4 до 10 законов, не попадающие под заданные условия.

 

 

Литература:

 

1.   Акимов С.С., Шепель В.Н. Эвристическая процедура определения подходящего распределения вероятности / В.Н. Шепель, С.С Акимов /Компьютерная интеграция производства и ИПИ-технологии / Сборник материалов V Всероссийской научно-практической конференции. - Оренбург: Изд. ИП Осниночкин Я.В., 2011. – С. 137-139.

2.   Шепель В.Н. Алгоритм определения эмпирической функции плотности  по выборке из генеральной совокупности. Современные информационные технологии в науке и практике. Материалы VIII всероссийской научно-практической конференции (с международным участием). – Оренбург: ИПК ГОУ ОГУ, 2009, с. 224-226.

3.   D’Agostino, Ralph B.; Albert Belanger; Ralph B. D’Agostino, Jr (1990). "A suggestion for using powerful and informative tests of normality". The American Statistician 44 (4): 316–321.

4.   Shenton, L.R.; Bowman, K.O. (1977). "A bivariate model for the distribution of √b1 and b2". Journal of the American Statistical Association 72 (357): 206–211.

5.   Лемешко Б. Ю., Лемешко С. Б. Сравнительный анализ критериев проверки отклонения распределения от нормального закона // Метрология. 2005. № 2. С. 3–24.

6.   Орлов А. И. Типовые ошибки при вхождении в прикладную статистику // URL: http://forum.orlovs.pp.ru/viewtopic.php?t=97.