Математические науки / 3. Теория
вероятностей и математическая статистика
Акимов С.
С.
Оренбургский
государственный университет, Россия
Применение коэффициентов
асимметрии и эксцесса для определения закона распределения вероятности
На сегодняшний момент существует целый ряд
способов восстановления закона распределения вероятности по выборке из
генеральной совокупности.
Необходимость в восстановлении закона
распределения обусловлена особенностями всех современных статистических пакетов
и программ: для проведения анализа данных закон распределения задается вручную.
Незнание же закона распределения,
которому подчиняется выборка, приводит к тому, что исследователь, берет за
основу нормальное распределение, и далее
анализирует совокупность, исходя из параметров нормального распределения [1].
Одним из наиболее известных и
применяемых методов восстановления закона распределения служит гистограммный
метод, подробно описанный в [2]. Однако данный метод, при всей его простоте
использования является весьма субъективным. Для снижения субъективности данного
способа оценивания необходимо использовать математические методы.
Гистограммный метод дает
исследователю графическое отображение экспериментальных данных, и по виду
построенной гистограммы исследователь принимает гипотезу о виде закона
распределения вероятности. Однако сам вид гистограммы зависит от ряда
характеристик, из которых основными
являются (для одновершинных распределений) сдвиг параметров относительно центра
(асимметрия) и кривизна полученной гистограммы (эксцесс). Как известно, эти
параметры рассчитываются как центральные моменты третьего и четвертого порядка.
Целый ряд отечественных и
зарубежных ученных описывают применение методов коэффициента асимметрии и
эксцесса для проверки нормальности распределения [3,4,5]. Однако ряд авторов,
также, признают несостоятельность использования данного метода для проверки
нормальности [6]. Основная причина несостоятельности заключается в том, что
существует ряд распределений, имеющих коэффициент асимметрии и эксцесса аналогичный
нормальному закону распределения.
Таким образом, использование
коэффициентов асимметрии и эксцесса не может дать однозначного ответа на вопрос
о нормальности закона распределения в частности и виде закона распределения в
целом. Однако этот метод весьма действенен, если использовать его как критерий
для сортировки законов распределений.
Рассмотрим этот процесс более
подробно. Для начала необходимо перечислить все наиболее часто встречающиеся распределения:
распределение Коши, Фишера, Стьюдента, Пуассона, Вейбулла, Бернулли, Рэлея,
нормальное, логнормальное, логистическое, равномерное непрерывное и дискретное,
биноминальное, отрицательное биноминальное, геометрическое,
гипергеометрическое, экспоненциальное, гамма, бета и хи-квадрат.
Прежде, чем исследовать
коэффициенты асимметрии и эксцесса, необходимо отметить главную сложность этого
процесса: в ряде распределений с изменением параметра изменяются и моменты
третьего и четвертого порядков. Потому отнесем такие распределения в «зону
неопределенности».
Итак, разобьем перечисленные
выше законы распределения согласно коэффициенту асимметрии, представив данные в
таблице.
|
Симметричные |
Асимметричные |
Неопределенные |
|
Биноминальное |
Экспоненциальное |
Коши |
|
Нормальное |
Фишера |
Бета |
|
Логистическое |
Геометрическое |
Хи-квадрат |
|
Стьюдента |
Логнормальное |
Гамма |
|
Равномерное непрерывное |
|
Гипергеометрическое |
|
Равномерное дискретное |
|
Отр. Биноминальное |
|
|
|
Пуассона |
|
|
|
Вейбулла |
|
|
|
Рэлея |
|
|
|
Бернулли |
Как видно из таблицы, в зону
определенности попадает гораздо больше законов распределений, чем во все
другие. Отрицательный момент заключается в том, что при оценке коэффициента
асимметрии «зону неопределенности» придется учитывать как в симметричных, так и
асимметричных распределениях, отсюда следует, что данный коэффициент лишь
поможет отбросить те законы распределения, которые точно не являются
симметричными или асимметричными.
Такая же ситуация обстоит и с
коэффициентом эксцесса.
|
Нормальный эксцесс |
Ненормальный эксцесс |
Неопределенные |
|
Биноминальное |
Коши |
Бета |
|
Гипергеометрическое |
Экспоненциальное |
Хи-квадрат |
|
Нормальное |
Фишера |
Гамма |
|
Стьюдента |
Геометрическое |
Логистическое |
|
Равномерное непрерывное |
Логнормальное |
Отр. Биноминальное |
|
Равномерное дискретное |
|
Пуассона |
|
|
|
Вейбулла |
|
|
|
Бернулли |
|
|
|
Рэлея |
Замечание, написанное для коэффициента
асимметрии, справедливо и для коэффициента эксцесса – расчет коэффициента
поможет лишь отбросить законы, не попадающие в «нормальную зону».
Из приведенных таблиц видно, что совмещение этих
коэффициентов не дает особого результата: в большинстве случаев симметричные
распределения имеют нормальный эксцесс и наоборот. Поэтому наиболее
информативными станут случаи, когда закон распределения симметричный, а эксцесс
не соответствует нормальному или наоборот – в этих случаях отсеивается примерна
половина приведенных законов распределения
Кроме того, из приведенных таблиц видна
несостоятельность использования коэффициентов асимметрии и эксцесса для
проверки нормальности. Однако их использование для определения вида закона распределения
позволяет отсеять от 4 до 10 законов, не попадающие под заданные условия.
Литература:
1. Акимов С.С., Шепель В.Н.
Эвристическая процедура определения подходящего распределения вероятности /
В.Н. Шепель, С.С Акимов /Компьютерная интеграция производства и ИПИ-технологии
/ Сборник материалов V Всероссийской научно-практической конференции. -
Оренбург: Изд. ИП Осниночкин Я.В., 2011. – С. 137-139.
2. Шепель В.Н. Алгоритм
определения эмпирической функции плотности
по выборке из генеральной совокупности.
Современные информационные технологии в науке и практике. Материалы VIII
всероссийской научно-практической конференции (с международным участием). –
Оренбург: ИПК ГОУ ОГУ, 2009, с. 224-226.
3. D’Agostino, Ralph B.; Albert Belanger; Ralph B. D’Agostino, Jr (1990).
"A suggestion for using powerful and informative tests of normality".
The
American Statistician 44 (4): 316–321.
4. Shenton, L.R.; Bowman, K.O. (1977). "A bivariate model for the
distribution of √b1 and b2". Journal of the American Statistical Association
72 (357): 206–211.
5. Лемешко Б. Ю., Лемешко
С. Б. Сравнительный анализ критериев проверки отклонения распределения от
нормального закона // Метрология. 2005. № 2. С. 3–24.
6. Орлов А. И. Типовые
ошибки при вхождении в прикладную статистику // URL: http://forum.orlovs.pp.ru/viewtopic.php?t=97.