УДК 004.93’1

Руцкой Р.В.

Юго-Западный государственный университет, г. Курск, Е-mail: SFilist@gmail.com

 

Нечеткие медицинские классификаторы на основе секвенциальной последовательной процедуры А. Вальда

 

В задачах медицинской диагностики при малых объемах обучающих выборок и неполной последовательно получаемой информации характеризующей состояние обследуемых (информативные признаки    (i=1, …, n)). Ряд исследователей рекомендует использовать последовательную секвенциальную процедуру А. Вальда [1, 4].

В одном из распространенных вариантов этой процедуры информативные признаки  разбиваются на k – градаций, характеризующихся числами .Для каждой из градаций определяется диагностический коэффициент

,                                                                  (1)

где  - частота появления k-ой градации i-го признака в исследуемом классе состояний ;  - частота появления k-ой градации i-го признака в альтернативных классах состояний .

Для всех участвующих в классификации признаков диагностический коэффициент определяется выражением:

.                                                                                (2)

Положительные значения ДК свидетельствуют в пользу класса , отрицательные – в пользу классов .

При этом существует зона неопределенной классификации, определяемая двумя порогами: порог для класса  () и порог для классов  (). Эти пороги определяются выражениями:

;

,

где  - допустимый процент ошибок первого рода, когда гипотеза  принимается за гипотезу ;  - допустимый процент ошибок второго рода, когда гипотеза  принимается за гипотезу .

Решение о классификации принимается в соответствии со следующим правилом:

.         (3)

Таким образом, решение о классификации принимается по жесткому (четкому) алгоритму, что не всегда соответствует клинической логики принятия решения. Открытым также остается вопрос о том, какое решение принимать, если диагностический коэффициент близок или равен одному из пороговых значений  или , как принимать решение, если альтернативные классы  и  пересекаются, что характерно для задач прогнозирования, ранней (донозологической) диагностике, определения степени тяжести и (или) стадии заболевания.

Перечисленные сложности определенным образом устраняются, если от четкого правила классификации перейти к нечеткой логике принятия решений, например, определив функции принадлежности  и  к классам  и  на базовой переменной ДК (рис. 1).

На этом рисунке  выбирается экспертами исходя из доверия к точности классификации по заданному пространству информативных признаков и к диагностическим возможностям процедуры А. Вальда.

Общие рекомендации по выбору формы и параметров функций принадлежности, ориентированных на классификационные задачи для различных типов базовых переменных, можно найти в работе [3].

Рис. 1. Вариант построения функций принадлежности к классам  и  с базовой переменной ДК

 

На практике процедура А. Вальда может быть построена для некоторого подпространства информативных признаков, не обеспечивающих требуемое качество классификации, тогда функции принадлежности  и  могут быть «встроены» в более общие конструкции с синтезом финальных решающих правил, обеспечивающих заданное качество классификации.

Вариант такого синтеза, использующего данные разведочного анализа, описан в работах [2].

Рассмотренный метод синтеза нечетких решающих правил был применен для решения задачи оценки тяжести состояния больных острым панкреатитом. Система информативных признаков со значениями диагностических коэффициентов (ДК) по этой задаче приведен в таблице 1 [4], а график соответствующей функции принадлежности -  на рис. 2.

На этом рисунке:  - легкая степень тяжести панкреатита,  - тяжелая степень тяжести панкреатита,  - базовая переменная равная ДК, определяемому формулой (2). Максимальное значение  определяет уровень экспертного доверия к прогностической таблице.

 

Рис. 2. Функция принадлежности к классам  и  с носителем по шкале суммы баллов прогностической таблицы

 

Для повышения уровня доверия к оценке степени тяжести панкреатита могут быть использованы дополнительные информативные признаки:  - злоупотребление алкоголем,  - характер течения заболевания,  - показатель кислотозависимого метаболизма полиморфно-ядерных клеток,  - кислотонезависимые показатели миелопероксидаза,  - лизосамальные катионные белки. Для всех этих показателей в работе [4] были получены семейства функций принадлежности ,  и в соответствии с рекомендациями работ [2] построены финальные итерационные решающие правила для расчета уверенности  в гипотезах:

,                                     (4)

,                                    (5)

где  - номер итерации в расчетах коэффициентов уверенности  в гипотезах  и , , .

Для наиболее распространенных факторов риска и информативных признаков расчетная уверенность достигает величины 0,9, что вполне приемлемо для медицинской практики.

 

Литература

1.     Вальд А. Последовательный анализ/ М. Физматлит, 1960. - 328 с.

2.     Кореневский Н.А. Синтез нечетких сетевых моделей обучаемых по структуре данных для медицинских систем / Н.А. Кореневский, Р.А. Крупчатников, С.А. Горбатенко // Медицинская техника. - 2008. - №2. – С. 18-24.

3.     Кореневский Н.А. Геометрический подход к синтезу нечетких решающих правил для решения задач прогнозирования и медицинской диагностики / Н.А. Кореневский, С.А. Филист, А.Г. Устинов, Е.Б. Рябкова // Биомедицинская радиоэлектроника. - 2012. - №4. – С. 20-25.

4.     Локтионов А.Л. Прогнозирование возникновения и оценка степени тяжести панкреатитов на основе нечеткой логики принятия решений / А.Л. Локтионов, Н.А. Кореневский, Л.П. Лазурина, И.Л. Гаврилов // Биомедицинская радиоэлектроника. - 2009. - №5. – С. 16-22.