Решение
задачи кредитного скоринга с помощью регрессионных моделей
Подавляющее большинство
решений для потребительского кредитования в банках, которые решают выдавать
кредиты или нет, используют автоматизированные скоринговые системы,
основывающиеся на анализе кредитных баллов клиентов. Кредитные баллы дают
оценку кредитного риска по каждому человеку, определяют «хороший» или «плохой»
клиент и генерируются с помощью прогнозирующей модели, основанной на платежной
дисциплине предыдущих клиентов, чья платежеспособность изучена в течение
определенного периода времени.
Рост
конкурентоспособности банков при предоставлении кредитных продуктов ведет к
тому, что необходимо увеличивать скорость принятия решений и улучшать
показатели кредитного скоринга.
Крайне необходимы методики, в которых имеется возможность
обновления коэффициентов скоринга и их автоматически обновляют. Именно поэтому
возникает задача разработки системы и алгоритма, который бы учитывал
максимально возможное количество параметров и постоянно изменяющиеся факторы
макроэкономической среды, а также автоматически обновлялся в зависимости от
изменения этих факторов [1].
В самом упрощенном виде скоринговая
модель представляет собой взвешенную сумму определенных характеристик. В
результате получается интегральный показатель (score), чем он выше, тем выше
надежность клиента, и банк может упорядочить своих клиентов по степени
возрастания кредитоспособности. Все это выглядит очень просто, однако сложность
заключается в определении, какие характеристики следует включать в модель и
какие весовые коэффициенты должны им соответствовать.
В данной статье предлагается построение модели кредитного скоринга на основе метода
линейной многофакторной регрессии [1]:
р = wo + w1x1 + w2x2 + … + wnxn ,
где р -- вероятность дефолта, w -- весовые коэффициенты, x -- характеристики клиента.
Скоринг
представляет собой классификационную задачу, где исходя из имеющейся информации
необходимо получить функцию, наиболее точно разделяющее выборку клиентов на
«плохих» и «хороших». Методы собственно классификации весьма
разнообразны и включают в себя:
·
статистические
методы, основанные на дискриминантном анализе (линейная регрессия,
логистическая регрессия);
·
различные
варианты линейного программирования;
·
дерево
классификации или рекурсионно-партиционный алгоритм
(РПА);
·
нейронные сети;
·
генетический
алгоритм;
·
метод ближайших
соседей.
Численное
моделирование задачи кредитного скоринга проводится с использованием UML диаграмм:
Использованная литература:
[1] Balakayeva G.T., Nurlybaeva K. Algorithmic Scoring Models, Applied Mathematical Sciences, Journal for Theory and Applications, Vol. 7, 2013, no.12,571-586.
[2] Э. Мейз. Руководство по
кредитному скорингу. Изд: «Гревцов Паблишер», Минск, 2008
[3] Churchill G. A., Nevin J.
R., Watson R. R.// The role of credit scoring in the loan decision. Credit
World. March/1977
[4] http://www.statsoft.com/Products/STATISTICA/Data-Miner
[5] http://afdanalyse.ru/publ/finansovyj_analiz/method_fin_analiza/kreditnyj_skoring/9-1-0-280