Решение задачи кредитного скоринга с помощью регрессионных моделей

Подавляющее большинство решений для потребительского кредитования в банках, которые решают выдавать кредиты или нет, используют автоматизированные скоринговые системы, основывающиеся на анализе кредитных баллов клиентов. Кредитные баллы дают оценку кредитного риска по каждому человеку, определяют «хороший» или «плохой» клиент и генерируются с помощью прогнозирующей модели, основанной на платежной дисциплине предыдущих клиентов, чья платежеспособность изучена в течение определенного периода времени.

Рост конкурентоспособности банков при предоставлении кредитных продуктов ведет к тому, что необходимо увеличивать скорость принятия решений и улучшать показатели кредитного скоринга.  

Крайне необходимы   методики, в которых имеется возможность обновления коэффициентов скоринга и их автоматически обновляют. Именно поэтому возникает задача разработки системы и алгоритма, который бы учитывал максимально возможное количество параметров и постоянно изменяющиеся факторы макроэкономической среды, а также автоматически обновлялся в зависимости от изменения этих факторов [1].     

В самом упрощенном виде скоринговая модель представляет собой взвешенную сумму определенных характеристик. В результате получается интегральный показатель (score), чем он выше, тем выше надежность клиента, и банк может упорядочить своих клиентов по степени возрастания кредитоспособности. Все это выглядит очень просто, однако сложность заключается в определении, какие характеристики следует включать в модель и какие весовые коэффициенты должны им соответствовать. 

В данной статье предлагается построение   модели кредитного скоринга на основе метода линейной многофакторной регрессии [1]:     

    р = wo + w1x1 + w2x2 + … + wnxn ,

где р -- вероятность дефолта, w -- весовые коэффициенты, x -- характеристики клиента.

Скоринг представляет собой классификационную задачу, где исходя из имеющейся информации необходимо получить функцию, наиболее точно разделяющее выборку клиентов на «плохих» и «хороших». Методы собственно классификации весьма разнообразны и включают в себя:

·        статистические методы, основанные на дискриминантном анализе (линейная регрессия, логистическая регрессия);

·        различные варианты линейного программирования;

·        дерево классификации или рекурсионно-партиционный алгоритм (РПА);

·        нейронные сети;

·        генетический алгоритм;

·        метод ближайших соседей.

    

Численное моделирование задачи кредитного скоринга проводится с использованием UML диаграмм:

 

 

 

Использованная литература:

[1] Balakayeva G.T., Nurlybaeva K.  Algorithmic Scoring Models, Applied Mathematical Sciences, Journal for Theory and Applications,  Vol. 7, 2013, no.12,571-586.

[2] Э. Мейз. Руководство по кредитному скорингу. Изд: «Гревцов Паблишер», Минск, 2008 

 

[3] Churchill G. A., Nevin J. R., Watson R. R.// The role of credit scoring in the loan decision. Credit World. March/1977

[4] http://www.statsoft.com/Products/STATISTICA/Data-Miner

[5] http://afdanalyse.ru/publ/finansovyj_analiz/method_fin_analiza/kreditnyj_skoring/9-1-0-280