Φ- и Ψ-преобразования, повышающие дискриминирующую силу немонотонных переменных скоринговой модели 
Помазанов М.В.

1
Введение

2
Рис. 1. Выпуклая ROC-кривая
Рис. 2. Невыпуклая ROC-кривая

3
Рис. 3. WOE-преобразование: веса бинов трансформации (переменная — торговые точки, малый и средний бизнес)
Рис. 4. WOE-преобразование: веса бинов трансформации (переменная — среднемесячный баланс свободных средств, малый и средний бизнес)

4
ROC-кривая скоринговой переменной: численные критерии невыпуклости

5
Φ- и ψ-преобразования

6
Рис. 5. Преобразования Φ и Ψ
Демонстрация «лечения вмятин» ROC-кривой на практических примерах

7
Заключение

8
Рис. 7. Φ-преобразовани е

10
ПРИЛОЖЕНИЕ 1. Подходы к квантильной нормализации переменных модели

11
ПРИЛОЖЕНИЕ 2. Доказательство теоремы об оптимальных значениях Φ- и Ψ-преобразований

13
Литература

Ключевые слова: скоринг, биннинг, стандартизация, индекс Джини, дискриминирующая сила

Аннотация

В статье предложен новый метод непрерывной трансформации переменных
скоринговой модели (Φ- и Ψ-преобразования), который является альтернативой различным методам биннинга. Автор обосновывает расчет параметров
трансформации и приводит примеры. Опыт разработки скоринговых моделей
с внедрением Φ- и Ψ-преобразований для «лечения» немонотонных переменных показывает, что для пересмотренных моделей наблюдается ощутимый прирост дискриминирующей силы на уровне 5–10% совокупного индекса Джини.

Журнал: «Управление финансовыми рисками» — №2, 2022 (© Издательский дом Гребенников)
Объем в страницах: 13

DOI

10.36627/2221-7541-2022-2-2-108-120 — https://doi.org/10.36627/2221-7541-2022-2-2-108-120

* Деятельность Meta (соцсети Facebook и Instagram) запрещена в России как экстремистская.

1. Сорокин А.С. Пост роение скоринговых кар т с использованием модели логистической регрессии. — Подробнее .

2. Navas-Palencia G. Optimal Binning: Math ematical Programming Formulation. — Подробнее .

3. Thomas L.C., Edelman D.B., Crook J.N. ( 2002). Credit Scoring and Its Applications. Philadelphia, PA: Society for Industrial and Applied Mathematics.

4. Kerber R. (1992). ChiMerge: Discretizat ion of Numeric Attributes. — Подробнее .

5. Breiman L., Friedman J., Olshen R., Sto ne C. (1984). Classification and Regression Trees. New York: Routledge.

6. Fayyad U.M., Irani K.B. (1993). Multi-I nterval Discretization of Continuous-Valued Attributes for Classification Learning. — Подробнее .

7. Hothorn T., Hornik K., Zeileis A. (2006 ). «Unbiased recursive partitioning: a conditional inference framework». Journal of Computational and Graphical Statistics, Vol. 15(3), pp. 651–674.

8. Siddiqi N. (2005). Credit Risk Scorecar ds: Developing and Implementing Intelligent Credit Scoring. New York: Wiley.

9. Помазанов М.В. ROC-анализ и калибровка скоринговых моделей на основе метрик точности второго порядка // Управление финансовыми рисками. — 2021. — №2. — С. 100–121.

10. Hanley J.A., McNeil B.J. (1982). «The meaning and use of the area under a receiver operating characteristic (ROC) curve». Radiology, Vol. 43(1), pp. 29–36.

11. Pomazanov M.V. (2021). Second-Order Accuracy Metrics for Scoring Models and Their Practical Use. — Подробнее .

12. Bamber D. (1975). «The area above the ordinal dominance graph and the area below the receiver operating characteristic graph». Journal of Mathematical Psychology, Vol. 12(4), pp. 387–415.

13. Помазанов М.В. Маржинальный экономичес кий эффект от повышения качества моделей рейтингования заемщиков банка // Финансовый менеджмент. — 2018. — №4. — С. 96–109.

14. Pepe M.S., Cai T., Longton G. (2006). «Combining predictors for classification using the area under the receiver operating characteristic curve». Biometrics, Vol. 62(1), pp. 221–229.

15. Miura K., Yamashita S., Eguchi S. (201 0). «Area under the curve maximization method in credit scoring». Journal of Risk Model Validation, Vol. 4(2), pp. 3–25.

16. Eguchi S., Copas J. (2002). «A class o f logistic-type discriminant functions». Biometrika, Vol. 89(1), pp. 1–22.

Помазанов Михаил Вячеславович

Помазанов Михаил Вячеславович
к. ф.-м. н.

Руководитель подразделения валидации блока «Риски» ПАО «Промсвязьбанк».

г. Москва

Автор более 25 научных работ, в том числе двух монографий.

Другие статьи автора 12