Modelación con regresión para análisis de otorgamento de crédito

Autores/as

DOI:

https://doi.org/10.33448/rsd-v11i7.29761

Palabras clave:

Minería de datos; Curva ROC; Probabilidad.

Resumen

Con el avance del Big Data y el creciente número de grandes masas de datos en las más diversas áreas de estudio, las técnicas de minería de datos se vuelven cada vez más necesarias para obtener información estadística precisa y robusta. Este estudio tuvo como objetivo mostrar la eficiencia de la regresión logística como técnica de minería de datos en la obtención de un modelo útil y estadísticamente efectivo en el análisis de clientes para el otorgamiento de crédito bancario. Los datos provienen del repositorio de aprendizaje automático de la Universidad de California-Irvin UCI. La base de datos se dividió en dos grupos: entrenamiento y prueba. El modelo ajustado se seleccionó mediante el método stepwise en el programa R. El modelo cumplió con las expectativas de bondad de ajuste, con una precisión de aproximadamente 72% en discriminar clientes no morosos de no morosos, sensibilidad de 87% de los 140 no morosos. -clientes morosos, el modelo fue correcto 122 y especificidad del 38%. La curva ROC tenía un área de 0.847, sugiriendo un ajuste efectivo.

Biografía del autor/a

Sílvio Fernando Alves Xavier Júnior, Universidade Estadual da Paraíba

Licenciado em Matemática (UFPE). Possui Mestrado em Biometria e Estatísitica Aplicada (UFRPE). Doutorado em Biometria e Estatística Aplicada (UFRPE). Realizou estágio sanduíche na Texas A & M University (duração de 6 meses), United States, Biological and Agricultural Engineering Department. Coordenador do curso de Estatística (CCT/UEPB), presidente do colegiado do curso de Estatística. Membro do PROFMAT - UEPB. Áreas de interesse: Estatística Aplicada, Probabilidade e Inferência Estatística, MF-DFA, Markov Chain, PSO, Entropia e Análise de Tendências.

Citas

Agresti, A. (2018). An introduction to categorical data analysis. John Wiley & Sons.

Braga, A. C. (2001). Curvas ROC: aspectos funcionais e aplicações.

Costa, R. R. (2003). Análise empresarial avançada para crédito. Qualitymark Editora Ltda.

Costa, R. S. D. (2013). Teste de diagnóstico baseado em análise de regressão logística.

Cox, D. R., & Hinkley, D. V. (1979). Theoretical statistics. CRC Press.

Dunn, P. K., & Smyth, G. K. (1996). Randomized quantile residuals. Journal of Computational and Graphical Statistics, 5(3), 236-244.

Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression (Vol. 398). John Wiley & Sons.

Kleinbaum, D. G., & Klein, M. (2002). Analysis of matched data using logistic regression. Logistic regression: A self-learning text, 227-265.

Lewis, E. M. (1992). An introduction to credit scoring. Fair, Isaac and Company.

Lima, F. A. P. D. (2011). Práticas em gestão de sistemas de credit scoring e portfólio de crédito em instituições financeiras brasileiras (Tese de Doutorado).

Marcelino, J. A. (2012). Credit scoring: uma ferramenta para análise de crédito em uma instituição de microcrédito produtivo e orientado.

Mays, F. E., & Lynas, N. (2004). Credit scoring for risk managers: The handbook for lenders. Thomson/South-Western.

Moura, G. M. (2018). Regressão Logística aplicada a análise de risco de crédito. (Monografia, Universidade Federal do Rio Grande).

Nelder, J. A., & Wedderburn, R. W. (1972). Generalized linear models. Journal of the Royal Statistical Society: Series A (General), 135(3), 370-384.

Pagano, M., & Gauvreau, K. (2011). Princípios de bioestatística. In Princípios de bioestatística (pp. xv-506).

Paula, G. A. (2004). Modelos de regressão: com apoio computacional (pp. 28-55). IME-USP.

Pereira, M. A. A. (2019). Modelos não lineares assimétricos com efeitos mistos.

Da Silva, J. P. (2000). Gestão e análise de risco de crédito. Editora Atlas SA.

Souza, É. C. D. (2006). Análise de influência local no modelo de regressão logística (Tese de Doutorado, Universidade de São Paulo).

Tavares, M.D.C. (2009). A crise financeira atual. Paper Itamaraty, 30(04).

Team, R. C. (2021). R: A language and environment for statistical computing (R Version 4.0. 3, R Foundation for Statistical Computing, Vienna, Austria, 2020).: https://www.r-project.org/.

Walpole, R. E. (2009). Probabilidade & Estatística para engenharias e ciências. Pearson Prentice Hall.

Publicado

19/05/2022

Cómo citar

BESERRA, R. S. .; BARBOSA, N. F. M. .; PEIXOTO, A. P. B. .; MORAIS XAVIER, Érika F. .; JALE, J. S. .; XAVIER JÚNIOR, S. F. A. Modelación con regresión para análisis de otorgamento de crédito. Research, Society and Development, [S. l.], v. 11, n. 7, p. e15211729761, 2022. DOI: 10.33448/rsd-v11i7.29761. Disponível em: https://rsdjournal.org/index.php/rsd/article/view/29761. Acesso em: 26 nov. 2024.

Número

Sección

Ciencias Exactas y de la Tierra