Modelagem com regressão logística para análise de concessão de crédito

Autores

DOI:

https://doi.org/10.33448/rsd-v11i7.29761

Palavras-chave:

Mineração de dados; Curva ROC; Probabilidade.

Resumo

Com o avanço do Big Data e o crescente número de grandes massas de dados nas mais diversas áreas de estudo, técnicas de mineração de dados tornam-se cada vez mais necessárias para obtenção de informações estatísticas precisas e robustas. Este estudo teve como objetivo mostrar a eficiência da regressão logística como técnica de mineração de dados na obtenção de um modelo útil e estatisticamente eficaz na análise de clientes para a concessão do crédito bancário. Os dados utilizados são oriundos do repositório Machine Learning Repository’s da Universidade da California-Irvin UCI, sendo divididos em dois grupos: treinamento e teste. O modelo ajustado foi selecionado com o método stepwise no programa R e atendeu as expectativas de qualidade do ajuste, com acurácia de aproximadamente 72% em discriminar clientes adimplentes de inadimplentes, sensibilidade de 87% dos 140 clientes adimplentes o modelo acertou 122 e especificidade de 38%. A curva ROC teve uma área de 0,847, sugerindo um ajuste eficaz.

Biografia do Autor

Sílvio Fernando Alves Xavier Júnior, Universidade Estadual da Paraíba

Licenciado em Matemática (UFPE). Possui Mestrado em Biometria e Estatísitica Aplicada (UFRPE). Doutorado em Biometria e Estatística Aplicada (UFRPE). Realizou estágio sanduíche na Texas A & M University (duração de 6 meses), United States, Biological and Agricultural Engineering Department. Coordenador do curso de Estatística (CCT/UEPB), presidente do colegiado do curso de Estatística. Membro do PROFMAT - UEPB. Áreas de interesse: Estatística Aplicada, Probabilidade e Inferência Estatística, MF-DFA, Markov Chain, PSO, Entropia e Análise de Tendências.

Referências

Agresti, A. (2018). An introduction to categorical data analysis. John Wiley & Sons.

Braga, A. C. (2001). Curvas ROC: aspectos funcionais e aplicações.

Costa, R. R. (2003). Análise empresarial avançada para crédito. Qualitymark Editora Ltda.

Costa, R. S. D. (2013). Teste de diagnóstico baseado em análise de regressão logística.

Cox, D. R., & Hinkley, D. V. (1979). Theoretical statistics. CRC Press.

Dunn, P. K., & Smyth, G. K. (1996). Randomized quantile residuals. Journal of Computational and Graphical Statistics, 5(3), 236-244.

Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression (Vol. 398). John Wiley & Sons.

Kleinbaum, D. G., & Klein, M. (2002). Analysis of matched data using logistic regression. Logistic regression: A self-learning text, 227-265.

Lewis, E. M. (1992). An introduction to credit scoring. Fair, Isaac and Company.

Lima, F. A. P. D. (2011). Práticas em gestão de sistemas de credit scoring e portfólio de crédito em instituições financeiras brasileiras (Tese de Doutorado).

Marcelino, J. A. (2012). Credit scoring: uma ferramenta para análise de crédito em uma instituição de microcrédito produtivo e orientado.

Mays, F. E., & Lynas, N. (2004). Credit scoring for risk managers: The handbook for lenders. Thomson/South-Western.

Moura, G. M. (2018). Regressão Logística aplicada a análise de risco de crédito. (Monografia, Universidade Federal do Rio Grande).

Nelder, J. A., & Wedderburn, R. W. (1972). Generalized linear models. Journal of the Royal Statistical Society: Series A (General), 135(3), 370-384.

Pagano, M., & Gauvreau, K. (2011). Princípios de bioestatística. In Princípios de bioestatística (pp. xv-506).

Paula, G. A. (2004). Modelos de regressão: com apoio computacional (pp. 28-55). IME-USP.

Pereira, M. A. A. (2019). Modelos não lineares assimétricos com efeitos mistos.

Da Silva, J. P. (2000). Gestão e análise de risco de crédito. Editora Atlas SA.

Souza, É. C. D. (2006). Análise de influência local no modelo de regressão logística (Tese de Doutorado, Universidade de São Paulo).

Tavares, M.D.C. (2009). A crise financeira atual. Paper Itamaraty, 30(04).

Team, R. C. (2021). R: A language and environment for statistical computing (R Version 4.0. 3, R Foundation for Statistical Computing, Vienna, Austria, 2020).: https://www.r-project.org/.

Walpole, R. E. (2009). Probabilidade & Estatística para engenharias e ciências. Pearson Prentice Hall.

Downloads

Publicado

19/05/2022

Como Citar

BESERRA, R. S. .; BARBOSA, N. F. M. .; PEIXOTO, A. P. B. .; MORAIS XAVIER, Érika F. .; JALE, J. S. .; XAVIER JÚNIOR, S. F. A. Modelagem com regressão logística para análise de concessão de crédito . Research, Society and Development, [S. l.], v. 11, n. 7, p. e15211729761, 2022. DOI: 10.33448/rsd-v11i7.29761. Disponível em: https://rsdjournal.org/index.php/rsd/article/view/29761. Acesso em: 26 nov. 2024.

Edição

Seção

Ciências Exatas e da Terra