Modelo de Regressão logística binária aplicada a dados de acidentes em rodovias federais no Brasil

Autores

DOI:

https://doi.org/10.33448/rsd-v11i15.36833

Palavras-chave:

Análise supervisionada; Aprendizado de máquina; Razão de chances; Letalidade dos acidentes; Acidentes rodoviários.

Resumo

Os acidentes ocorridos em rodovias federais no Brasil geram impactos sociais e econômicos para o país. Dados da Polícia Rodoviária Federal revelam que, ano após ano, milhares de pessoas perdem suas vidas nesses acidentes. Este trabalho objetiva explorar os fatores que influenciam a probabilidade de óbito a partir da ocorrência do acidente. Foi estimado um modelo de regressão logística binária, em que o evento de interesse é a circunstância de óbito em um acidente com dados de 2021. Atendendo alguns procedimentos de seleção de variáveis, foi obtido a modelo final e, em seguida, feita uma validação com dados de 2022. A eficiência global do modelo, tanto nos dados de 2021 quanto em 2022, ficou em torno de 70%. Em seguida, foi calculada a razão de chances entre algumas categorias distintas e o quanto gera de aumento na letalidade do acidente em relação à categoria de referência – como o pedestre, que tem 15,6 vezes mais chance de letalidade do que o condutor em um acidente, assim como o uso de bicicleta, que tem 5,3 vezes mais chances do que o automóvel. Apesar de a maioria dos acidentes ter causa humana, alguns resultados demonstram que existe a necessidade de intervenção por parte de políticas públicas que podem ajudar na redução dessas tragédias. Para tornar mais concreto e dinâmico o entendimento do modelo, foi elaborado um dashboard para que o usuário obtenha a probabilidade de óbito por meio da seleção de determinadas características do acidente e dos envolvidos.

Biografia do Autor

Yuri Machado de Souza, Universidade de São Paulo

Master in Applied Economics

Referências

Akaike, H. (1974). A new look at the statistical model identification. IEEE Transactions on Automatic Control, 19 (6), 716-723.

Carvalho, M. S. et al. (2011). Análise de sobrevivência: teoria e aplicações em saúde. FIOCRUZ.

Colosimo, E. A. & Giolo, S.R. (2006). Análise de sobrevivência aplicada. Edgard Blucher.

Core Team. (2021). A language and environment for statistical computing. Foundation for Statistical Computing, Vienna, Austria. https://www.R-project.org.

Core Team. (2021). Core Team and contributors worldwide stats: The R Stats Package. R package version 4.2.0. 2021.. https://stat.ethz.ch/R-manual/R-devel/library/stats/html/00Index.html.

CNT. Confederação Nacional do Transporte (2021). Painel CNT de Consultas Dinâmicas dos Acidentes Rodoviários. https://www.cnt.org.br/painel-acidente.

Fávero, L. P. & Belfiore, P. (2017). Manual de análise de dados: estatística e modelagem multivariada com Excel®, SPSS® e Stata®. Elsevier.

Giolo, S. R. (2017). Introdução à Análise de Dados Categóricos com Aplicações. Projeto Fisher ABE.

Izbicki, R. & dos Santos, T. M. (2020). Aprendizado de máquina: uma abordagem estatística. Rafael Izbicki,.

Junior, G. T. B., Bertho, A. C. S. & Veiga, A. C. (2019). A letalidade dos acidentes de trânsito nas rodovias federais brasileiras. Revista Brasileira de Estudos de População, 36, 1-22.

Miranda, R., Silva, W. P. & Dutt-Ross, S. (2021). Identificação de fatores determinantes da severidade das lesões sofridas por pedestres nas rodovias federais brasileiras entre 2017 e 2019: Análise via regressão logística multinomial. Scientia Plena, 17 (4).

McCullagh, P. & Nelder, J. A. (1989). Generalized Linear Models. London – New York. Second edition, Chapman and Hall, 1989.

PRF. Polícia Rodoviária Federal. (2021). https://arquivos.prf.gov.br/arquivos/index.php/s/n1T3lymvIdDOzzb.

Roquim, F. V., Nakamura, L. R., Ramires, T. G. & Lima, R. R. (2019). Regressão logística: o que leva um acidente rodoviário a ser uma tragédia? Sigmae, 8 (2), 19-28.

Santos, D. F. (2017). Modelo de regressão log-logístico discreto com fração de cura para dados de sobrevivência. (Dissertação de Mestrado) . Universidade de Brasília, Brasília, Brasil.

Schwarz, G. (1978). Estimating the dimensional of a model. Annals of Statistics, 6, 461-464.

Sugiura, N. (1978). Further analysts of the data by Akaike’s information criterion and the finite corrections: Further analysis of the data by Akaike’s. Communications in Statistics – Theory and Methods, 7 (1), 13-26.

Wald, A. (1943). Tests of statistical hypotheses concerning several parameters when the number of observations is large. Trans. Amer. Math. Soc, 462-482.

WHO. World Health Organization. (2015). Global status report on road safety 2015. https://shortest.link/whointviolenceinjuryprevention.

Downloads

Publicado

12/11/2022

Como Citar

SANTOS, D. F. dos .; SOUZA, Y. M. de . Modelo de Regressão logística binária aplicada a dados de acidentes em rodovias federais no Brasil . Research, Society and Development, [S. l.], v. 11, n. 15, p. e120111536833, 2022. DOI: 10.33448/rsd-v11i15.36833. Disponível em: https://rsdjournal.org/index.php/rsd/article/view/36833. Acesso em: 17 jul. 2024.

Edição

Seção

Ciências Exatas e da Terra