Modelo de Regressão logística binária aplicada a dados de acidentes em rodovias federais no Brasil
DOI:
https://doi.org/10.33448/rsd-v11i15.36833Palavras-chave:
Análise supervisionada; Aprendizado de máquina; Razão de chances; Letalidade dos acidentes; Acidentes rodoviários.Resumo
Os acidentes ocorridos em rodovias federais no Brasil geram impactos sociais e econômicos para o país. Dados da Polícia Rodoviária Federal revelam que, ano após ano, milhares de pessoas perdem suas vidas nesses acidentes. Este trabalho objetiva explorar os fatores que influenciam a probabilidade de óbito a partir da ocorrência do acidente. Foi estimado um modelo de regressão logística binária, em que o evento de interesse é a circunstância de óbito em um acidente com dados de 2021. Atendendo alguns procedimentos de seleção de variáveis, foi obtido a modelo final e, em seguida, feita uma validação com dados de 2022. A eficiência global do modelo, tanto nos dados de 2021 quanto em 2022, ficou em torno de 70%. Em seguida, foi calculada a razão de chances entre algumas categorias distintas e o quanto gera de aumento na letalidade do acidente em relação à categoria de referência – como o pedestre, que tem 15,6 vezes mais chance de letalidade do que o condutor em um acidente, assim como o uso de bicicleta, que tem 5,3 vezes mais chances do que o automóvel. Apesar de a maioria dos acidentes ter causa humana, alguns resultados demonstram que existe a necessidade de intervenção por parte de políticas públicas que podem ajudar na redução dessas tragédias. Para tornar mais concreto e dinâmico o entendimento do modelo, foi elaborado um dashboard para que o usuário obtenha a probabilidade de óbito por meio da seleção de determinadas características do acidente e dos envolvidos.
Referências
Akaike, H. (1974). A new look at the statistical model identification. IEEE Transactions on Automatic Control, 19 (6), 716-723.
Carvalho, M. S. et al. (2011). Análise de sobrevivência: teoria e aplicações em saúde. FIOCRUZ.
Colosimo, E. A. & Giolo, S.R. (2006). Análise de sobrevivência aplicada. Edgard Blucher.
Core Team. (2021). A language and environment for statistical computing. Foundation for Statistical Computing, Vienna, Austria. https://www.R-project.org.
Core Team. (2021). Core Team and contributors worldwide stats: The R Stats Package. R package version 4.2.0. 2021.. https://stat.ethz.ch/R-manual/R-devel/library/stats/html/00Index.html.
CNT. Confederação Nacional do Transporte (2021). Painel CNT de Consultas Dinâmicas dos Acidentes Rodoviários. https://www.cnt.org.br/painel-acidente.
Fávero, L. P. & Belfiore, P. (2017). Manual de análise de dados: estatística e modelagem multivariada com Excel®, SPSS® e Stata®. Elsevier.
Giolo, S. R. (2017). Introdução à Análise de Dados Categóricos com Aplicações. Projeto Fisher ABE.
Izbicki, R. & dos Santos, T. M. (2020). Aprendizado de máquina: uma abordagem estatística. Rafael Izbicki,.
Junior, G. T. B., Bertho, A. C. S. & Veiga, A. C. (2019). A letalidade dos acidentes de trânsito nas rodovias federais brasileiras. Revista Brasileira de Estudos de População, 36, 1-22.
Miranda, R., Silva, W. P. & Dutt-Ross, S. (2021). Identificação de fatores determinantes da severidade das lesões sofridas por pedestres nas rodovias federais brasileiras entre 2017 e 2019: Análise via regressão logística multinomial. Scientia Plena, 17 (4).
McCullagh, P. & Nelder, J. A. (1989). Generalized Linear Models. London – New York. Second edition, Chapman and Hall, 1989.
PRF. Polícia Rodoviária Federal. (2021). https://arquivos.prf.gov.br/arquivos/index.php/s/n1T3lymvIdDOzzb.
Roquim, F. V., Nakamura, L. R., Ramires, T. G. & Lima, R. R. (2019). Regressão logística: o que leva um acidente rodoviário a ser uma tragédia? Sigmae, 8 (2), 19-28.
Santos, D. F. (2017). Modelo de regressão log-logístico discreto com fração de cura para dados de sobrevivência. (Dissertação de Mestrado) . Universidade de Brasília, Brasília, Brasil.
Schwarz, G. (1978). Estimating the dimensional of a model. Annals of Statistics, 6, 461-464.
Sugiura, N. (1978). Further analysts of the data by Akaike’s information criterion and the finite corrections: Further analysis of the data by Akaike’s. Communications in Statistics – Theory and Methods, 7 (1), 13-26.
Wald, A. (1943). Tests of statistical hypotheses concerning several parameters when the number of observations is large. Trans. Amer. Math. Soc, 462-482.
WHO. World Health Organization. (2015). Global status report on road safety 2015. https://shortest.link/whointviolenceinjuryprevention.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2022 Damião Flávio dos Santos; Yuri Machado de Souza

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Autores que publicam nesta revista concordam com os seguintes termos:
1) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
2) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
3) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.