Use of the Apriori algorithm to trace the sociodemographic profile of brazilian men with prostate cancer

Authors

DOI:

https://doi.org/10.33448/rsd-v11i6.29168

Keywords:

Prostate Cancer; Data Mining; Association Rules; Apriori Algorithm; Teaching in health.

Abstract

Among the diseases that affect the male population, prostate cancer has increased the mortality rate among them, where it is the sixth malignant neoplasm in the world and in Brazil the first. Despite the initiatives to help the male population against prostate cancer, there is still a lack of guidance regarding diagnosis and treatment. However, the initiatives would be better targeted if they had the profiles of patients assisted by them, but it is still a field of research with gaps. In addition, data that can help are stored in large databases with a lot of information, mainly due to the computerization process of the health sector, which makes manual analysis of this data difficult. This work aims to determine the sociodemographic profile of Brazilians with prostate cancer through the Apriori algorithm with data from 2010 to 2019. With this, we applied the Apriori algorithm to the INCA database in order to have the rules of Association. In the end, it is clear that the factors of smoking, alcoholism, race and marital status are the factors that stood out the most as they appear in the rules with the highest levels of confidence. However, we infer that the brown race has a higher incidence of prostate cancer in Brazil. Despite the incompleteness of the optional data in the INCA database, the analysis carried out at the national level and the possibility of using it to guide campaigns in the context of men's health stands.

References

Aguiar, J. S., Pereira, L. D. A. & Thomas, C. A. B. (2017). Assistência Oncológica no Estado do Espírito Santo, a partir do Sistema Integrador dos Registros Hospitalares de Câncer; 2000 – 2014. Informativo Vigilância do Câncer. https://saude.es.gov.br/Media/sesa/DANTS/INFORMATIVO%20 VIGILANCIA%20DO%20CANCER%20-%20RHC%2020%2012%202017.pdf

Araújo, M. S. M., Sardinha, A. H. L., Neto, J. A. F., Silva, E. L., & Lopes, M. L. H. (2019). Caracterização social e clínica dos homens com câncer de próstata atendidos em um hospital universitário. Revista Mineira de Enfermagem, 19(2), 196-203. http://www.dx.doi.org/10.5935/1415-2762.20150035

Baldomir, R. A. (2017). Aplicação do Algoritmo Apriori para Detectar Relacionamento entre Empresas nos Processos Licitatórios do Governo Federal [Monografia, Universidade de Brasília]. https://bdm.unb.br/handle/10483/19987

Campbell, A. (2021). Data Visualization Guide: Clear Introduction to Data Mining, Analisys and Visualization. Independently Published.

Cassell, A., Yunusa, B., Jalloh, M., Mbodji, M. M., Diallo, A., Ndoye, M., Kouba, S. C., Labou, I., Niang, L. & Gueye, S. M. (2019). A Review of Localized Prostate Cancer: An African Perspective. World Journal Of Oncology. 10 (4-5). https://doi.org/10.14740/wjon1221

Cavalcanti, G. & Kruger, F. P. G. (2018). Conhecimento e Atitudes sobre o Câncer de Próstata no Brasil. Revisão Integrativa. Revista Brasileira de Cancerologia, 64 (4), 561-567. https://doi.org/10.32635/2176-9745.RBC.2018v64n4.206

Ferrão, V., Berrinelli, L. A. & Portella, M. R. (2017). Vivências de Homens com Câncer de Próstata. Revista de Enfermagem UFPE On Line, Recife; 11 (10), 4157 - 4164. https://periodicos.ufpe.br/revistas/revistaenfermagem/article/download/231178/25153

Frank, E., Hall, M. A. & Witten, I. H. (2016). The WEKA Workbench. Online Appendix for "Data Mining: Practical Machine Learning Tools and Techniques". (4. ed.). Morgan Kaufmann.

Hussain, L., Ali, A., Rathore, S., Saeed, S., Idris, A., Usman, M. U., Iftikhar, M. A. & Suh, D. O. (2019). Applying Bayesian Network Approach to Determine the Association Between Morphological Features Extracted from Prostate Cancer Images. IEEE Access, 7, 1586-1601. https://ieeexplore.ieee.org/document/8579592.

IBGE. (2019). Instituto Brasileiro De Geografia E Estatísticas. Conheça o Brasil – População Cor ou Raça. IBGE educa. https://educa.ibge.gov.br/jovens/conheca-obrasil/populacao/18319-cor-ou-raca.html.

IBGE. (2020a). Instituto Brasileiro de Geografia e Estatísticas. Pesquisa nacional de saúde: 2019: percepção do estado de saúde, estilos de vida, doenças crônicas e saúde bucal: Brasil e grandes regiões / IBGE, Coordenação de Trabalho e Rendimento. IBGE. https://biblioteca.ibge.gov.br/visualizacao/livros/liv101764.pdf

IBGE. (2020b). Instituto Brasileiro De Geografia E Estatísticas. Projeção da população do Brasil por sexo e idade para o período 2010-2060. https://www.ibge.gov.br/estatisticas/sociais/populacao/9109-projecao-dapopulacao.html?edicao=21830&t=resultados.

IBGE. (2020c). Instituto Brasileiro De Geografia E Estatísticas. Educação: 2019. IBGE. https://biblioteca.ibge.gov.br/visualizacao/livros/liv101736_informativo.pdf

INCA. (2010). Instituto Nacional de Câncer José de Alencar Gomes da Silva. Registros Hospitalares de Câncer: Planejamento e Gestão. (2. ed.). INCA.

INCA. (2020). Instituto Nacional de Câncer José de Alencar Gomes da Silva. Perfil da Assistência Oncológica no Brasil entre 2012 e 2016. Informativo Vigilância do Câncer. (7). https://www.inca.gov.br/sites/ufu.sti.inca.local/files/media/document/informativo-vigilancia-do-cancer-n7-2020.pdf

Jamsa, K. (2021). Introduction to Data Mining and Analytics with Machine Learning in Rand Python. World Headquartes Jones & Bartlett Learning.

Junior, M. M. L., Reis, L. O., Ferreira, U., Cardoso, U. O., Barbieri, R. B., Mendonça, G. B. & Ward, L. S. (2015). Unraveling Brazilian Indian Population Prostate Good Health: Clinical, Anthropometric and Genetic Features. International braz j urol, 41 (2). https://doi.org/10.1590/S1677-5538.IBJU.2015.02.23

Menezes, R., Menzes, M., Teston, E. F., Matumoto, S., Faller, J. W. (2019). Knowledge, Behaviour and Health Practices of Men Concerning the Prostate Cancer. Revista de Pesquisa Cuidado é Fundamental Online, 11(5), 1173-1179. http://dx.doi.org/10.9789/2175-5361.2019.v11i5.1173-1179.

Ministério da Saúde. (1998). “Portaria nº 3.535”. https://bvsms.saude.gov.br/bvs/saudelegis/gm/1998/prt3535_02_09_1998_revog.html#:~:text=Estabelece%20crit%C3%A9rios%20para%20cadastramento%20de%20centros%20de%20atendimento%20em%20oncologia.

Ministério da Saúde. (2005). “Portaria nº 741”. https://bvsms.saude.gov.br/bvs/saudelegis/sas/2005/prt0741_19_12_2005.html.

Mota, T. R., Barros, D. P. O. (2018). Perfil dos pacientes com câncer de próstata em hospital de referência no estado de Pernambuco. Revista brasileira de análises clínicas, 50 (4), 334-338. https:// 10.21877/2448-3877.201900766

Oliveira, C. O., Marques, P. M. A., Filho, W. C. C. (2007). Grades computacionais na otimização da recuperação de imagens médicas baseada em conteúdo. Radiologia brasileira, 40 (4), 255-261. https://doi.org/10.1590/S0100-39842007000400011

Panis, C., Kawasaki, A. C. B., Pascotto, C. R., Justina, E. Y. D., Vicentini, G. E., Lucio, L. C. & Prates, R. T. C. (2018). Revisão crítica da mortalidade por câncer usando registros hospitalares e anos potenciais de vida perdidos.16 (1). https://doi.org/10.1590/S1679-45082018AO4018

Preissler, A. (2016). Data Mining para Definição dos Perfis de Pacientes com Câncer de Estômago. [Monografia, Universidade Regional do Noroeste do Estado do Rio Grande do Sul]. https://bibliodigital.unijui.edu.br:8443/xmlui/bitstream/handle/123456789/4216/Amanda%20Preissler.pdf?sequence=1&isAllowed=y

Prodanov, C. C., Freitas, E. C. (2013). Metodologia do trabalho científico: métodos e técnicas da pesquisa e do trabalho acadêmico. (2. ed.). Feevale.

Rego, R. F. N. B., Barros, R. A., Pimenta, L. O. S., Rodrigues, J. V. C., ANJOS, E. B. (2020). Perfil Clínico Epidemiológico da População Atendida Num

Programa de Rastreamento de Câncer de Próstata. Revista de Atenção à Saúde, 18 (65), 38-47. https//doi.org/10.13037/ras.vol18n65.6647

Sacramento, R. S., Simião, L. J., Viana, K. C. G., Andrade, M. A. C., Amorin, M. H. C. & Zandonade, E. (2019). Associação de variáveis sociodemográficas e clínicas com os tempos para início do tratamento do câncer de próstata. Ciência & Saúde Coletiva, 24 (9), 3265-3274. https://doi.org/10.1590/1413-81232018249.31142017

Santos, M. O. (2018). Estimativa 2018: Incidência de Câncer no Brasil. Revista Brasileira De Cancerologia, 64(1), 119–120. https://doi.org/10.32635/2176-9745.RBC.2018v64n1.115

Sharma, S. & Bansal, M. (2020). Real-Time Sentiment Analysis Towards Machine Learning. International Journal of Scientific & Technology Research, 9 (2). https://10.13140/RG.2.2.27062.24643

Silva, L. A., Peres, S. M. & Boscarioli, C. Introdução à Mineração de Dados: com aplicações em R. Elsevier.

Silva, J. S. & Nascimento, L. P. (2017). Fatores Culturais Associados a não Adesão aos Exames Preventivos de Câncer de Próstata em Parintins [Trabalho de Conclusão, Universidade do Estado do Amazonas]. http://repositorioinstitucional.uea.edu.br//handle/riuea/759

Stone, C. R., Courneya, K. S., Mcgregor, S. E., Li, H. & Friedenreich, C. M. (2019). Determinants of changes in physical activity from prediagnosis to post-diagnosis in a cohort of prostate câncer survivors. Support Care Cancer, 27, 2819-2828. https://doi.org/10.1007/s00520-018-4578-2

Wazlawick, R. S. (2009). Metodologia de pesquisa para ciência da computação. Elsevier.

Published

29/04/2022

How to Cite

SILVA, G. D. da .; ARAÚJO, W. C. de . Use of the Apriori algorithm to trace the sociodemographic profile of brazilian men with prostate cancer. Research, Society and Development, [S. l.], v. 11, n. 6, p. e33811629168, 2022. DOI: 10.33448/rsd-v11i6.29168. Disponível em: https://rsdjournal.org/index.php/rsd/article/view/29168. Acesso em: 22 may. 2022.

Issue

Section

Exact and Earth Sciences