Aprendizaje y selección automáticos de atributos para la identificación de la enfermedad de Chagas a partir de datos clínicos y sociodemográficos

Autores/as

DOI:

https://doi.org/10.33448/rsd-v10i4.13879

Palabras clave:

Aprendizaje automático; Red neuronal; La enfermedad de Chagas.

Resumen

Objetivo: comparar el potencial del uso del aprendizaje automático y la selección automática de atributos en la discriminación de individuos chagásicos y no chagásicos en base a datos clínicos y sociodemográficos. Metodología: después de la evaluación de varios algoritmos de aprendizaje, se eligió y realizó la comparación entre el Perceptrón Neural Multicapa (MLP) y la Regresión Lineal (LR), buscando cuál presenta el mejor desempeño para predecir el diagnóstico de la enfermedad de Chagas, los criterios de sensibilidad, especificidad, precisión y área se utilizaron bajo la curva de características operativas del receptor (curva ROC). También se compararon los modelos generados mediante métodos automáticos de selección de atributos: Selección hacia adelante, Eliminación hacia atrás y Algoritmo genético. Resultados: los resultados con mayor grado de confiabilidad se obtuvieron mediante el uso del Algoritmo Genético con el MLP, el cual presentó precisión del 95,95%, sensibilidad del 78,30%, especificidad del 75,00% y Precisión (AUC) de 0,861. Conclusión: Lo que resultó ser un desempeño relevante dada la naturaleza de los datos utilizados para la clasificación y uso en salud pública, vislumbrando su relevancia en el campo médico, permitiendo una aproximación de la prevalencia que justifica acciones de búsqueda activa de individuos chagásicos para su tratamiento y prevención.

Citas

Cybenko, G. (1989). Approximation by superpositions of a sigmoidal function. Mathematics of Control, Signals, and Systems 2(4), 303–314.

Dao, S. D., Abhary, K. & Marian, K. (2017). An Innovative Framework for Designing Genetic Algorithm Structures. Expert Systems with Applications 90, 196-208.

DeLong, E. R., DeLong, D. M. & Clarke-Pearson, D. L. (1988). Comparing the areas under two or more correlated receiver operating characteristic curves: a nonparametric approach. Biometrics 44, 837–845.

Esfandiari, N., Babavalian, M. R., Moghadam, A. E., Tabar, V. K. (2014). Knowledge discovery in medicine: Current issue and future trend. Expert Systems with Applications 41, 4434-4463.

Faceli, K., Lorena, A. C., Gama, J. & Carvalho, A. C. P. L. F. (2015). Artificial intelligence: a machine learning approach. LTC, 1st edition. (Inteligência artificial: uma abordagem de aprendizado de máquina. LTC.

Forsyth, C. J., Granados, P. S., Pacheco, G. J., Betancourt, J. A., & Meymandi, S. K. Current gaps and needs to increase access to health care for people with Chagas disease in the USA, Curr Trop Med Rep. 2019; 6 (1): 13–22. (Lacunas e necessidades atuais para aumentar o acesso aos cuidados de saúde para pessoas com doença de Chagas nos EUA. Curr Trop Med Rep. 2019; 6 (1): 13–22).

Hornik, K., Stinchcombe, M. & White, H. (1989). Multilayer Feedforward Networks are Universal Approximators. Neural Networks 2(5), 359-366.

Gunter SM, Murray KO, Gorchakov R, Beddard R, Rossmann SN, Montgomery SP, et al. Probably autochthonous transmission of Trypanosoma cruzi to humans, south central Texas, USA. Emerg Infect Dis. 2017; 23 (3): 500–3. (Transmissão provavelmente autóctone de Trypanosoma cruzi para humanos, centro sul do Texas, EUA. Emerg Infect Dis. 23 (3): 500–3).

Guyon, I. & Elisseeff, A. (2003). An introduction to variable and feature selection. Journal of machine learning research 3, 1157–1182.

Ishibuchi, H. & Nojima, Y. (2013). Repeated double cross-validation for choosing a single solution in evolutionary multi-objective fuzzy classifier design. Knowledge-Based Systems 54, 22-31.

Kohavi, R. (1995). A study of cross-validation and bootstrap for accuracy estimation and model selection. In: Appears in the international joint Conference on artificial intelligence 14, 1137–1145.

Kurt, I., Ture, M. & Kurum, A. T. (2008). Comparing performances of logistic regression, classification and regression tree, and neural networks for predicting coronary artery disease. Expert Systems with Applications 34, 366-374.

Levy, D. S., Cristovão, P. W. & Gabbi, S. (2003). Dynamic swallowing study protocol by videofluoroscopy. (Protocolo do estudo dinâmico da deglutição por videofluoroscopia). In: Jacobi JS, Levy DS, Silva LMC. Dysphagia: evaluation and treatment (Disfagia: avaliação e tratamento). 134-52.

Martínez-Torres, M. R. (2013). Application of evolutionary computation techniques for the identification of innovators in open innovation communities. Expert Systems with Applications 40, 2503-2510.

Mazza. S. (2011). Consensus on Chagas-Mazza Disease. Argentine Journal of Cardiology 79 (6). (Consenso de Enfermedad de Chagas-Mazza. Revista Argentina de Cardiología 79(6).

Moncayo Á, Silveira AC. Atual epidemiological trends of Chagas disease in Latin America and future challenges: Epidemiology, surveillance and health policies. Doença de Chagas gives American trypanosomia: Elsevier; 2017. p. 59–88. (Tendências epidemiológicas atuais da doença de Chagas na América Latina e desafios futuros: Epidemiologia, vigilância e políticas de saúde. Doença de Chagas da tripanossomíase americana: Elsevier; 2017. p. 59–88).

Mitchell, T. M. (1997). Machine Learning, ed. McGraw Hill.

Neto, J. S., Carvalho, J. L. A., Rocha, A. F., Junior, L. F. J. & Nascimento, F. A. O. (2013). Support system for the diagnosis of Chagas disease based on scales and self-organizing neural networks. Brazilian Journal of Biomedical Engineering 29 (3), 242-253. (Sistema de apoio ao diagnóstico da Doença de Chagas baseado em escalogramas e redes neurais auto-organizáveis. Revista Brasileira de Engenharia Biomédica 29(3), 242-253).

Shoostari, S. J. & Gholamalifard, M. (2015). Scenario-based land cover change modeling and its implications for landscape pattern analysis in the Neka Watershed, Iran. Remote Sensing Applications: Society and Environment 1, 1-19.

Silva, R.G. (2004). Oropharyngeal dysphagia after stroke. (Disfagia orofaríngea pós-acidente vascular encefálico). In: Ferreira LP, Befi-Lopes DM, Limongi SCO. Speech therapy treaty 2, 354-356. (Tratado de fonoaudiologia 2, 354-356).

Silva, R. A., Rodrigues, V. L. C. C., Junior, W. A. P. & Pauliquevis Junior, C. (2003). Chagas Disease Control Program (PCDCh): Compliance with triatomine notifications without a fixed term in the Administrative Region of Araçatuba, State of São Paulo, Brazil. Baiana Magazine of Public Health 27 (2): 253-262. (Programa de Controle da Doença de Chagas (PCDCh): Atendimento as notificações triatomínicas sem prazo determinado na Região Administrativa de Araçatuba, Estado de São Paulo, Brasil. Revista Baiana de Saúde Pública 27(2): 253-262).

Spatti, Danilo Hernane, Ivan Nunes da Silva and Rog´erio Andrade Flauzino. Artificial Neural Networks for Engineering and Applied Sciences. Theoretical Foundations and Practical Aspects. Artliber, São Paulo, SP, 2nd. edition, 2016. (Redes Neurais Artificiais Para Engenharia e Ciências Aplicadas. Fundamentos Teóricos e Aspectos Práticos. Artliber, São Paulo, SP, 2nd. edition, 2016).

Tang, T. & Chi, L. (2005). Predicting multilateral trade credit risks: comparisons of Logit and Fuzzy Logic models using ROC curve analysis. Expert Systems with Applications 28, 547-556.

Teles, W. S., Silva, M. H. S., Santana, K. W. C., Madi, R. R., Jeraldo, V. L. S. & Melo, C. M. (2014). Infantile chagas disease in a rural area in northeastern Brazil: risk of transmission and social reflections. Interfaces Scientific Magazine – Humans and Socials 3 (1), 9–18. (Doença de chagas infantil em área rural do nordeste brasileiro: risco de transmissão e reflexões sociais. Revista Interfaces Científicas - Humanas e Sociais 3(1), 9–18).

Traore, B. B., Kamsu-Foguem, B., Tangara, F. (2016). Data mining techniques on satellite images for discovery of risk areas. Expert Systems With Applications 72, 443-456.

Upadhyaya, S., Farahmand, K. & Baker-Demaray, T. (2013). Comparison of NN and LR classifiers in the context of screening native American elders with diabetes. Expert Systems with Applications 40, 5830-5838.

World Health Organization – WHO. (2020). Chagas disease (American trypanosomiasis). http://www.who.int/chagas/epidemiology/en/.

Yang, L., Liu, S., Tsoka, S., Papageorgiou, L. G. (2016). Mathematical programming for piecewise linear regression analysis. Expert Systems with Applications 44, 156-167.

Descargas

Publicado

06/04/2021

Cómo citar

TELES, W. de S. .; MACHADO, A. P. .; CANTOS JÚNIOR, P. C. C. .; MELO, C. M. de .; SILVA, M. H. S. .; SILVA, R. N. da .; JERALDO, V. de L. S. . Aprendizaje y selección automáticos de atributos para la identificación de la enfermedad de Chagas a partir de datos clínicos y sociodemográficos. Research, Society and Development, [S. l.], v. 10, n. 4, p. e19310413879, 2021. DOI: 10.33448/rsd-v10i4.13879. Disponível em: https://rsdjournal.org/index.php/rsd/article/view/13879. Acesso em: 30 jun. 2024.

Número

Sección

Ciencias de la salud