Reconocimiento de patrones en la detección del discurso de odio: un enfoque con redes neuronales y ensambles
DOI:
https://doi.org/10.33448/rsd-v14i5.48633Palabras clave:
Discurso de Odio, Aprendizaje Automático, Procesamiento de Lenguaje Natural.Resumen
El discurso de odio en las plataformas en línea es un problema creciente, con impactos sociales significativos. Este trabajo propone un enfoque para la clasificación binaria del discurso de odio en textos en portugués, utilizando algoritmos de aprendizaje automático y aprendizaje profundo. Los experimentos se realizaron sobre un conjunto de datos anotado, con representaciones textuales generadas mediante word embeddings preentrenados de GloVe. El modelo basado en votación, que combina los resultados de los clasificadores base, obtuvo el mejor rendimiento general, alcanzando un F1-score de 0.76. Los resultados demuestran la eficacia de las redes neuronales, especialmente en la captura de patrones textuales complejos, y destacan el potencial de los enfoques combinados para la tarea de clasificación de discurso de odio. Este estudio refuerza la importancia de explorar arquitecturas diversas y técnicas de preprocesamiento adaptadas a las particularidades del idioma portugués.
Referencias
Asogwa, D. C., Chukwuneke, C. I., Ngene, C. C., & Anigbogu, G. N. (2022). Hate speech classification using SVM and Naive Bayes. IOSR Journal of Mobile Computing & Application (IOSR-JMCA), 9(1), 27–34. https://doi.org/10.9790/0050-09012734
Cortes, C. (1995). Support-vector networks. Machine Learning.
Badjatiya, P., Gupta, S., Gupta, M., & Varma, V. (2017). Deep learning for hate speech detection in tweets. In Proceedings of the 26th International Conference on World Wide Web Companion (pp. 759–760).
d’Sa, A. G., Illina, I., & Fohr, D. (2020). Classification of hate speech using deep neural networks. Revue d’Information Scientifique & Technique, 25(1). HAL Id: hal-03101938. https://hal.science/hal-03101938v1
Ferreira, M. C. dos S., & Teixeira, T. (2024). Social media and political polarization as threats to democracy. Research, Society and Development, 13(7), e7713746214–e7713746214.
Fortuna, P., da Silva, J. R., Wanner, L., Nunes, S., et al. (2019). A hierarchically-labeled Portuguese hate speech dataset. In Proceedings of the Third Workshop on Abusive Language Online (pp. 94–104).
Fortuna, P., & Nunes, S. (2018). A survey on automatic detection of hate speech in text. ACM Computing Surveys (CSUR), 51(4), 1–30.
Gambäck, B., & Sikdar, U. K. (2017). Using convolutional neural networks to classify hate-speech. In Proceedings of the First Workshop on Abusive Language Online (pp. 85–90). Vancouver, Canada: Association for Computational Linguistics. https://aclanthology.org/W17-3013
Hartmann, N., Fonseca, E., Shulby, C., Treviso, M., Rodrigues, J., & Aluísio, S. (2017). Portuguese word embeddings: Evaluating on word analogies and natural language tasks. arXiv preprint, arXiv:1708.06025.
Hochreiter, S. (1997). Long short-term memory. Neural Computation MIT-Press.
Pereira, A. S., Shitsuka, D. M., Parreira, F. J., & Shitsuka, R. (2018). Metodologia da pesquisa científica. Brasil.
Rakhlin, A. (2016). Convolutional neural networks for sentence classification. GitHub, 6, 25.
Silva, S. C., & Serapião, A. B. S. (2018). Detecção de discurso de ódio em português usando CNN combinada a vetores de palavras. In Anais do VI Symposium on Knowledge Discovery, Mining and Learning (pp. 1–8). SBC.
Waseem, Z., & Hovy, D. (2016). Hateful symbols or hateful people? Predictive features for hate speech detection on Twitter. In Proceedings of the NAACL Student Research Workshop (pp. 88–93).
Descargas
Publicado
Número
Sección
Licencia
Derechos de autor 2025 Filipe Cordeiro de Medeiros Azevedo

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Los autores que publican en esta revista concuerdan con los siguientes términos:
1) Los autores mantienen los derechos de autor y conceden a la revista el derecho de primera publicación, con el trabajo simultáneamente licenciado bajo la Licencia Creative Commons Attribution que permite el compartir el trabajo con reconocimiento de la autoría y publicación inicial en esta revista.
2) Los autores tienen autorización para asumir contratos adicionales por separado, para distribución no exclusiva de la versión del trabajo publicada en esta revista (por ejemplo, publicar en repositorio institucional o como capítulo de libro), con reconocimiento de autoría y publicación inicial en esta revista.
3) Los autores tienen permiso y son estimulados a publicar y distribuir su trabajo en línea (por ejemplo, en repositorios institucionales o en su página personal) a cualquier punto antes o durante el proceso editorial, ya que esto puede generar cambios productivos, así como aumentar el impacto y la cita del trabajo publicado.
