Reconhecimento de padrões na detecção do discurso de ódio: uma abordagem de redes neurais e ensembles
DOI:
https://doi.org/10.33448/rsd-v14i5.48633Palavras-chave:
Discurso de Ódio, Aprendizado de Máquina, Processamento de Linguagem Natural.Resumo
O discurso de ódio em plataformas online é um problema crescente, com impactos sociais significativos. Este trabalho propõe uma abordagem para a classificação binária de discurso de ódio em textos em português, utilizando algoritmos de aprendizado de máquina e aprendizado profundo. Os experimentos foram conduzidos em um conjunto de dados anotado, com representações textuais geradas por word embeddings pré-treinados do GloVe. O modelo baseado em votação, que combina os resultados dos classificadores base, apresentou o melhor desempenho geral, alcançando um F1-score de 0.76. Os resultados demonstram a eficácia das redes neurais, especialmente na captura de padrões textuais complexos, e destacam o potencial de abordagens combinadas para a tarefa de classificação de discurso de ódio. Este estudo reforça a importância de explorar arquiteturas diversificadas e técnicas de pré-processamento alinhadas às peculiaridades do idioma português.
Referências
Asogwa, D. C., Chukwuneke, C. I., Ngene, C. C., & Anigbogu, G. N. (2022). Hate speech classification using SVM and Naive Bayes. IOSR Journal of Mobile Computing & Application (IOSR-JMCA), 9(1), 27–34. https://doi.org/10.9790/0050-09012734
Cortes, C. (1995). Support-vector networks. Machine Learning.
Badjatiya, P., Gupta, S., Gupta, M., & Varma, V. (2017). Deep learning for hate speech detection in tweets. In Proceedings of the 26th International Conference on World Wide Web Companion (pp. 759–760).
d’Sa, A. G., Illina, I., & Fohr, D. (2020). Classification of hate speech using deep neural networks. Revue d’Information Scientifique & Technique, 25(1). HAL Id: hal-03101938. https://hal.science/hal-03101938v1
Ferreira, M. C. dos S., & Teixeira, T. (2024). Social media and political polarization as threats to democracy. Research, Society and Development, 13(7), e7713746214–e7713746214.
Fortuna, P., da Silva, J. R., Wanner, L., Nunes, S., et al. (2019). A hierarchically-labeled Portuguese hate speech dataset. In Proceedings of the Third Workshop on Abusive Language Online (pp. 94–104).
Fortuna, P., & Nunes, S. (2018). A survey on automatic detection of hate speech in text. ACM Computing Surveys (CSUR), 51(4), 1–30.
Gambäck, B., & Sikdar, U. K. (2017). Using convolutional neural networks to classify hate-speech. In Proceedings of the First Workshop on Abusive Language Online (pp. 85–90). Vancouver, Canada: Association for Computational Linguistics. https://aclanthology.org/W17-3013
Hartmann, N., Fonseca, E., Shulby, C., Treviso, M., Rodrigues, J., & Aluísio, S. (2017). Portuguese word embeddings: Evaluating on word analogies and natural language tasks. arXiv preprint, arXiv:1708.06025.
Hochreiter, S. (1997). Long short-term memory. Neural Computation MIT-Press.
Pereira, A. S., Shitsuka, D. M., Parreira, F. J., & Shitsuka, R. (2018). Metodologia da pesquisa científica. Brasil.
Rakhlin, A. (2016). Convolutional neural networks for sentence classification. GitHub, 6, 25.
Silva, S. C., & Serapião, A. B. S. (2018). Detecção de discurso de ódio em português usando CNN combinada a vetores de palavras. In Anais do VI Symposium on Knowledge Discovery, Mining and Learning (pp. 1–8). SBC.
Waseem, Z., & Hovy, D. (2016). Hateful symbols or hateful people? Predictive features for hate speech detection on Twitter. In Proceedings of the NAACL Student Research Workshop (pp. 88–93).
Downloads
Publicado
Edição
Seção
Licença
Copyright (c) 2025 Filipe Cordeiro de Medeiros Azevedo

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Autores que publicam nesta revista concordam com os seguintes termos:
1) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
2) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
3) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.
