Clasificación automática de productos comercializados por órganos públicos de Rio Grande do Norte mediante un comité de clasificadores
DOI:
https://doi.org/10.33448/rsd-v11i9.31836Palabras clave:
Minería de textos; Facturas Electrónicas; Procesamiento de datos; Aprendizaje automático.Resumen
El uso de técnicas de minería de textos se ha incrementado considerablemente en los últimos años debido a la gran cantidad de información textual que se produce y almacena por los sistemas electrónicos y la necesidad de convertir estos datos en información para las organizaciones. En este contexto, el Tribunal de Cuentas del Estado de Rio Grande do Norte (Tribunal de Contas do Rio Grande do Norte, TCE-RN) recibe diariamente una gran cantidad de Facturas Electrónicas que contienen información sobre compras de productos que necesitan ser analizados para uso interno y externo la institución. Aún así, estos documentos permiten la cumplimentación libre, o muchas veces errónea, de algunos datos por parte de los vendedores que emiten las facturas. De esta forma, los documentos generados no siguen un patrón, lo que dificulta la realización de análisis de forma práctica y rápida mediante herramientas habituales de obtención y filtrado de datos. Por lo tanto, existe la necesidad de un procesamiento automatizado para estandarizar los datos, hacerlos disponibles rápidamente y permitir su uso como información para fines de auditoría. Así, este trabajo presenta una solución basada en técnicas de minería de texto y aprendizaje automático para el problema de identificación de productos vendidos en el estado de Rio Grande do Norte usando el campo de descripción para permitir la clasificación en productos únicos.
Citas
Brasil (2013a). Acódão 1785/2013, de 10 de julho de 2013. Tribunal de Contas da União, Brasília, DF. Recuperado de https://pesquisa.apps.tcu.gov.br/#/documento/acordao-completo/*/KEY%253AACORDAO-COMPLETO-1279889/DTRELEVANCIA%2520desc/0/sinonimos%253Dfalse
Brasil (2013b). Decreto 7.892, de 23 de janeiro de 2013. Regulamenta o Sistema de Registro de Preços previsto no art. 15 da Lei nº 8.666, de 21 de junho de 1993. Diário oficial da República Federativa do Brasil. Poder Executivo, Brasília, DF.
Buitinck, L., Louppe, G., Blondel, M., Pedregosa, F., Mueller, A., Grisel ... & Varoquaux, G. (2013). API design for machine learning software: experiences from the scikit-learn project. In ECML PKDD Workshop: Languages for Data Mining and Machine Learning, p. 108–122.
Chen, T., Guestrin, C. (2016). XGBoost: A Scalable Tree Boosting System. KDD, São Francisco, CA. Recuperado de https://arxiv.org/pdf/1603.02754.pdf
Koche, J. C. (2011). Fundamentos de metodologia científica. Petrópolis: Vozes. Recuperado de: http://www.adm.ufrpe.br/sites/ww4.deinfo.ufrpe.br/files/Fundamentos_de_Metodologia_Cienti%CC%81fica.pdf
Ministério da Fazenda (2020a). Conceito, uso e obrigatoriedade da nf-e (26 questões). Recuperado de https://www.nfe.fazenda.gov.br/portal/perguntasFrequentes.aspx?tipoConteudo=E4+tmY+ODf4=
Ministério da Fazenda (2020b). Manual de orientação do contribuinte - versão 6.00. Recuperado de https://www.nfe.fazenda.gov.br/portal/listaConteudo. aspx?tipoConteudo=33ol5hhSYZk=
Ministério da Fazenda (2020c). Ncm. Recuperado de https://receita.economia.gov.br/orientacao/aduaneira/classificacao-fiscal-de-mercadorias/ncm
Ministério da Fazenda (2020d). Protocolo icms 42, de 3 de julho de 2009. Recuperado de https://www.confaz.fazenda.gov.br/legislacao/protocolos/2009/pt042_09
Tribunal de Contas do Estado da Paraíba (2020a). Painéis preços. Recuperado de https://sagres.tce.pb.gov.br/paineis-precos/
Tribunal de Contas do Estado da Paraíba (2020b). Preço da hora. Recuperado de https://precodahora.pb.gov.br/
Tribunal de Contas do Estado de Minas Gerais (2020). Banco de preços tcemg. Recuperado de https://bancodepreco.tce.mg.gov.br/
Secretaria de Tributação do Rio Grande do Norte (2020). Nota fiscal eletrônica. Recuperado de http://www.set.rn.gov.br/contentProducao/Aplicacao/SET_ v2/nfe/gerados/inicio.asp
dos Santos, D. S. (2018). Uma plataforma distribuída de mineração de dados para big data: um estudo de caso aplicado à secretaria de tributação do Rio Grande do Norte. Dissertação (Mestrado em Engenharia de Software). Universidade Federal do Rio Grande do Norte, Natal, Brasil.
Faceli, K., Lorena, A. C., Gama, J. & de Carvalho, A. C. P. L. F. (2011). Inteligência Artificial: Uma Abordagem de Aprendizado de Máquina. Barueri, SP: LTC
Gandini, A. (2020). Banco de preços. Recuperado de https://github.com/alexgand/banco-de-precos
Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. Cambridge, MA: MIT Press. Recuperado de http://www.deeplearningbook.org
GS1 (2019). Código EAN 13: entenda o que é, para que serve e como usar. Recuperado de https://blog.gs1br.org/codigo-ean-13-entenda-o-que-e-para-que-serve-e-como-usar/
GS1 (2020). Gtin - número global do item comercial. Recuperado de https://www.gs1br.org/codigos-e-padroes/padroes-de-identificacao/gtin
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12: p. 2825–2830.
Reimers, N., Schiller, B., Beck, T., Daxenberger, J., Stab, C., Gurevych, I. (2019) Classification and Clustering of Arguments with Contextualized Word Embeddings. Recuperado de: https://arxiv.org/pdf/1906.09821.pdf
Silva, D. S. (2014). Manual de Orientação: pesquisa de preços. Brasília, DF: Seção de Reprografia e Encadernação - Coordenadoria de Serviços Gerais. Recuperado de https://www.stj.jus.br/static_files/STJ/Licita%C3%A7%C3%B5es%20e%20contas%20p%C3%BAblicas/Manual%20de%20pesquisa%20de%20pre%C3%A7o/manual_de_orientacao_de_pesquisa_de_precos.pdf
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2022 Elvis Rafael Ferreira Dias; João Carlos Xavier Júnior
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Los autores que publican en esta revista concuerdan con los siguientes términos:
1) Los autores mantienen los derechos de autor y conceden a la revista el derecho de primera publicación, con el trabajo simultáneamente licenciado bajo la Licencia Creative Commons Attribution que permite el compartir el trabajo con reconocimiento de la autoría y publicación inicial en esta revista.
2) Los autores tienen autorización para asumir contratos adicionales por separado, para distribución no exclusiva de la versión del trabajo publicada en esta revista (por ejemplo, publicar en repositorio institucional o como capítulo de libro), con reconocimiento de autoría y publicación inicial en esta revista.
3) Los autores tienen permiso y son estimulados a publicar y distribuir su trabajo en línea (por ejemplo, en repositorios institucionales o en su página personal) a cualquier punto antes o durante el proceso editorial, ya que esto puede generar cambios productivos, así como aumentar el impacto y la cita del trabajo publicado.