Classificação automática de produtos comercializados por órgãos públicos do Rio Grande do Norte através de comitê de classificadores

Autores

DOI:

https://doi.org/10.33448/rsd-v11i9.31836

Palavras-chave:

Mineração de texto; Notas Fiscais Eletrônicas; Processamento de dados; Aprendizado de máquina.

Resumo

O uso de técnicas de mineração de texto tem aumentado consideravelmente nos últimos anos devido à grande quantidade de informações em texto sendo produzidas e armazenadas por sistemas eletrônicos e a necessidade de tornar esses dados informações para as organizações. Dentro desse contexto, o Tribunal de Contas do Estado do Rio Grande do Norte (TCE-RN) recebe diariamente uma grande quantidade de Notas Fiscais Eletrônicas (NF-e) contendo informações de compras de produtos que precisam ser analisadas para uso interno e externo ao órgão. Ainda, esses documentos possibilitam preenchimento livre, ou muitas vezes errôneo, de alguns dados por parte dos vendedores que emitem as Notas Fiscais. Dessa forma, as NF-e geradas não seguem um padrão, dificultando a realização de análises de forma prática e rápida por meio de ferramentas comuns para obtenção e filtragem de dados. Sendo assim, surge a necessidade de um processamento automatizado de forma a padronizar os dados, disponibilizá-los de forma rápida e possibilitar sua utilização como informações para fins de auditorias. Portanto, este trabalho apresenta uma solução baseada em mineração de texto e técnicas de aprendizado de máquina para o problema de identificação de produtos comercializados no estado do Rio Grande do Norte a partir do campo descrição das NF-e com o propósito de possibilitar a classificação de produtos únicos.

Biografia do Autor

Elvis Rafael Ferreira Dias, Universidade Federal do Rio Grande do Norte

Departamento Instituto Metrópole Digital

Brasil

João Carlos Xavier Júnior, Universidade Federal do Rio Grande do Norte

Departamento Instituto Metrópole Digital

Brasil

Referências

Brasil (2013a). Acódão 1785/2013, de 10 de julho de 2013. Tribunal de Contas da União, Brasília, DF. Recuperado de https://pesquisa.apps.tcu.gov.br/#/documento/acordao-completo/*/KEY%253AACORDAO-COMPLETO-1279889/DTRELEVANCIA%2520desc/0/sinonimos%253Dfalse

Brasil (2013b). Decreto 7.892, de 23 de janeiro de 2013. Regulamenta o Sistema de Registro de Preços previsto no art. 15 da Lei nº 8.666, de 21 de junho de 1993. Diário oficial da República Federativa do Brasil. Poder Executivo, Brasília, DF.

Buitinck, L., Louppe, G., Blondel, M., Pedregosa, F., Mueller, A., Grisel ... & Varoquaux, G. (2013). API design for machine learning software: experiences from the scikit-learn project. In ECML PKDD Workshop: Languages for Data Mining and Machine Learning, p. 108–122.

Chen, T., Guestrin, C. (2016). XGBoost: A Scalable Tree Boosting System. KDD, São Francisco, CA. Recuperado de https://arxiv.org/pdf/1603.02754.pdf

Koche, J. C. (2011). Fundamentos de metodologia científica. Petrópolis: Vozes. Recuperado de: http://www.adm.ufrpe.br/sites/ww4.deinfo.ufrpe.br/files/Fundamentos_de_Metodologia_Cienti%CC%81fica.pdf

Ministério da Fazenda (2020a). Conceito, uso e obrigatoriedade da nf-e (26 questões). Recuperado de https://www.nfe.fazenda.gov.br/portal/perguntasFrequentes.aspx?tipoConteudo=E4+tmY+ODf4=

Ministério da Fazenda (2020b). Manual de orientação do contribuinte - versão 6.00. Recuperado de https://www.nfe.fazenda.gov.br/portal/listaConteudo. aspx?tipoConteudo=33ol5hhSYZk=

Ministério da Fazenda (2020c). Ncm. Recuperado de https://receita.economia.gov.br/orientacao/aduaneira/classificacao-fiscal-de-mercadorias/ncm

Ministério da Fazenda (2020d). Protocolo icms 42, de 3 de julho de 2009. Recuperado de https://www.confaz.fazenda.gov.br/legislacao/protocolos/2009/pt042_09

Tribunal de Contas do Estado da Paraíba (2020a). Painéis preços. Recuperado de https://sagres.tce.pb.gov.br/paineis-precos/

Tribunal de Contas do Estado da Paraíba (2020b). Preço da hora. Recuperado de https://precodahora.pb.gov.br/

Tribunal de Contas do Estado de Minas Gerais (2020). Banco de preços tcemg. Recuperado de https://bancodepreco.tce.mg.gov.br/

Secretaria de Tributação do Rio Grande do Norte (2020). Nota fiscal eletrônica. Recuperado de http://www.set.rn.gov.br/contentProducao/Aplicacao/SET_ v2/nfe/gerados/inicio.asp

dos Santos, D. S. (2018). Uma plataforma distribuída de mineração de dados para big data: um estudo de caso aplicado à secretaria de tributação do Rio Grande do Norte. Dissertação (Mestrado em Engenharia de Software). Universidade Federal do Rio Grande do Norte, Natal, Brasil.

Faceli, K., Lorena, A. C., Gama, J. & de Carvalho, A. C. P. L. F. (2011). Inteligência Artificial: Uma Abordagem de Aprendizado de Máquina. Barueri, SP: LTC

Gandini, A. (2020). Banco de preços. Recuperado de https://github.com/alexgand/banco-de-precos

Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. Cambridge, MA: MIT Press. Recuperado de http://www.deeplearningbook.org

GS1 (2019). Código EAN 13: entenda o que é, para que serve e como usar. Recuperado de https://blog.gs1br.org/codigo-ean-13-entenda-o-que-e-para-que-serve-e-como-usar/

GS1 (2020). Gtin - número global do item comercial. Recuperado de https://www.gs1br.org/codigos-e-padroes/padroes-de-identificacao/gtin

Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12: p. 2825–2830.

Reimers, N., Schiller, B., Beck, T., Daxenberger, J., Stab, C., Gurevych, I. (2019) Classification and Clustering of Arguments with Contextualized Word Embeddings. Recuperado de: https://arxiv.org/pdf/1906.09821.pdf

Silva, D. S. (2014). Manual de Orientação: pesquisa de preços. Brasília, DF: Seção de Reprografia e Encadernação - Coordenadoria de Serviços Gerais. Recuperado de https://www.stj.jus.br/static_files/STJ/Licita%C3%A7%C3%B5es%20e%20contas%20p%C3%BAblicas/Manual%20de%20pesquisa%20de%20pre%C3%A7o/manual_de_orientacao_de_pesquisa_de_precos.pdf

Downloads

Publicado

10/07/2022

Como Citar

DIAS, E. R. F.; XAVIER JÚNIOR, J. C. Classificação automática de produtos comercializados por órgãos públicos do Rio Grande do Norte através de comitê de classificadores. Research, Society and Development, [S. l.], v. 11, n. 9, p. e29211931836, 2022. DOI: 10.33448/rsd-v11i9.31836. Disponível em: https://rsdjournal.org/index.php/rsd/article/view/31836. Acesso em: 3 jan. 2025.

Edição

Seção

Engenharias