Classificação automática de produtos comercializados por órgãos públicos do Rio Grande do Norte através de comitê de classificadores
DOI:
https://doi.org/10.33448/rsd-v11i9.31836Palavras-chave:
Mineração de texto; Notas Fiscais Eletrônicas; Processamento de dados; Aprendizado de máquina.Resumo
O uso de técnicas de mineração de texto tem aumentado consideravelmente nos últimos anos devido à grande quantidade de informações em texto sendo produzidas e armazenadas por sistemas eletrônicos e a necessidade de tornar esses dados informações para as organizações. Dentro desse contexto, o Tribunal de Contas do Estado do Rio Grande do Norte (TCE-RN) recebe diariamente uma grande quantidade de Notas Fiscais Eletrônicas (NF-e) contendo informações de compras de produtos que precisam ser analisadas para uso interno e externo ao órgão. Ainda, esses documentos possibilitam preenchimento livre, ou muitas vezes errôneo, de alguns dados por parte dos vendedores que emitem as Notas Fiscais. Dessa forma, as NF-e geradas não seguem um padrão, dificultando a realização de análises de forma prática e rápida por meio de ferramentas comuns para obtenção e filtragem de dados. Sendo assim, surge a necessidade de um processamento automatizado de forma a padronizar os dados, disponibilizá-los de forma rápida e possibilitar sua utilização como informações para fins de auditorias. Portanto, este trabalho apresenta uma solução baseada em mineração de texto e técnicas de aprendizado de máquina para o problema de identificação de produtos comercializados no estado do Rio Grande do Norte a partir do campo descrição das NF-e com o propósito de possibilitar a classificação de produtos únicos.
Referências
Brasil (2013a). Acódão 1785/2013, de 10 de julho de 2013. Tribunal de Contas da União, Brasília, DF. Recuperado de https://pesquisa.apps.tcu.gov.br/#/documento/acordao-completo/*/KEY%253AACORDAO-COMPLETO-1279889/DTRELEVANCIA%2520desc/0/sinonimos%253Dfalse
Brasil (2013b). Decreto 7.892, de 23 de janeiro de 2013. Regulamenta o Sistema de Registro de Preços previsto no art. 15 da Lei nº 8.666, de 21 de junho de 1993. Diário oficial da República Federativa do Brasil. Poder Executivo, Brasília, DF.
Buitinck, L., Louppe, G., Blondel, M., Pedregosa, F., Mueller, A., Grisel ... & Varoquaux, G. (2013). API design for machine learning software: experiences from the scikit-learn project. In ECML PKDD Workshop: Languages for Data Mining and Machine Learning, p. 108–122.
Chen, T., Guestrin, C. (2016). XGBoost: A Scalable Tree Boosting System. KDD, São Francisco, CA. Recuperado de https://arxiv.org/pdf/1603.02754.pdf
Koche, J. C. (2011). Fundamentos de metodologia científica. Petrópolis: Vozes. Recuperado de: http://www.adm.ufrpe.br/sites/ww4.deinfo.ufrpe.br/files/Fundamentos_de_Metodologia_Cienti%CC%81fica.pdf
Ministério da Fazenda (2020a). Conceito, uso e obrigatoriedade da nf-e (26 questões). Recuperado de https://www.nfe.fazenda.gov.br/portal/perguntasFrequentes.aspx?tipoConteudo=E4+tmY+ODf4=
Ministério da Fazenda (2020b). Manual de orientação do contribuinte - versão 6.00. Recuperado de https://www.nfe.fazenda.gov.br/portal/listaConteudo. aspx?tipoConteudo=33ol5hhSYZk=
Ministério da Fazenda (2020c). Ncm. Recuperado de https://receita.economia.gov.br/orientacao/aduaneira/classificacao-fiscal-de-mercadorias/ncm
Ministério da Fazenda (2020d). Protocolo icms 42, de 3 de julho de 2009. Recuperado de https://www.confaz.fazenda.gov.br/legislacao/protocolos/2009/pt042_09
Tribunal de Contas do Estado da Paraíba (2020a). Painéis preços. Recuperado de https://sagres.tce.pb.gov.br/paineis-precos/
Tribunal de Contas do Estado da Paraíba (2020b). Preço da hora. Recuperado de https://precodahora.pb.gov.br/
Tribunal de Contas do Estado de Minas Gerais (2020). Banco de preços tcemg. Recuperado de https://bancodepreco.tce.mg.gov.br/
Secretaria de Tributação do Rio Grande do Norte (2020). Nota fiscal eletrônica. Recuperado de http://www.set.rn.gov.br/contentProducao/Aplicacao/SET_ v2/nfe/gerados/inicio.asp
dos Santos, D. S. (2018). Uma plataforma distribuída de mineração de dados para big data: um estudo de caso aplicado à secretaria de tributação do Rio Grande do Norte. Dissertação (Mestrado em Engenharia de Software). Universidade Federal do Rio Grande do Norte, Natal, Brasil.
Faceli, K., Lorena, A. C., Gama, J. & de Carvalho, A. C. P. L. F. (2011). Inteligência Artificial: Uma Abordagem de Aprendizado de Máquina. Barueri, SP: LTC
Gandini, A. (2020). Banco de preços. Recuperado de https://github.com/alexgand/banco-de-precos
Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. Cambridge, MA: MIT Press. Recuperado de http://www.deeplearningbook.org
GS1 (2019). Código EAN 13: entenda o que é, para que serve e como usar. Recuperado de https://blog.gs1br.org/codigo-ean-13-entenda-o-que-e-para-que-serve-e-como-usar/
GS1 (2020). Gtin - número global do item comercial. Recuperado de https://www.gs1br.org/codigos-e-padroes/padroes-de-identificacao/gtin
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12: p. 2825–2830.
Reimers, N., Schiller, B., Beck, T., Daxenberger, J., Stab, C., Gurevych, I. (2019) Classification and Clustering of Arguments with Contextualized Word Embeddings. Recuperado de: https://arxiv.org/pdf/1906.09821.pdf
Silva, D. S. (2014). Manual de Orientação: pesquisa de preços. Brasília, DF: Seção de Reprografia e Encadernação - Coordenadoria de Serviços Gerais. Recuperado de https://www.stj.jus.br/static_files/STJ/Licita%C3%A7%C3%B5es%20e%20contas%20p%C3%BAblicas/Manual%20de%20pesquisa%20de%20pre%C3%A7o/manual_de_orientacao_de_pesquisa_de_precos.pdf
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2022 Elvis Rafael Ferreira Dias; João Carlos Xavier Júnior
Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Autores que publicam nesta revista concordam com os seguintes termos:
1) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
2) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
3) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.