Identificação automatizada de textos em imagens com Amazon Rekognition
DOI:
https://doi.org/10.33448/rsd-v12i3.40655Palavras-chave:
Amazon Rekognition; Deep learning; Reconhecimento de texto; Análise de dados.Resumo
O reconhecimento de texto em imagens é um desafio na área de visão computacional devido à variedade de fontes, qualidade da imagem, tamanho e cores presentes nas imagens. Nesse contexto, este trabalho tem como objetivo desenvolver uma aplicação de reconhecimento de textos em imagens utilizando a API Amazon Rekognition e avaliar sua precisão. Para isso, é proposto um algoritmo baseado em técnicas de deep learning capaz de alcançar uma precisão acima de 90% na localização e extração de texto nas imagens, utilizando métodos de extração de dados da função de detecção de texto da API Amazon Rekognition. Este artigo também tem o potencial de contribuir para o avanço de trabalhos futuros no campo da visão computacional, com ênfase na detecção de texto em imagens. Por fim, o estudo conclui que a API de detecção de texto da Amazon Rekognition é relevante na análise de dados, considerando que é treinada com grandes quantidades de dados de imagem para aprender características relevantes, alcançando uma precisão acima de 90%. No entanto, é necessário considerar que a qualidade da imagem e o tipo de fonte utilizada podem influenciar na precisão dos resultados.
Referências
Antonio, D. V. (2021). Implementação de protótipo baseado na tecnologia OCR aplicada ao reconhecimento de rótulos para busca em banco de dados. (Dissertação de mestrado, Universidade Federal do Rio de Janeiro).
Aguiar, B., & Santos, G. (2022). Comparativo de desempenho entre metodologias de modelos de inteligência artificial supervisionada. [Comparative performance between supervised artificial intelligence model methodologies]. Revista Brasileira de Tecnologia Aplicada, 10(2), 45-58.
AWS. (2020). Developer guide: Detecting text. Amazon Web Services. Retrieved from https://docs.aws.amazon.com/rekognition/latest/dg/text-detection.html.
AWS. (2020). Amazon Rekognition. Retrieved from https://aws.amazon.com/pt/rekognition/
Basso, D. P., Colnago, M., & Casaca, W. (2020). Um método não-supervisionado de detecção de oclusões textuais para imagens de sensoriamento remoto. Proceeding Series of the Brazilian Society of Computational and Applied Mathematics, 7(1).
Cozman, F. G., & Kaufman, D. (2022). Viés no aprendizado de máquina em sistemas de inteligência artificial: a diversidade de origens e os caminhos de mitigação. Revista USP, 1(135), 195-210.
Indla, R. K. (2021). An overview on Amazon Rekognition technology.
Inteligência Artificial. (2013). (3ª ed.). Rua Sete de Setembro, 111 – 16 o andar: 1350.
Kaufman, D. (2020). Inteligencia artificial: repensando a mediação. Brazilian Journal of Development, 6(9), 67621-67639.
Oliveira, W. (Data não especificada). Identificar autoridades por meio de reconhecimento facial. Uso de tecnologia de visão computacional como alternativa para antigo processo de fotogramas (Carômetro).
Opara, C. M. (2019). Cloud computing in Amazon Web Services, Microsoft Windows Azure, Google App Engine and IBM cloud platforms: A comparative study. (Doctoral dissertation). Near East University.
Pina, D. B., Cruz, S., Ferreira, R. C., Silva, M. L., & Matos, D. M. (2019). Análise de hiperparâmetros em aplicações de aprendizado profundo por meio de dados de proveniência. In Anais do XXXIV Simpósio Brasileiro de Banco de Dados (pp. 223-228). SBC.
Prodanov, C. C., & Freitas, E. C. de. (2013). Metodologia do trabalho científico: métodos e técnicas da pesquisa e do trabalho acadêmico (2ª ed.). Novo Hamburgo: Universidade FEEVALE.
Romero, R. V. (Data não especificada). Processo automático de reconhecimento de texto em imagens de documentos de identificação genéricos. Tese de Doutorado. Universidade de São Paulo.
Rosa, A. L., Martins, V. S., Pires, A. M. A., Oliveira, A. R. A., & Araujo, R. B. (2019). Classificação de imagens de frutas utilizando aprendizado de máquina. Anais do Congresso Brasileiro de Informática na Educação, 30(1), 1-10.
Silva, R. O. (2019). Análise de desempenho da Google Cloud Vision API em leitura de textos provenientes de imagens naturais.
Santos, M. (2010). Protótipo para Mineração de Opinião em Redes Sociais: Estudo de Casos Selecionados Usando o Twitter. Monografia. Departamento de Ciência da Computação, Universidade Federal de Lavras.
Wainer, J., Borenstein, J., & Cukierman, H. L. (2007). Métodos de pesquisa quantitativa e qualitativa para a Ciência da Computação. Atualização em Informática, 1(221-262), 32-33.
Wazlawick, R. S. (2010). Uma reflexão sobre a pesquisa em ciência da computação à luz da classificação das ciências e do método científico. Revista de Sistemas de Informação da FSMA, 6, 3-10.
Zhao, M., Li, S., & Kwok, J. (2010). Text detection in images using sparse representation with discriminative dictionaries. Image and Vision Computing, 28(12), 1590-1599. doi: 10.1016/j.imavis.2010.03.015.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2023 Jardel Silas da Silva Barata; Lucas Ravele de Sousa Teixeira; Bruno Campos da Silva; Thiago Nicolau Magalhães de Souza Conte; Wilker José Caminha dos Santos
Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Autores que publicam nesta revista concordam com os seguintes termos:
1) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
2) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
3) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.