Identificación automatizada de texto en imágenes con Amazon Rekognition
DOI:
https://doi.org/10.33448/rsd-v12i3.40655Palabras clave:
Amazon Rekognition; Aprendizaje profundo; Reconocimiento de texto; Análisis de datos.Resumen
El reconocimiento de texto en imágenes es un desafío en el campo de la visión computacional debido a la variedad de fuentes, calidad de imagen, tamaño y colores presentes en las imágenes. En este contexto, el objetivo de este trabajo es desarrollar una aplicación para reconocer texto en imágenes utilizando la API Amazon Rekognition y evaluar su precisión. Para lograrlo, se propone un algoritmo basado en técnicas de deep learning capaz de lograr uma precisión superior al 90% en la localización y extracción de texto en las imágenes, utilizando métodos de extracción de datos de la función de detección de texto de la API Amazon Rekognition. Este artículo también tiene el potencial de contribuir al avance de futuros trabajos en el campo de la visión computacional, con un enfoque en la detección de texto en imágenes. Finalmente, el estudio concluye que la API de detección de texto de Amazon Rekognition es relevante en el análisis de datos, considerando que está entrenada con grandes cantidades de datos de imagen para aprender características relevantes, alcanzando una precisión superior al 90%. Sin embargo, es necesario tener en cuenta que la calidad de la imagen y el tipo de fuente utilizada pueden influir en la precisión de los resultados.
Citas
Antonio, D. V. (2021). Implementação de protótipo baseado na tecnologia OCR aplicada ao reconhecimento de rótulos para busca em banco de dados. (Dissertação de mestrado, Universidade Federal do Rio de Janeiro).
Aguiar, B., & Santos, G. (2022). Comparativo de desempenho entre metodologias de modelos de inteligência artificial supervisionada. [Comparative performance between supervised artificial intelligence model methodologies]. Revista Brasileira de Tecnologia Aplicada, 10(2), 45-58.
AWS. (2020). Developer guide: Detecting text. Amazon Web Services. Retrieved from https://docs.aws.amazon.com/rekognition/latest/dg/text-detection.html.
AWS. (2020). Amazon Rekognition. Retrieved from https://aws.amazon.com/pt/rekognition/
Basso, D. P., Colnago, M., & Casaca, W. (2020). Um método não-supervisionado de detecção de oclusões textuais para imagens de sensoriamento remoto. Proceeding Series of the Brazilian Society of Computational and Applied Mathematics, 7(1).
Cozman, F. G., & Kaufman, D. (2022). Viés no aprendizado de máquina em sistemas de inteligência artificial: a diversidade de origens e os caminhos de mitigação. Revista USP, 1(135), 195-210.
Indla, R. K. (2021). An overview on Amazon Rekognition technology.
Inteligência Artificial. (2013). (3ª ed.). Rua Sete de Setembro, 111 – 16 o andar: 1350.
Kaufman, D. (2020). Inteligencia artificial: repensando a mediação. Brazilian Journal of Development, 6(9), 67621-67639.
Oliveira, W. (Data não especificada). Identificar autoridades por meio de reconhecimento facial. Uso de tecnologia de visão computacional como alternativa para antigo processo de fotogramas (Carômetro).
Opara, C. M. (2019). Cloud computing in Amazon Web Services, Microsoft Windows Azure, Google App Engine and IBM cloud platforms: A comparative study. (Doctoral dissertation). Near East University.
Pina, D. B., Cruz, S., Ferreira, R. C., Silva, M. L., & Matos, D. M. (2019). Análise de hiperparâmetros em aplicações de aprendizado profundo por meio de dados de proveniência. In Anais do XXXIV Simpósio Brasileiro de Banco de Dados (pp. 223-228). SBC.
Prodanov, C. C., & Freitas, E. C. de. (2013). Metodologia do trabalho científico: métodos e técnicas da pesquisa e do trabalho acadêmico (2ª ed.). Novo Hamburgo: Universidade FEEVALE.
Romero, R. V. (Data não especificada). Processo automático de reconhecimento de texto em imagens de documentos de identificação genéricos. Tese de Doutorado. Universidade de São Paulo.
Rosa, A. L., Martins, V. S., Pires, A. M. A., Oliveira, A. R. A., & Araujo, R. B. (2019). Classificação de imagens de frutas utilizando aprendizado de máquina. Anais do Congresso Brasileiro de Informática na Educação, 30(1), 1-10.
Silva, R. O. (2019). Análise de desempenho da Google Cloud Vision API em leitura de textos provenientes de imagens naturais.
Santos, M. (2010). Protótipo para Mineração de Opinião em Redes Sociais: Estudo de Casos Selecionados Usando o Twitter. Monografia. Departamento de Ciência da Computação, Universidade Federal de Lavras.
Wainer, J., Borenstein, J., & Cukierman, H. L. (2007). Métodos de pesquisa quantitativa e qualitativa para a Ciência da Computação. Atualização em Informática, 1(221-262), 32-33.
Wazlawick, R. S. (2010). Uma reflexão sobre a pesquisa em ciência da computação à luz da classificação das ciências e do método científico. Revista de Sistemas de Informação da FSMA, 6, 3-10.
Zhao, M., Li, S., & Kwok, J. (2010). Text detection in images using sparse representation with discriminative dictionaries. Image and Vision Computing, 28(12), 1590-1599. doi: 10.1016/j.imavis.2010.03.015.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2023 Jardel Silas da Silva Barata; Lucas Ravele de Sousa Teixeira; Bruno Campos da Silva; Thiago Nicolau Magalhães de Souza Conte; Wilker José Caminha dos Santos
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Los autores que publican en esta revista concuerdan con los siguientes términos:
1) Los autores mantienen los derechos de autor y conceden a la revista el derecho de primera publicación, con el trabajo simultáneamente licenciado bajo la Licencia Creative Commons Attribution que permite el compartir el trabajo con reconocimiento de la autoría y publicación inicial en esta revista.
2) Los autores tienen autorización para asumir contratos adicionales por separado, para distribución no exclusiva de la versión del trabajo publicada en esta revista (por ejemplo, publicar en repositorio institucional o como capítulo de libro), con reconocimiento de autoría y publicación inicial en esta revista.
3) Los autores tienen permiso y son estimulados a publicar y distribuir su trabajo en línea (por ejemplo, en repositorios institucionales o en su página personal) a cualquier punto antes o durante el proceso editorial, ya que esto puede generar cambios productivos, así como aumentar el impacto y la cita del trabajo publicado.