Sistema de inspeção de etiquetas por visão computacional e aprendizado profundo na indústria 4.0

Camelo, Leonardo Yuto Suzuki

Use este identificador para citar ou linkar para este item: http://repositorioinstitucional.uea.edu.br//handle/riuea/4770

Título:	Sistema de inspeção de etiquetas por visão computacional e aprendizado profundo na indústria 4.0
Título(s) alternativo(s):	Label inspection system by computer vision and deep learning in Industry 4.0
Autor(es):	Camelo, Leonardo Yuto Suzuki
Orientador(es):	Figueiredo, Carlos Maurício Serodio
Palavras-chave:	Etiqueta;Deep Learning;Reconhecimento óptico de caracteres;Detecção de objetos;YOLO;PaddleOCR;Indústria 4.0;Sticker;Optical character recognition;Object detection;Industry 4.0
Data do documento:	3-Abr-2023
Editor:	Universidade do Estado do Amazonas
Resumo:	A inspeção de produto é um passo essencial nos processos de fabricação para garantir a qualidade do produto final. Tradicionalmente, essa inspeção era feita manualmente por operadores humanos, o que é demorado, caro e pode levar a erros devido à subjetividade e fadiga humana. Nos últimos anos, a maior parte dos processos visuais em uma fábrica estão sendo substituídos por técnicas de visão computacional. Com os avanços das abordagens de aprendizado profundo, o reconhecimento óptico de caracteres e reconhecimento de objetos são tecnologias que podem ser utilizadas em diferentes cenários. Neste estudo, desenvolveu-se uma metodologia capaz de extrair informações textuais e não textuais aplicados a etiquetas de modems. O método proposto é composto dos seguintes componentes: dois detectores de objetos que fazem a detecção da etiqueta e detecção simultânea de QR code e barcode, ambos utilizando YOLOv5; um decodificador de conteúdo para QR code e barcode, utilizando Zbar; um sistema de OCR utilizando PaddleOCR; e um conjunto de regras aplicadas ao pós processamento da informação. Para isso, foram criados três datasets, o primeiro contendo imagens de etiquetas em modems para treinar o modelo de detecção de etiquetas, o segundo contendo uma mistura de imagens de etiqueta e ambientes diversos que contêm QR code e barcode para gerar o modelo de detecção de QR code e barcode, e uma base de ground-truth contendo as imagens de etiquetas de modem com as respectivas saídas esperadas do sistema. O sistema proposto foi avaliado com diferentes modelos de etiqueta, e a execução dela foi feito numa CPU. A leitura das etiquetas alcançou valores médios de 0,21% de Character Error Rate, 2,16% de Field Error Rate, Acurácia por etiqueta de 76,19% e tempo de execução de 2,79 segundos para o primeiro modelo, e 0,04% de Character Error Rate, 0,62% de Field Error Rate, Acurácia por etiqueta de 92,50% e tempo de execução de 1,73 segundos. Resultados experimentais mostram que a solução desenvolvida pode ser utilizado em produção com altas taxas de acerto, e com tempo de execução significativamente melhores que um operador humano.
Abstract:	Product inspection is an essential step in manufacturing processes to ensure the quality of the final product. Traditionally, this inspection has been done manually by human operators, which is time-consuming, expensive, and can lead to errors due to human subjectivity and fatigue. In recent years, most visual processes in a factory are being replaced by computer vision techniques. With the advances in deep learning approaches, optical character recognition and object recognition are technologies that can be used in different scenarios. In this study, a methodology capable of extracting textual and non-textual information applied to modem labels is developed. The proposed method consists of the following components: two object detectors that perform label detection and simultaneous QR code and barcode detection, both using YOLOv5; a content decoder for QR code and barcode using Zbar; an OCR system using PaddleOCR; and a set of rules applied to post-processing of the information. To do this, three datasets were created: the first containing images of modem labels to train the label detection model, the second containing a mixture of label images and various environments containing QR code and barcode to generate the QR code and barcode detection model, and a ground-truth base containing modem label images with their expected system outputs. The proposed system was evaluated with different label models, and its execution was done on a CPU. The label readings achieved average values of 0.21% Character Error Rate, 2.16% Field Error Rate, Label Accuracy of 76.19%, and execution time of 2.79 seconds for the first model, and 0.04% Character Error Rate, 0.62% Field Error Rate, Label Accuracy of 92.50%, and execution time of 1.73 seconds. Experimental results show that the developed solution can be used in production with high accuracy rates and significantly better execution time than a human operator.
URI:	http://repositorioinstitucional.uea.edu.br//handle/riuea/4770
Aparece nas coleções:	EST - Trabalho de Conclusão de Curso Graduação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Sistema de inspeção de etiquetas por visão computacional e aprendizado profundo na industria 4.0.pdf		1,48 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas