Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/32689
Título: Um estudo comparativo de modelos de segmentação de objetos
Título(s) alternativo(s): A comparative study of object segmentation models
Autor(es): Brito, Gabriel Eugenio
Orientador(es): Minetto, Rodrigo
Palavras-chave: Imagens digitais
Aprendizado do computador
Segmentação de imagens
Visão por computador
Digital images
Machine learning
Image segmentation
Computer vision
Data do documento: 27-Jun-2023
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: BRITO, Gabriel Eugenio. Um estudo comparativo de modelos de segmentação de objetos. 2023. Trabalho de Conclusão de Curso de (Bacharelado em Sistemas de Informação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023.
Resumo: Segmentação de objetos é a tarefa de identificar, com precisão de pixel, todos os objetos de uma imagem. Ela tem diversas aplicações no mundo real, como sistemas de visão para carros autônomos e sistemas de monitoramento. O objetivo deste trabalho é comparar três abordagens diferentes para solucionar esse problema – Mask R-CNN, Yolact e SOLO –, todas relativamente recentes e baseadas em deep learning, e apresentar alguns pontos que possam ser explorados em pesquisas futuras. Ao executar os modelos em 200 imagens do dataset OpenImages, mostramos que o SOLO alcança os melhores resultados em relação à qualidade, com 42.4 de precisão média (AP), aproximadamente 4 pontos acima do segundo colocado, e o Yolact, em relação à velocidade, com aproximadamente metade do tempo de inferência do segundo colocado. Também foi possível constatar algumas limitações na área, como a falta de dados anotados no dataset e casos que são ignorados durante a avaliação (mais especificamente, objetos de classes que não possuem anotações em uma determinada imagem são ignorados durante o cálculo do AP). Todo o código está disponível em https://github.com/GabrielEug2/tcc-instance-segm. Esperamos que estes pontos possam ser explorados mais a fundo em pesquisas futuras, para avançar a pesquisa na área ainda mais.
Abstract: Object segmentation is the task of identifying, with pixel precision, all the objects on an image. It has several applications in the real world, such as vision systems for autonomous cars and monitoring systems. The goal of this paper is to compare three different approaches of solving that problem – Mask R-CNN, Yolact and SOLO –, all relatively recent and based on deep learning, and present some points that can be explored in future researches. By executing the models on 200 images of the OpenImages dataset, we showed that SOLO achieves the best results in terms of quality, with 42.4 of average precision (AP), about 4 points ahead of the runner-up, and Yolact, in terms of speed, with approximately half the inference time of the second place. It was also possible to observe some limitations in the area, such as the lack of annotated data on the dataset and cases that are ignored during the evaluation (more specifically, objects of classes that do not have annotations on a given image are ignored durante the AP calculations). All the code is available at https://github.com/GabrielEug2/tcc-instance-segm. Hopefully those points can be further explored in future researches, to advance the research on the area even more.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/32689
Aparece nas coleções:CT - Sistemas de Informação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
comparativamodelossegmentacaoobjetos.pdf10,09 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons