Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/5230
Título: Recuperação da trajetória online de caracteres latinos utilizando deep learning
Título(s) alternativo(s): Online latin characters trajectory recovery using deep learning
Autor(es): Lin, Yu Han
Orientador(es): Morais, Erikson Freitas de
Palavras-chave: Manuscritos
Escrita - Identificação
Conjunto de caracteres (Processamento de dados)
Redes neurais (Computação)
Manuscripts
Writing - Identification
Character sets (Data processing)
Neural networks (Computer science)
Data do documento: 25-Ago-2020
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Ponta Grossa
Citação: LIN, Yu Han. Recuperação da trajetória online de caracteres latinos utilizando deep learning. 2020. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2020.
Resumo: Estudos sobre a recuperação de trajetória de manuscritos ganharam espaço na área da pesquisa de reconhecimento de textos manuscritos offline. O motivo está no uso de recursos de reconhecimento online, criando técnicas para simular a escrita da palavra manuscrita e inserindo as coordenadas simuladas dos pixels em sistemas que reconhecem palavras de modo online. O princípio dessas técnicas é encontrar um traçado ordenado de modo similar àquele feito por uma pessoa durante a escrita; esse processo é conhecido como recuperação da trajetória de manuscritos (handwriting trajectory recovery - HTR). Vários trabalhos apresentaram o uso de grafos para realizar a HTR, esqueletizando os caracteres e traçando o caminho correto do grafo, sendo este grafo o esqueleto do caractere. Entretanto, estudos recentes caracterizam o uso das redes neurais artificiais de aprendizagem profunda (deep learning) para realizar a HTR. A vantagem de se utilizar as redes de deep learning é usufruir da sua capacidade de generalização para atingir taxas de acertos melhores na recuperação dessas trajetórias. Apesar destes trabalhos apresentarem resultados promissores, seus resultados são dificilmente comparados entre si, uma vez que utilizam métricas de avaliação diferentes uma das outras. Baseado nesses fatores, o presente trabalho tem como objetivo apresentar uma proposta para realizar a HTR de caracteres latinos do dataset IRONOFF através do uso de redes deep learning, além de apresentar um novo modelo de avaliação chamada de SWO (Segmentation-sliding Window-Ordering), para avaliar a sequência de coordenadas preditas pelas redes de deep learning. Comparada com as métricas existentes na literatura, a avaliação SWO mostrou-se ser mais eficaz tanto quantitativamente, quanto qualitativamente, sendo capaz de verificar se a sequência dos traços e o formato geométrico do caractere foram recuperados. Este trabalho também identifica que a variação na quantidade de pontos de coordenadas por caractere (𝑝/𝑐) afeta no desempenho das redes de deep learning para o problema da HTR, evidenciando uma abordagem para melhorar as taxas de avaliação. Os experimentos são conduzidos a partir da transformação da informação online em offline. Esses dados passam pelo processo de normalização e data augmentation. Cinco configurações de redes são implementadas e passam pelo processo de treinamento, validação e testes. Alcança-se como melhores resultados as taxa de 95, 31% de acurácia na predição de trajetória de caracteres single-stroke e 92, 93% de acurácia na predição de trajetória de caracteres multi-strokes, apresentando dessa maneira bons resultados para o problema de HTR.
Abstract: Studies on the recovery of trajectories manuscript have gained space in the field of offline handwriting recognition research. The reason is in the use of online recognition resources, creating techniques to simulate the writing of the handwritten word and inserting the simulated coordinates of the pixels in systems that recognize words online. The principle of these techniques is to find an orderly pattern similar to that made by a person during writing; this process is known as handwriting trajectory recovery (HTR). Several works have presented the use of graphs to perform the HTR, skeletonizing the characters and tracing the correct path of the graph, which this graph representing the skeleton of the character. However, recent studies characterize the use of deep learning artificial neural networks to realize the HTR. The great advantage of using deep learning networks is to take their generalization capacity to achieve better accuracy rates in the recovery of handwriting trajectories. Although these works present promising results, their results are difficult to compare with each other, since they use different evaluation metrics. Based on these factors, this work aims to present a proposal to perform the HTR of Latin characters of the IRONOFF dataset through the use of deep learning networks, in addition, present a new evaluation model called SWO (Segmentation-sliding Window-Ordering) to evaluate the sequence of coordinates predicted by the deep learning networks. Compared with the existing metrics in the literature, the SWO evaluation proved to be more effective in both quantitatively and qualitatively aspect, being able to verify whether the sequence of the strokes and the geometric shape of the character were recovered. This work also identifies that the variation in the number of coordinate points per character (𝑝/𝑐) affects the performance of deep learning networks for the problem of HTR, evidencing an approach to improve the evaluation rates. The experiments are conducted from the transformation of information online into offline. This data goes through the normalization and data augmentation process. Five network configurations are implemented and undergo the training, validation and testing process. The best results are achieved with a 95.31% accuracy rate in predicting the trajectory of single-stroke character and 92.93% accuracy in predicting the trajectory of multi-strokes character, thus presenting good results for the HTR problem.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/5230
Aparece nas coleções:PG - Programa de Pós-Graduação em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
recuperacaotrajetoriacaracteresdeeplearning.pdf17,62 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.