Aplicação de reconhecimento de texto manuscrito para a digitalização de redações do ensino médio em português

Imagem de Miniatura

Data

2025-08-07

Orientação Docente

Lattes da Orientação Docente

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

A digitalização de redações manuscritas é uma etapa crucial para sistemas de correção automática, mas representa um desafio significativo devido à variabilidade caligráfica e às particularidades linguísticas. Este artigo aborda essa lacuna ao realizar uma análise comparativa do desempenho de seis modelos de Reconhecimento de Texto Manuscrito de aprendizado profundo (HTR-Flor, StackMix, OrigamiNet, TrOCR, HTR-VT, DTrOCR) e dois serviços comerciais (AWS Textract, GCP Vision). Os modelos foram avaliados em um novo conjunto de dados composto por 22.927 linhas de texto extraídas de 1.071 redações manuscritas de alunos do ensino médio em português. Os resultados, medidos por Taxa de Erro de Caractere (CER) e Palavra (WER), indicam que os modelos HTR-VT (CER 9,20%) e Stackmix (CER 11,72%) demonstraram maior robustez e eficácia neste domínio específico. Notavelmente, modelos baseados em Transformer como TrOCR e DTrOCR, que são estado da arte em benchmarks padronizados, apresentaram desempenho significativamente inferior (CER > 48%), evidenciando uma fraca generalização para a caligrafia variada encontrada nas redações. O estudo conclui que a especialização do modelo ao domínio e a robustez a diferentes estilos de caligrafia são mais cruciais para o desempenho prático do que a performance em datasets genéricos, fornecendo um panorama sobre o estado da arte e os desafios do HTR para o cenário educacional brasileiro.

Resumo em outro idioma

The digitization of handwritten essays is a crucial step for automated grading systems, yet it poses a significant challenge due to calligraphic variability and linguistic particularities. This paper addresses this gap by conducting a comparative performance analysis of six deep learning-based Handwritten Text Recognition (HTR) models (HTR-Flor, StackMix, OrigamiNet, TrOCR, HTR-VT, DTrOCR) and two commercial services (AWS Textract, GCP Vision). The models were evaluated on a new dataset comprising 22,927 text lines extracted from 1,071 handwritten essays by Brazilian high school students in Portuguese. The results, measured by Character Error Rate (CER) and Word Error Rate (WER), indicate that the HTR-VT (9.20% CER) and Stackmix (11.72% CER) models demonstrated greater robustness and effectiveness in this specific domain. Notably, Transformer-based models like TrOCR and DTrOCR, which are state-of-the-art on standard benchmarks, showed significantly inferior performance (CER > 48%), highlighting poor generalization to the varied handwriting found in the essays. The study concludes that model specialization to the domain and robustness to diverse handwriting styles are more critical for practical performance than performance on generic datasets, providing an overview of the state-of-the-art and challenges of HTR for the Brazilian educational scenario.

Descrição

Referência

DIAS, Lucas Valentim. Aplicação de reconhecimento de texto manuscrito para a digitalização de redações do ensino médio em português. 2025. 17 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2025.

Identificador dARK

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como openAccess