Aprendizagem de máquina para classificação de tipos textuais: estudo de caso em textos escritos em português brasileiro

Barbosa, Gabriel Augusto

Aprendizagem de máquina para classificação de tipos textuais: estudo de caso em textos escritos em português brasileiro

Arquivos

Primário tcc_gabrielaugustobarbosa.pdf (609.19 KB)

Data

2025-07-30

Autores

Barbosa, Gabriel Augusto

Lattes da Autoria

http://lattes.cnpq.br/7161363389816372

Orientação Docente

Miranda, Péricles Barbosa Cunha de

Lattes da Orientação Docente

http://lattes.cnpq.br/8649204954287770

Resumo

A classificação de textos considerando tipos textuais é de suma importância para algumas aplicações de Processamento de Linguagem Natural (PLN). Nos últimos anos, algoritmos de aprendizado de máquina têm obtido bons resultados nesta tarefa considerando textos em inglês. No entanto, pesquisas voltadas para a detecção de tipos textuais escritos em português ainda são escassas, e ainda há muito a ser estudado e descoberto nesse contexto. Assim, este artigo propõe um estudo experimental que investiga o uso de algoritmos de aprendizado de máquina para classificar textos em português considerando tipos textuais. Para isso, propomos um novo corpus composto por textos em português de dois tipos textuais: narrativo e dissertativo. Três algoritmos de aprendizado de máquina tiveram seu desempenho avaliado no corpus criado em termos de precisão, revocação e pontuação F1. Além disso, também foi realizada uma análise dos atributos envolvidos no processo para identificar quais características textuais são mais importantes na tarefa atual. Os resultados mostraram que é possível alcançar altos níveis de precisão e rememoração na classificação de textos narrativos e dissertativos. Os algoritmos obtiveram níveis de métricas semelhantes, demonstrando a qualidade das características extraídas.

Resumo em outro idioma

The classification of texts regarding textual types is of paramount importance for some Natural Language Processing (NLP) applications. In recent years, machine learning algorithms have achieved good results in this task considering English texts. However, research aimed at detecting textual types written in Portuguese is still scarce, and much remains to be studied and discovered in this context. Thus, this article proposes an experimental study that investigates the use of machine learning algorithms to classify texts in Portuguese regarding textual types. For this, we propose a new corpus composed of Portuguese texts of two textual types: narrative and dissertation. Three machine learning algorithms had their performance evaluated in the proposed corpus in terms of accuracy, recall, and F1 score. Besides, an analysis of the attributes involved in the process was also carried out to identify which textual characteristics are more important in the current task. The results showed that it is possible to achieve high levels of precision and recall in classifying narrative and essay texts. The algorithms obtained similar metrics levels, demonstrating the extracted features’ quality.

Palavras-chave

Processamento de linguagem natural (Computação); Classificação textual (Computação); Gêneros textuais; Língua portuguesa; Aprendizado do computador

Referência

BARBOSA, Gabriel Augusto. Aprendizagem de máquina para classificação de tipos textuais: estudo de caso em textos escritos em português brasileiro. 2025. 24 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2025.

URI

https://arandu.ufrpe.br/handle/123456789/7793

Identificador dARK

https://n2t.net/ark:/57462/001300000mqqv

Coleções

TCC - Bacharelado em Ciência da Computação (Sede)

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como openAccess

Página do item completo

Aprendizagem de máquina para classificação de tipos textuais: estudo de caso em textos escritos em português brasileiro

Arquivos

Data

Autores

Lattes da Autoria

Orientação Docente

Lattes da Orientação Docente

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Resumo em outro idioma

Descrição

Palavras-chave

Referência

URI

Identificador dARK

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons