TCC - Bacharelado em Ciência da Computação (Sede)

URI permanente para esta coleçãohttps://arandu.ufrpe.br/handle/123456789/415

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 5 de 5
  • Imagem de Miniatura
    Item
    Aprendizagem de máquina para classificação de tipos textuais: estudo de caso em textos escritos em português brasileiro
    (2025-07-30) Barbosa, Gabriel Augusto; Miranda, Péricles Barbosa Cunha de; http://lattes.cnpq.br/8649204954287770; http://lattes.cnpq.br/7161363389816372
    A classificação de textos considerando tipos textuais é de suma importância para algumas aplicações de Processamento de Linguagem Natural (PLN). Nos últimos anos, algoritmos de aprendizado de máquina têm obtido bons resultados nesta tarefa considerando textos em inglês. No entanto, pesquisas voltadas para a detecção de tipos textuais escritos em português ainda são escassas, e ainda há muito a ser estudado e descoberto nesse contexto. Assim, este artigo propõe um estudo experimental que investiga o uso de algoritmos de aprendizado de máquina para classificar textos em português considerando tipos textuais. Para isso, propomos um novo corpus composto por textos em português de dois tipos textuais: narrativo e dissertativo. Três algoritmos de aprendizado de máquina tiveram seu desempenho avaliado no corpus criado em termos de precisão, revocação e pontuação F1. Além disso, também foi realizada uma análise dos atributos envolvidos no processo para identificar quais características textuais são mais importantes na tarefa atual. Os resultados mostraram que é possível alcançar altos níveis de precisão e rememoração na classificação de textos narrativos e dissertativos. Os algoritmos obtiveram níveis de métricas semelhantes, demonstrando a qualidade das características extraídas.
  • Imagem de Miniatura
    Item
    Utilização de processamento de linguagem natural para identificação do domínio da escrita formal em redações da língua portuguesa
    (2020-12-07) Araujo, Viviane Barbosa de; Mello, Rafael Ferreira Leite de; http://lattes.cnpq.br/6190254569597745; http://lattes.cnpq.br/5293423783550464
    In Brazil, the main means of entering a public or private university is through the National High School Exam, ENEM. This exam requires that the candidate has the ability to write a good dissertation-argumentative text according to the formal norm of the Portuguese language, and can be eliminated from the exam if he does not fulfill this requirement. In order to help the candidate to identify his mistakes and help in the process of writing a good essay, this article proposes the implementation of a tool capable of identifying the spelling and grammatical errors of a text using techniques of Natural Language Processing (PLN). The analysis of the tools showed that the results obtained by the research are promising, mainly in relation to the identification of grammatical errors.
  • Imagem de Miniatura
    Item
    Evaluation of dimensionality reduction and truncation techniques forword embeddings
    (2021-03-03) Aoun, Paulo Henrique Calado; Nascimento, André Câmara Alves do; Silva, Adenilton José da; http://lattes.cnpq.br/0314035098884256; http://lattes.cnpq.br/0622594061462533; http://lattes.cnpq.br/1048218441267310
    The use of word embeddings is becoming very common in many Natural Language Processing tasks. Most of the time, these require computacional resources that can not be found in most part of the current mobile devices. In this work, we evaluate a combination of numeric truncation and dimensionality reduction strategies in order to obtain smaller vectorial representations without substancial losses in performance.
  • Imagem de Miniatura
    Item
    Coh-Metrix PT-BR: uma API web de análise textual para à educação
    (2021-03-02) Salhab, Raissa Camelo; Mello, Rafael Ferreira Leite de; http://lattes.cnpq.br/6190254569597745; http://lattes.cnpq.br/6761163457130594
    CohMetrix is a computational system that provides different measures of textual analysis, including legibility, coherence and textual cohesion. These measures allow a more indepth analysis of different types of educational texts such as essays, answers to open questions and messages in educational forums. This paper describes the features of a prototype, which encompass a website and an API, of a Brazilian Portuguese version of CohMetrix measures.
  • Imagem de Miniatura
    Item
    Inferência automática de nível de dificuldade de receitas culinárias usando técnicas de processamento de linguagem natural
    (2020-12-21) Britto, Larissa Feliciana da Silva; Pacífico, Luciano Demétrio Santos; Ludermir, Teresa Bernarda; http://lattes.cnpq.br/6321179168854922; http://lattes.cnpq.br/9521600706234665; http://lattes.cnpq.br/5058497100007411
    In this work, a tool for inferring the degree of difficulty of cooking recipes will be proposed. The inference will be made by the textual classification of the recipe preparation methods. The tool will be a fundamental piece to the development of a contextaware contentbased cooking recipe recommendation system. Some of the main classifiers in Text Classification literature will be adopted, in addition to different feature extraction methods. An experimental evaluation is performed, in order to select the best approaches to compose the system.