TCC - Bacharelado em Ciência da Computação (Sede)

Resultados da Pesquisa

Agora exibindo 1 - 5 de 5

Aprendizagem de máquina para classificação de tipos textuais: estudo de caso em textos escritos em português brasileiro
(2025-07-30) Barbosa, Gabriel Augusto; Miranda, Péricles Barbosa Cunha de; http://lattes.cnpq.br/8649204954287770; http://lattes.cnpq.br/7161363389816372
A classificação de textos considerando tipos textuais é de suma importância para algumas aplicações de Processamento de Linguagem Natural (PLN). Nos últimos anos, algoritmos de aprendizado de máquina têm obtido bons resultados nesta tarefa considerando textos em inglês. No entanto, pesquisas voltadas para a detecção de tipos textuais escritos em português ainda são escassas, e ainda há muito a ser estudado e descoberto nesse contexto. Assim, este artigo propõe um estudo experimental que investiga o uso de algoritmos de aprendizado de máquina para classificar textos em português considerando tipos textuais. Para isso, propomos um novo corpus composto por textos em português de dois tipos textuais: narrativo e dissertativo. Três algoritmos de aprendizado de máquina tiveram seu desempenho avaliado no corpus criado em termos de precisão, revocação e pontuação F1. Além disso, também foi realizada uma análise dos atributos envolvidos no processo para identificar quais características textuais são mais importantes na tarefa atual. Os resultados mostraram que é possível alcançar altos níveis de precisão e rememoração na classificação de textos narrativos e dissertativos. Os algoritmos obtiveram níveis de métricas semelhantes, demonstrando a qualidade das características extraídas.
Utilização de processamento de linguagem natural para identificação do domínio da escrita formal em redações da língua portuguesa
(2020-12-07) Araujo, Viviane Barbosa de; Mello, Rafael Ferreira Leite de; http://lattes.cnpq.br/6190254569597745; http://lattes.cnpq.br/5293423783550464
No Brasil, o principal meio de ingressar em uma universidade pública ou privada é através do Exame Nacional do Ensino Médio, o ENEM. Esse exame exige que o candidato possua a habilidade de redigir um bom texto dissertativo-argumentativo de acordo com a norma formal da língua portuguesa, podendo ser eliminado do exame caso não cumpra esse requisito. Com o objetivo de ajudar o candidato a identificar os seus erros e ajudar no processo de escrita de uma boa redação, este artigo propõe a implementação de uma ferramenta capaz de identificar os erros ortográficos e gramaticais de um texto utilizando técnicas de Processamento de Linguagem Natural (PLN). A análise das ferramentas mostrou que os resultados obtidos pela pesquisa são promissores, principalmente em relação à identificação de erros gramaticais.
Evaluation of dimensionality reduction and truncation techniques forword embeddings
(2021-03-03) Aoun, Paulo Henrique Calado; Nascimento, André Câmara Alves do; Silva, Adenilton José da; http://lattes.cnpq.br/0314035098884256; http://lattes.cnpq.br/0622594061462533; http://lattes.cnpq.br/1048218441267310
O uso de word embeddings está se tornando muito comum em diversas tarefas de processamento de linguagem natural. Na maioria das vezes, eles exigem recursos computacionais que não podem ser encontrados na maior parte dos dispositivos móveis atuais. Neste trabalho, avaliamos uma combinação de estratégias de truncagem numérica e redução de dimensionalidade para obter representações vetoriais menores sem perdas substanciais no desempenho.
Coh-Metrix PT-BR: uma API web de análise textual para à educação
(2021-03-02) Salhab, Raissa Camelo; Mello, Rafael Ferreira Leite de; http://lattes.cnpq.br/6190254569597745; http://lattes.cnpq.br/6761163457130594
O CohMetrix é um sistema computacional que provê diferentes medidas de análise textual incluindo legibilidade, coerência e coesão textual. Essas medidas permitem uma análise mais profunda de diferentes tipos de textos educacionais como redações, respostas de perguntas abertas e mensagens em fóruns educacionais. Este artigo apresenta o protótipo, site e API, com a adaptação das medidas do CohMetrix para a língua portuguesa do Brasil.
Inferência automática de nível de dificuldade de receitas culinárias usando técnicas de processamento de linguagem natural
(2020-12-21) Britto, Larissa Feliciana da Silva; Pacífico, Luciano Demétrio Santos; Ludermir, Teresa Bernarda; http://lattes.cnpq.br/6321179168854922; http://lattes.cnpq.br/9521600706234665; http://lattes.cnpq.br/5058497100007411
Neste trabalho, será proposta uma ferramenta de inferência do nível de dificuldade de receitas culinárias. A inferência será feita através da classificação textual dos modos de preparo das receita. A ferramenta será parte fundamental no desenvolvimento de um sistema de recomendação de receitas culinárias sensível ao contexto baseado em conteúdo. Serão adotados alguns dos principais classificadores da literatura de Classificação de Texto, além de diferentes métodos de extração de características. Uma avaliação experimental é executada, no intuito de selecionar as melhores abordagens para compor o sistema.

TCC - Bacharelado em Ciência da Computação (Sede)

Navegar

Filtros

Configurações

Ordenar por

Resultados por página

Resultados da Pesquisa