TCC - Bacharelado em Sistemas da Informação (Sede)

URI permanente para esta coleçãohttps://arandu.ufrpe.br/handle/123456789/427

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 6 de 6
  • Imagem de Miniatura
    Item
    Análise de Viés no Modelo BERTimbau para detecção de discurso de ódio em Português Brasileiro
    (2026-02-12) Oliveira Filho, José Fernando de; Gouveia, Roberta Macedo Marques; http://lattes.cnpq.br/2024317361355224
    A expansão das redes sociais intensificou a circulação de discursos de ódio online, gerando desafios à convivência democrática e à proteção de grupos minoritários. Diante da inviabilidade da moderação manual, este trabalho aplica técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (ML) para a identificação de conteúdo ofensivo em português brasileiro. O estudo investiga o viés algorítmico do modelo BERTimbau, ajustado via fine-tuning e treinado sobre as bases anotadas ToLD-BR e Tupy-E. A avaliação considera métricas tradicionais de desempenho (precisão, recall, F1-score) e de equidade (Paridade Demográfica), com o objetivo de examinar possíveis associações indevidas entre termos de identidade social e discurso de ódio, contribuindo para o debate sobre justiça algorítmica. Os resultados evidenciaram padrões estruturados de viés do BERTimbau entre os eixos de gênero, raça e orientação sexual, bem como entre grupos específicos dentro de cada eixo (por exemplo, mulheres, pessoas bissexuais, gays e pardas), mostrando que o modelo tende a associar esses termos de identidade ao discurso de ódio com maior frequência do que seus grupos de referência, mesmo em contextos neutros ou positivos.
  • Imagem de Miniatura
    Item
    Navegando pelas emoções: aplicando modelos de linguagem de grande escala para auxiliar crianças no processamento de eventos pessoais
    (2025-08-08) Silva Filho, Aurineque da Costa; Lima, Rinaldo José de; http://lattes.cnpq.br/7645118086647340
    Nos dias atuais, diversos modelos de LLM têm sido aplicados em uma ampla gama de áreas, evidenciando o potencial dessas tecnologias para resolver desafios complexos. Nesse contexto, o Fafabot surge como uma iniciativa que visa apoiar o desenvolvimento emocional infantil, uma área essencial para a formação de habilidades sociais e o bem-estar das crianças. Existem avanços promissores identificados em estudos laboratoriais recentes, dos quais demonstram que é possível criar um ambiente onde a criança possa se sentir segura para não só compartilhar experiências sobre eventos pessoais, como também incentivar elas a entender as possíveis emoções associadas. Contudo ainda há uma lacuna significativa na aplicação dessas soluções em contextos cotidianos e também o campo cultural e econômico aplicado a outras realidades como o Brasil. Alguns Estudos reforçam que o desenvolvimento emocional é algo que deve ser trabalhado desde a infância, pois nesta fase as crianças possuem dificuldade de compreender e expressar o que estão sentindo. O Fafabot propõe utilizar Modelos de Linguagem de Grande Escala (LLMs) para criar um ambiente seguro, culturalmente sensível e acolhedor, onde as crianças possam compreender e expressar suas emoções de forma natural, além de auxiliá-las com estratégias de enfrentamento para emoções negativas que possam indicar quadros de ansiedade e tristeza, sugerindo a busca de um profissional da mente quando necessário e sempre incentivando a criança a compartilhar estes sentimentos com seus pais. Verificando as implicações deste tipo de tecnologia em crianças entre 8 e 12 anos na cidade de Olinda-PE.
  • Imagem de Miniatura
    Item
    Detecção de fake news: uma abordagem baseada em Large Language Models e Prompt Engineering
    (2025-03-20) Fonseca, Pablo Weslley Silva da; Lima, Rinaldo José de; http://lattes.cnpq.br/7645118086647340; http://lattes.cnpq.br/6258598537884813
    Este trabalho aborda o uso de Large Language Models (LLMs) para a detecção de fake news ou notícias falsas no idioma inglês e português. As notícias falsas têm gerado impactos negativos, como desinformação e conflitos sociais, sendo amplamente disseminadas pelas redes sociais. Embora métodos tradicionais de verificação sejam eficazes, como checagem manual e agências de verificação de fatos, a aplicação de algoritmos de machine learning e deep learning trouxe avanços importantes. No entanto, esses modelos apresentam limitações, como perda de contexto semântico e custos de treinamento. A introdução da arquitetura Transformers possibilitou avanços significativos com LLMs, como BERT, GPT e T5, devido à sua capacidade de compreender padrões linguísticos complexos. Este trabalho propõe uma abordagem de detecção de notícias falsas a partir recuperações de informações pela Web e o modelo Qwen2.5-7B-Instruct, comparando o desempenho com propostas que combina recuperação de informações com modelos tradicionais e LLMs. Os resultados destacam vantagens e desvantagens, contribuindo para futuras melhorias em sistemas automatizados de detecção de notícias falsas.
  • Imagem de Miniatura
    Item
    Geração aumentada para recuperação de dados urbanos integrados: consolidando dados do IBGE, Censo, CNEFE e OSM para a otimização do planejamento urbano
    (2025-03-21) Conceição, Keyson Raphael Acioli da; Lima, Rinaldo José de; http://lattes.cnpq.br/7645118086647340; http://lattes.cnpq.br/3198610477751043
    Nos últimos anos, os campos da Inteligência Artificial (IA) e do aprendizado de máquina (AM) revolucionaram o domínio do planejamento urbano, pois permitem que volumes substanciais de dados sejam analisados de forma eficaz, incentivando melhor alocação de recursos e entregas de serviços públicos. Para atingir este objetivo, o agente inteligente proposto neste trabalho reúne dados de várias fontes, incluindo Censo Demográfico, Cadastro Nacional de Endereços para Fins Estatísticos - CNEFE, e OpenStreetMap (OSM) para oferecer respostas baseadas em contexto relacionadas à distribuição da população e acesso a diferentes serviços urbanos. A abordagem proposta inclui um pipeline de processamento que implementa normalização, indexação vetorial das informações e representação semântica para tornar as consultas mais eficazes. Para avaliar o sistema proposto, foi conduzido um experimento com especialistas em planejamento urbano e analisamos a relevância, clareza e utilidade das respostas geradas pelo sistema. Tais resultados mostram que o agente é capaz de detectar áreas com pouca cobertura de serviços necessários, indicando uma alocação adequada. No entanto, outros desafios, tais como a necessidade de melhor clarificação das respostas e ampliação da cobertura espacial, foram reconhecidos como oportunidades para trabalho futuro.
  • Imagem de Miniatura
    Item
    Implementação de um agente inteligente para atendimento automatizado de dúvidas acadêmicas na UFRPE
    (2025-03-31) Silva, Evelyn Mylena Bezerra e; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/5200293461568988
    Este trabalho teve como objetivo principal desenvolver e validar um agente inteligente baseado em técnicas de Processamento de Linguagem Natural (PLN) e Recuperação de Informação, voltado ao suporte acadêmico no curso de Bacharelado em Sistemas de Informação (BSI) da Universidade Federal Rural de Pernambuco (UFRPE). O sistema foi projetado para oferecer respostas rápidas, relevantes e contextualizadas a perguntas frequentes relacionadas à vida acadêmica dos estudantes, como carga horária, disciplinas, matrículas e procedimentos administrativos. A implementação envolveu a coleta e estruturação de documentos institucionais, a construção de um modelo vetorial para recuperação semântica de respostas e a integração com um módulo de memória conversacional. Para a validação, as respostas do agente inteligente foram comparadas com um FAQ do curso de BSI, utilizando como métrica a similaridade do cosseno, aplicada ao conteúdo semântico das respostas. Os resultados indicaram uma média de similaridade de aproximadamente 0,6396, com mediana de 0,6548 e baixa dispersão. A maioria das respostas apresentou alto ou médio grau de alinhamento semântico com o conteúdo oficial, sendo classificadas como semanticamente adequadas. Casos de baixa similaridade representaram uma minoria e estiveram, em geral, relacionados a perguntas de cunho prático-operacional não abordadas na base de dados do sistema. Em contrapartida, observou-se que, em alguns contextos, o agente inteligente forneceu respostas mais completas e fundamentadas do que aquelas presentes no próprio FAQ. Conclui-se que o sistema desenvolvido apresenta desempenho satisfatório e demonstra potencial para expansão como ferramenta institucional de apoio ao estudante, promovendo maior autonomia, agilidade e acessibilidade no acesso a informação acadêmica.
  • Imagem de Miniatura
    Item
    Predição de popularidade de podcasts através de características textuais
    (2019) Santana Júnior, Bernardo de Moraes; Cabral, Giordano Ribeiro Eulalio; http://lattes.cnpq.br/6045470959652684; http://lattes.cnpq.br/9948081717430490
    Com o tremendo crescimento dos Podcast se profissionalização de seus criadores,ao ponto de redes de notícias chamarem esse momento como ”era de ouro”para os Podcasts, novas ferramentas surgiram para auxiliar esses produtores na construção emanutenção de seus canais. Nesse contexto encontrar características nos episódios produzidos que proporcionem um alcance maior ao público alvo é de grande valor tantopara os criadores quanto para os ouvintes, permitindo que canais permaneçam ativospor mais tempo e ofereçam uma melhor qualidade de conteúdo.Assim, este trabalho propõe um estudo de análise de popularidade dosPodcastsna-cionais, utilizando uma ferramenta de análise da audiência dos Podcasts em um dos agregadores de canais e episódios mais utilizados do mundo, oiTunes. Através de ferramentas deWeb Scraping para a coleta das informações disponíveis e necessárias,de ferramentas para transcrições dos áudios dos episódios para a obtenção do que foidito e o calculo de métricas para medir precisão do modelo gerado, assim fazer uma análise de quais informações são relevantes para a predição de popularidade de um canal.Resultados obtidos foram favoráveis na correlação entre as categorias analisadas de forma individual e texto dos episódios nelas contidos, enquanto em uma análise em que categorias não são descriminadas há uma baixa relação entre texto e popularidade, demonstrando que a categoria de determinado canal tem um papel importante na análise de sua popularidade.