TCC - Bacharelado em Sistemas da Informação (Sede)

URI permanente para esta coleçãohttps://arandu.ufrpe.br/handle/123456789/427

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 10 de 25
  • Imagem de Miniatura
    Item
    Aplicação web para detecção automática de URLs maliciosas com aprendizado de máquina
    (2025-08-08) Souza, Celso Soares Cassiano de; Oliveira, Lidiano Augusto Nóbrega de; http://lattes.cnpq.br/7399493881755815
    A segurança cibernética tem se tornado uma das principais preocupações da era digital, impulsionada pelo crescimento acelerado da internet e pela proliferação de ameaças como phishing, malware e roubo de dados. Este trabalho propõe uma abordagem baseada em aprendizado de máquina para classificar URLs como legítimas ou maliciosas, utilizando um conjunto abrangente de atributos extraídos diretamente das URLs e de fontes complementares, como registros WHOIS e informações de rede. Foram aplicados e analisados algoritmos como Random Forest, SVM e XGBoost sobre um conjunto de dados coletado de fontes confiáveis, como PhishTank e Kaggle. As características consideradas englobam aspectos léxicos, informações de rede, conexão e reputação. A avaliação dos modelos foi conduzida por meio de métricas como acurácia, precisão, recall e F1-score, evidenciando um desempenho satisfatório na detecção de sites maliciosos. Como aplicação prática, foi desenvolvida uma plataforma interativa com Streamlit, permitindo que qualquer usuário insira urna URL e receba uma análise imediata sobre sua legitimidade. A análise de importância das variáveis forneceu insights valiosos sobre os fatores mais influentes no processo de classificação, contribuindo tanto para a transparência quanto para a evolução futura do sistema.
  • Imagem de Miniatura
    Item
    Análise de desempenho do Gemini na estimativa de peso de alimentos por imagem
    (2025-08-06) Silva, Carlos Gabriel Farias da; Garrozi, Cícero; http://lattes.cnpq.br/0488054917286587
    Com o avanço das inteligências artificiais multimodais, cresce o interesse em sua aplicação na área da saúde para facilitar a análise nutricional e auxiliar no combate à obesidade. No entanto, a confiabilidade desses modelos para identificar alimentos e estimar porções a partir de imagens ainda é incerta, sendo fundamental mensurar seu desempenho de forma objetiva. Este trabalho avalia a capacidade do modelo Gemini de classificar ingredientes e estimar seus respectivos pesos (em gramas) a partir de fotografias de refeições. Para isso, foi desenvolvido um sistema automatizado que envia requisições à API do Gemini, utilizando um prompt textual padronizado, elaborado com técnicas de engenharia de prompt, e uma lista de ingredientes de referência. As respostas do modelo, obtidas em formato JSON, foram comparadas com dados reais para análise de desempenho. Os resultados obtidos nos experimentos indicaram um baixo desempenho geral. Na classificação de ingredientes, o modelo apresentou baixa precisão e sensibilidade (recall), com dificuldade em detectar itens como temperos e condimentos (por exemplo, azeite e sal) que estavam misturados a outros alimentos, embora tenha obtido altas taxas de aceno para ingredientes visualmente distintos, como morangos e ovos mexidos. Na estimativa de peso, o desempenho também foi insatisfatório, com altos valores de erro (MAE e RMSE) e coeficiente de determinação (R2) negativo, evidenciando tendência à superestimação e desempenho inferior a uma simples predição pela média.
  • Imagem de Miniatura
    Item
    Aprendizado de máquina não supervisionado aplicado na dinâmica de preços de combustíveis no Brasil
    (2025-08-05) Lima, Andressa Luana Santana de; Gouveia, Roberta Macedo Marques; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/0993590347039876
    Este trabalho realiza uma análise exploratória e de clusterização dos dados públicos da Agência Nacional do Petróleo (ANP) para os preços de combustíveis no Brasil em 2024. A partir de variáveis numéricas agregadas por região e por produto, foi aplicado o algoritmo K-means para identificar padrões de comportamento no mercado. As variáveis selecionadas buscaram representar aspectos como níveis médios de preço, variações sazonais, volume de registros e distribuição de revendas. Os resultados apontaram diferenças estruturais entre regiões e entre combustíveis, evidenciando a heterogeneidade do setor. O estudo evidencia a importância do uso de técnicas de agrupamento para explorar padrões relevantes no mercado de combustíveis.
  • Imagem de Miniatura
    Item
    Detecção de fake news: uma abordagem baseada em Large Language Models e Prompt Engineering
    (2025-03-20) Fonseca, Pablo Weslley Silva da; Lima, Rinaldo José de; http://lattes.cnpq.br/7645118086647340; http://lattes.cnpq.br/6258598537884813
    Este trabalho aborda o uso de Large Language Models (LLMs) para a detecção de fake news ou notícias falsas no idioma inglês e português. As notícias falsas têm gerado impactos negativos, como desinformação e conflitos sociais, sendo amplamente disseminadas pelas redes sociais. Embora métodos tradicionais de verificação sejam eficazes, como checagem manual e agências de verificação de fatos, a aplicação de algoritmos de machine learning e deep learning trouxe avanços importantes. No entanto, esses modelos apresentam limitações, como perda de contexto semântico e custos de treinamento. A introdução da arquitetura Transformers possibilitou avanços significativos com LLMs, como BERT, GPT e T5, devido à sua capacidade de compreender padrões linguísticos complexos. Este trabalho propõe uma abordagem de detecção de notícias falsas a partir recuperações de informações pela Web e o modelo Qwen2.5-7B-Instruct, comparando o desempenho com propostas que combina recuperação de informações com modelos tradicionais e LLMs. Os resultados destacam vantagens e desvantagens, contribuindo para futuras melhorias em sistemas automatizados de detecção de notícias falsas.
  • Imagem de Miniatura
    Item
    Previsão de preço de ações de empresas do setor elétrico com algoritmos de aprendizado de máquina
    (2025-03-21) Silva, Herculles Hendrius Coutinho Mesquita; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584
    O presente trabalho tem como objetivo comparar a eficiência de diferentes algoritmos de aprendizado de máquina na previsão de preços de ações do setor de energia elétrica. Para isso, foram analisados quatro algoritmos: Long Short-Term Memory (LSTM), Support Vector Regression (SVR), Regressão Linear e Random Forest. Os dados utilizados compreendem uma série histórica de preços e indicadores adicionais, como inflação, Índice de energia elétrica (IEE) e variação cambial, que foram processados e utilizados como entrada para os modelos. A análise foi realizada com base em métricas de erro, como Erro Médio Absoluto (MAE), Erro Quadrático Médio (MSE) e Raiz do Erro Quadrático Médio (RMSE), bem como pela avaliação da diferença percentual entre os preços previstos e os valores reais. Os resultados mostram que o algoritmo LSTM obteve o melhor desempenho na previsão de preços de fechamento, seguido pela Regressão Linear, enquanto o Random Forest apresentou maior margem de erro e se monstrando inadequado para a aplicação neste problema. Este estudo realiza a aplicação de algoritmos preditivos no mercado financeiro, demonstrando o potencial do aprendizado de máquina como ferramenta para análise e tomada de decisão no setor de energia elétrica.
  • Imagem de Miniatura
    Item
    Implementação de um agente inteligente para atendimento automatizado de dúvidas acadêmicas na UFRPE
    (2025-03-31) Silva, Evelyn Mylena Bezerra e; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/5200293461568988
    Este trabalho teve como objetivo principal desenvolver e validar um agente inteligente baseado em técnicas de Processamento de Linguagem Natural (PLN) e Recuperação de Informação, voltado ao suporte acadêmico no curso de Bacharelado em Sistemas de Informação (BSI) da Universidade Federal Rural de Pernambuco (UFRPE). O sistema foi projetado para oferecer respostas rápidas, relevantes e contextualizadas a perguntas frequentes relacionadas à vida acadêmica dos estudantes, como carga horária, disciplinas, matrículas e procedimentos administrativos. A implementação envolveu a coleta e estruturação de documentos institucionais, a construção de um modelo vetorial para recuperação semântica de respostas e a integração com um módulo de memória conversacional. Para a validação, as respostas do agente inteligente foram comparadas com um FAQ do curso de BSI, utilizando como métrica a similaridade do cosseno, aplicada ao conteúdo semântico das respostas. Os resultados indicaram uma média de similaridade de aproximadamente 0,6396, com mediana de 0,6548 e baixa dispersão. A maioria das respostas apresentou alto ou médio grau de alinhamento semântico com o conteúdo oficial, sendo classificadas como semanticamente adequadas. Casos de baixa similaridade representaram uma minoria e estiveram, em geral, relacionados a perguntas de cunho prático-operacional não abordadas na base de dados do sistema. Em contrapartida, observou-se que, em alguns contextos, o agente inteligente forneceu respostas mais completas e fundamentadas do que aquelas presentes no próprio FAQ. Conclui-se que o sistema desenvolvido apresenta desempenho satisfatório e demonstra potencial para expansão como ferramenta institucional de apoio ao estudante, promovendo maior autonomia, agilidade e acessibilidade no acesso a informação acadêmica.
  • Imagem de Miniatura
    Item
    Implementação de um sistema mobile colaborativo para acompanhamento do quadro de pacientes com esclerose múltipla por meio de análise de sentimento
    (2024-10-02) Araujo, Paula Priscila da Cruz; Gouveia, Roberta Macêdo Marques; Tschá, Elizabeth Regina; http://lattes.cnpq.br/9598413463162759; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/0280090820230057
    O estudo visa desenvolver um sistema mobile para facilitar o acompanhamento de pacientes acometidos por Esclerose Múltipla (EM) baseado no Toolkit Human-Centered Design (HCD) para atender as necessidades dos pacientes. O aplicativo permite que eles registrem e monitorarem emoções, sintomas e tratamentos, oferecendo relatórios mensais e alertas personalizados. Para a análise de sentimentos, foram utilizados os algoritmos de aprendizado de máquina XGBoost e Naive Bayes, sendo o XGBoost demonstrando melhor desempenho, com uma acurácia de 87,56% e um F1-Score de 0,876, enquanto o Naive Bayes, obteve 62,25% de acurácia e um F1-Score de 0,524. Os resultados indicam a eficácia da ferramenta no acompanhamento emocional e médico, contribuindo para a melhoria na qualidade de vida.
  • Imagem de Miniatura
    Item
    Técnicas preditivas para auxílio no diagnóstico de melanomas via imagens
    (2024-10-02) Silva Júnior, José Carlos Monte; Soares, Rodrigo Gabriel Ferreira; http://lattes.cnpq.br/2526739219416964
    O câncer de pele é o tipo mais comum de câncer no mundo, dividido em dois tipos principais: melanoma e não melanoma. Embora mais raro, o melanoma é o mais letal devido ao seu potencial de causar metástase. Métodos não invasivos, como a dermatoscopia e a regra ABCDE, têm sido utilizados para evitar procedimentos cirúrgicos desnecessários e têm ajudado na identificação de lesões, contribuindo para diagnósticos mais rápidos. Com o avanço da tecnologia, a Inteligência Artificial (IA) ganhou destaque, mostrando-se uma solução promissora para a análise de dados médicos, especialmente com o uso de Redes Neurais Convolucionais (RNCs), que podem reconhecer padrões em imagens dermatoscópicas e ajudar na classificação de lesões como melanoma ou não melanoma de forma automatizada. Este projeto propõe um comitê de classificadores baseado em Redes Neurais Convolucionais para classificar imagens dermatoscópicas como melanoma ou não melanoma, comparando seu desempenho com arquiteturas validadas, como AlexNet e VGG-16, utilizando técnicas de Transfer Learning. As análises de Precisão, Revocação e Pontuação F1 mostraram que o comitê de Redes Neurais Convolucionais superou os modelos que utilizam técnicas de Transfer Learning, com a AlexNet apresentando desempenho superior à VGG-16. O comitê de Redes Neurais Convolucionais demonstrou uma maior capacidade de generalização, mostrando-se promissor ao capturar as características relevantes das imagens, revelando potencial para aplicações médicas, embora ainda precise ser refinado para atingir padrões clínicos.
  • Imagem de Miniatura
    Item
    Análise de sentimentos em reviews de jogos digitais da Plataforma Steam
    (2024-09-26) Albuquerque, Júlia de Melo; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584
    A análise de sentimento é uma área que investiga as expressões emocionais da linguagem humana, buscando compreender as necessidades e opiniões subjacentes expressas em textos. Sua complexidade existe na habilidade de discernir não apenas o conteúdo textual, mas também as matrizes emocionais implícitas. Com o avanço tecnológico, a facilidade de expressar a opinião publicamente se dissemina por diversos meios, sendo campo dos jogos online uma vertente que atrai inúmeras publicações de jogadores sobre os diversos títulos disponíveis. No entanto, essa diversidade de públicos e temas torna desafiador compreender o sentimento expresso que permeia esse universo. O objetivo deste estudo é aplicar técnicas de análise de sentimento em avaliações de jogos digitais, adotando uma abordagem focada em algoritmos de aprendizado de máquina supervisionados e bibliotecas pre-polarizadas, a fim de identificar o melhor caminho de classificação capaz de discernir os sentimentos expressos pelos usuários nas avaliações. Nessa operação está sendo considerada uma abordagem com todas as opiniões e outra focada em gênero específico de cada jogo. Essa análise foi conduzida por meio da exploração de dados provenientes de uma empresa de distribuição de jogos online (Steam), seguindo com uma preparação desses dados devido às particularidades presentes nos registros. Os resultados revelam que os modelos de aprendizado de máquina superam as abordagens tradicionais, como a utilização da biblioteca VADER, apresentando uma precisão maior em aproximadamente 10% nas capturas, observou-se uma diferença de 20% a mais em métricas como recall e F1-score. Esse estudo representa uma contribuição analítica para a área da análise de sentimento, destacando a capacidade do modelo construído em lidar com a complexidade da linguagem humana.
  • Imagem de Miniatura
    Item
    Desenvolvimento de um sistema auxiliar para controle de acesso de veículos para a Universidade Federal Rural de Pernambuco
    (2024-03-08) Izidio, Stefany Vitória da Conceição; Garrozi, Cícero; http://lattes.cnpq.br/0488054917286587; http://lattes.cnpq.br/0642557485551355
    Atualmente, o controle de acesso de veículos à Universidade Federal Rural de Pernambuco é feito manualmente em papéis por funcionários da universidade. Também há a liberação direta de veículos que se cadastram na universidade e recebem um adesivo específico para usar no para-brisa. Este tipo de controle não é muito seguro, por poder ser facilmente clonado e usado por veículos sem autorização real. Além disso, há um curto desvio de atenção do funcionário quando ele realiza o trabalho manual de anotar a placa no papel. Este trabalho tem o objetivo de tornar o processo de controle de veículos mais confiável e seguro através do desenvolvimento de um protótipo de um sistema que auxilia no controle de acesso. Este trabalho propõe uma solução mediante a captura de uma imagem da placa, identificação da placa do veículo e da verificação em uma base de dados se a placa é previamente cadastrada ou não. E, o sistema produz um sinal luminoso para indicar ao funcionário se a placa é ou não cadastrada. Para isso, foi montado um produto de hardware e desenvolvido um software embutido. O hardware é composto por um conjunto de dispositivos eletrônicos como LEDs, câmera, dispositivo de processamento, etc. O software é um conjunto de bibliotecas que foi, em sua maior parte, desenvolvido em Python. Para o software embutido, foi usado um conjunto de imagens com fotos de placas de carros brasileiros para treinar um modelo de detecção de objetos para detectar as placas. Por fim, foi utilizado um serviço de reconhecimento ótico de caracteres para extrair o conteúdo da placa, possibilitando assim registrar e emitir o sinal luminoso ao usuário.