Navegando por Assunto "Base de dados"

Agora exibindo 1 - 3 de 3

Impacto da latência na verificação e do atraso acentuado na rotulação para detecção de falhas de software
(2023-04-25) Sgotti, Lucas Cordeiro; Cabral, George Gomes; http://lattes.cnpq.br/8227256452129177; http://lattes.cnpq.br/6243434551046357
A detecção de falhas de software é uma atividade inerente ao desenvolvimento de software e requer um esforço elevado de recursos humanos. Essa atividade muitas vezes não é priorizada no intuito de reduzir o custo final de um projeto. Just-in-Time Software Defect Prediction (JIT-SDP) é uma das abordagens utilizadas para predição de defeitos de software com o objetivo identificar de maneira automática através de métodos de aprendizagem de máquina artefatos de software propensos a conterem defeitos a partir de dados históricos. No entanto, a maioria das abordagens assume que as características do problema permanecem as mesmas com o passar do tempo, porém o desbalanceamento entre as classes é um problema que evolui com o tempo à medida que novos exemplos de treinamento vão chegando, por exemplo. Analisar o problema em um ambiente online significa que, além de outras coisas, há uma natureza cronológica intrínseca à abordagem que por sua vez, traz consigo alguns problemas, dentre eles o de latência na verificação, que se refere ao fato que os rótulos dos exemplos de treinamento podem chegar muito mais tarde do que suas características. Este trabalho visa investigar o impacto da latência na verificação no problema da detecção de defeitos em software, assim como o desempenho desses métodos de acordo com o grau de latência na verificação em exemplos da classe indutora de defeitos.
Previsão de resultados de jogos do campeonato brasileiro de futebol utilizando aprendizagem de máquina
(2019-02-05) Almeida, Luiz Alberes Bispo de; Carvalho, Tiago Buarque Assunção de; http://lattes.cnpq.br/7150833804013500
Nos últimos anos a procura pelas apostas esportivas tem crescido, e diversas pessoas passaram a viver desse mercado. Usando a Aprendizagem de Máquina com o objetivo de facilitar a análise de jogos para apostas e medir o lucro, foi criada uma base de dados do Campeonato Brasileiro de Futebol Série A 2017 envolvendo características das duas equipes que se enfrentam e da partida. Para testar em um modelo de avaliação foi escolhida a técnica de Naive Bayes simulando uma rodada do Campeonato Brasileiro, a qual contém 10 partidas. O modelo de avaliação foi executado sem restrição de probabilidade correta e com restrições de probabilidade correta, com o objetivo de reduzir os erros. Três cenários foram utilizados no modelo de avaliação, sendo o primeiro com duas classes que consideram a marcação de gols por ambos os times, o segundo que considera o total de gols que aconteceram na partida (acima ou abaixo de 2,5 gols), e o terceiro que considera os três tipos de resultados na partida (vitória do mandante, empate e vitória do visitante). Os resultados sem restrição de probabilidade atingiram o seu maior valor em 5,51% de lucro médio e total. Enquanto para os resultados com restrição de probabilidade, o melhor resultado de lucro médio foi de 36,05%, e para lucro total foi de 39,13%, ambos para a restrição de 99% de probabilidade correta.
Sistema ChatBot para recomendação de refeições: uma abordagem Retrieval-Augmented Generation
(2024-09-26) Lima, Wallace Santana de; Lima, Rinaldo José de; http://lattes.cnpq.br/7645118086647340; http://lattes.cnpq.br/3144359353131133
Com o lançamento do ChatGPT, aumentou o interesse por assistentes chatbots capazes de interagir com linguagem semelhante à humana. Umas das formas de melhorar o desempenho destes assistentes é através da abordagem Retrieval-Augmented Generation (RAG). Nesta abordagem, um conjunto de documentos é extraído da base de dados e usado como contexto na geração das respostas. Porém, a qualidade do sistema RAG depende diretamente dos large language models (LLMs) que o integram. Plataformas como a Azure disponibilizam LLMs de altíssimo desempenho e que executam uma ampla gama de tarefas de inteligência artificial (IA). A desvantagem de usar estes LLMs, no entanto, é custo no uso da API, que é calculado em função do número de tokens de entrada e de saída. Por outro lado, em comunidades de machine learning (ML), como a Hugging Face, são publicados semanalmente dezenas de novos modelos de LLMs. Estes LLMs são treinados para tarefas específicas em inteligência artificial, podendo, alguns deles, ser reutilizados em tarefas diversas. Com base nisso, este trabalho faz um comparativo entre os LLMs disponíveis na Hugging Face para implementação de um chatbot de recomendação de refeições e restaurantes usando a abordagem RAG. Foram avaliados 8 LLMs de similaridade de sentença e 117 de geração de texto para compor o assistente chatbot. As saídas dos modelos de similaridade de sentença foram validadas por membros do departamento de computação da UFRPE. Já as respostas dos modelos de geração de texto foram avaliadas tanto por alunos da UFRPE, como pelo GPT-4. O ptbr-similarity-e5-small do repositório João Brito foi o modelo de similaridade de sentença com o maior número de saídas validadas, com 60% de validações. Por sua vez, o modelo de geração de texto Mistral-Nemo-Instruct-2407-Q5_0.gguf do repositório Second State obteve o score médio de 72,65, nas respostas avaliadas pelo GPT-4, assim como 4 vitórias em 4 disputas com outros modelos, julgadas por alunos da UFRPE.