TCC - Bacharelado em Sistemas da Informação (Sede)

URI permanente para esta coleçãohttps://arandu.ufrpe.br/handle/123456789/427

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 10 de 24
  • Imagem de Miniatura
    Item
    Aprendizagem de máquina para a identificação de clientes propensos à compra em Inbound marketing
    (2019-07-12) Silva, Bruno Roberto Florentino da; Monteiro, Cleviton Vinicius Fonsêca; Soares, Rodrigo Gabriel Ferreira; http://lattes.cnpq.br/2526739219416964; http://lattes.cnpq.br/9362573782715504
    O ponto mais importante para uma empresa deve ser sempre o cliente e conseguir novos clientes nem sempre é uma estratégia fácil. As técnicas de marketing digital estudam como atrair novos clientes para as empresas fazendo uso de plataformas digitais. Em virtude da popularização destes meios, as estratégias tiveram que se moldar às novas necessidades. Com apenas um clique é possível alcançar milhares de indivíduos, o que significa muitos leads (oportunidades de negócio) novos para a empresa. Entretanto, filtrar quais desses indivíduos estão realmente interessados no produto ou serviço ofertado pela empresa demanda um grande esforço da equipe de vendas. Essa sobrecarga é prejudicial no sentido de que a empresa pode perder receita por falta de direcionamento das verdadeiras oportunidades. Visando amenizar tal problema, o presente trabalho oferece uma proposta cujo objetivo é a identificação automática de potenciais clientes com maior propensão à compra dentre os leads obtidos por uma empresa através de estratégias de marketing digital. Para tornar possível a execução desta proposta, foram utilizados recursos de Aprendizado de máquina, com aplicação dos algoritmos de classificação supervisionada, Árvore de decisão e Naive Bayes (NB), fornecidos pela biblioteca Scikit-learn, sob a linguagem de programação Python. Além disso, fez-se necessário a aplicação do algoritmo de sobreamostragem SMOTE, devido ao desbalanceamento do conjunto de dados. Com a finalidade de otimizar a classificação, foram utilizadas técnicas de seleção de atributos e seleção de modelos com ajuste de hiperparâmetros. Para avaliação dos resultados, utilizou-se as métricas de matriz de confusão, precisão, cobertura e curva de precisão e cobertura. Devido ao desbalanceamento dos dados, a métrica de precisão não relatou bons resultados, com médias de 5,5% de acerto. Já a cobertura alcançou médias de aproximadamente 83%. Mesmo com resultados tão divergentes entre as métricas aplicadas, o presente trabalho conseguiu identificar a maioria das verdadeiras oportunidades e relatando que ao utilizar esta abordagem, seria possível obter uma redução de até 85% da aplicação de esforço por parte da equipe de vendas. Em consequência disso, uma empresa pode ter uma redução de custos ao diminuir os recursos aplicados para obter novos clientes, propiciando que a equipe de vendas possa encontrar novos clientes com maior eficiência.
  • Imagem de Miniatura
    Item
    Uso de Machine Learn para classificação de lançamentos financeiro: estudo comparativo entre modelo AutoML e Redes MLP
    (2022-10-10) Silva, Vinicius Mateus Mendonça da; Monteiro, Cleviton Vinicius Fonsêca; http://lattes.cnpq.br/9362573782715504; http://lattes.cnpq.br/6180002649065928
    O estudo desse trabalho visa auxiliar as empresas na sua gestão financeira gerando modelos baseados em Machine Learning para classificação de lançamentos financeiros. Com auxilio de bibliotecas desenvolvidas na linguagem Python, foi possível realizar o treinamento de modelos de AutoML e Redes Neurais Multilayer Perceptron responsáveis pela classificação dos dados. Com resultados acima de 85% nas métricas de Accuracy, Recall, F-measure e Precision para ambos os modelos, a utilização dos mesmo trás a possibilidade de uma melhor gestão dos lançamento financeiro com menos esforço.
  • Imagem de Miniatura
    Item
    Uma abordagem baseada em aprendizado de máquina para dimensionamento de requisitos de software
    (2016-12-13) Fernandes Neto, Eça da Rocha; Soares, Rodrigo Gabriel Ferreira; http://lattes.cnpq.br/2526739219416964; http://lattes.cnpq.br/6325583065151828
    Este trabalho se propõe a realizar o dimensionamento automático de requisitos de software utilizando uma abordagem de aprendizado de máquina. A base de dados utilizada é real e foi obtida de uma empresa que trabalha com processo de desenvol- vimento baseado no Scrum e estimativa Planning Poker. Durante os estudos foram utilizadas técnicas de pré processamento de dados, classificação e seleção de melho- res atributos com os algorítimos termo–inverso da frequência nos documentos (tf-idf) e análise de componentes principais (PCA). O aprendizado de máquina e classificação automática se deu com o uso de Máquinas de Vetores de Suporte (SVM) baseado no histórico de dados disponível. Os testes finais foram realizados com e sem a seleção de atributos via PCA. Está demonstrado que a assertividade é maior quando é feita a seleção dos melhores atributos. A ferramenta fruto do trabalho consegue estimar o tamanho de histórias de usuário com uma generalização de até 91%. Os resultados foram considerados passíveis de serem utilizados em ambiente de produção sem pre- juízo para a equipe de desenvolvimento.
  • Imagem de Miniatura
    Item
    Uso de machine learning para previsão de valores de apartamentos no município do Recife
    (2023-09-12) Silva, Thiago César de Miranda; Monteiro, Cleviton Vinicius Fonsêca; Soares, Rodrigo Gabriel Ferreira; http://lattes.cnpq.br/2526739219416964; http://lattes.cnpq.br/9362573782715504; http://lattes.cnpq.br/8285740572952516
    A pandemia de COVID-19 trouxe consigo uma série de efeitos econômicos e transformações relacionadas ao comportamento e à forma de morar, que, por sua vez, tiveram repercussões nos preços dos imóveis e na demanda de imóveis. Nesse contexto, a previsão de preços de imóveis assume um papel de extrema importância, contribuindo para decisões mais informadas, atenuando os riscos e promovendo uma maior transparência no setor imobiliário. A implementação da automação na previsão de preços amplia ainda mais essa dinâmica, aprimorando significativamente a precisão, a eficiência e a confiabilidade das previsões, além de proporcionar ajustes às flutuações do cenário econômico com mais agilidade. Usando anúncios disponíveis na OLX, foi criada uma base de dados georreferenciada para gerar um modelo de previsão de preços de apartamentos residenciais, em Recife - por meio de modelos de aprendizagem de máquina em AutoML. Essa ferramenta automatiza o desenvolvimento de modelos de aprendizado de máquina, permitindo experimentação rápida e foco na resolução do problema. O trabalho indica que a má distribuição geográfica dos dados tendenciaram os resultados dos modelos, além disso, foi concluído que os dados encontrados em plataformas de compra e venda online são insuficientes para a geração de um modelo de aprendizado de máquina que apresente um nível de acuracidade aceitável, em Recife, principalmente porque não são apresentados valores de transação do imóvel, apenas o preço anunciado. Contudo, o presente trabalho apresenta importantes contribuições para o avanço em pesquisas relacionadas à automação na previsão de preços de imóveis.
  • Imagem de Miniatura
    Item
    O uso de Auto ML nas apostas esportivas
    (2022-06-02) Oliveira, José Matheus Souza de; Monteiro, Cleviton Vinicius Fonsêca; http://lattes.cnpq.br/9362573782715504
    O mercado de apostas esportivas vem crescendo de forma efetiva, e dos 40 times que disputam as séries A e B do Campeonato Brasileiro, 35 são patrocinados por casas de apostas. Observando o número de apostadores que são lucrativos, foi constatado que existe uma grande necessidade por soluções que auxiliem essas pessoas a se tornarem lucrativas. Visando conseguir atingir esse objetivo no longo prazo, a primeira etapa desse projeto é avaliar o uso soluções de Auto Machine Learning(AutoML), em dois cenários de apostas: ambas equipes marcarem e a partida ter mais ou menos que 2 gols. Para esse trabalho, foram utilizados os dados do Campeonato Brasileiro de Futebol da Série A 2017. O campeonato possui 38 rodadas no total e 10 partidas em cada rodada, totalizando 380 partidas. Para calcular os cenários de lucro, foram estabelecidos duas formas de avaliação: sem restrição e com restrição de probabilidade. Comparando os resultados obtidos nesses dois cenários, o cenário 2 em todos os resultados apresentou lucro, diferentemente do que se alcançou no cenário 1, além disso, temos a taxa de assertividade que foi bem mais positiva no cenário 2, chegando a atingir um valor de 73,68% enquanto a taxa máxima obtida no cenário 1 foi de 63,88%.
  • Imagem de Miniatura
    Item
    Detecção de anomalias em dados meteorológicos do sertão de Pernambuco utilizando Isolation Forest e DBSCAN
    (2022-06-02) Cavalcante, Anderson Rodrigues; Medeiros, Victor Wanderley Costa de; http://lattes.cnpq.br/7159595141911505; http://lattes.cnpq.br/0155290293799371
    Valores anômalos são uns dos problemas presentes na era do Big Data. São necessárias técnicas robustas para a manipulação de informações corretas e incorretas que a cada instante são geradas. O uso de algoritmos de aprendizado de máquina não supervisionados dá a confiança de um bom desempenho nos resultados finais. Esta pesquisa utilizará dados meteorológicos de temperatura e umidade relativa do ar vindos do Instituto Nacional de Meteorologia, de Petrolina, com o DBSCAN (Density Based Spatial Clustering of Application with Noise) e o IF (Isolation Forest) implementados para detectar anomalias presentes nos dados, visto que anomalias meteorológicas podem aparecer por meio de defeitos, má configuração dos sensores e até mesmo efeitos climáticos extremos.
  • Imagem de Miniatura
    Item
    Avaliação de plataformas para o reconhecimento de placas veiculares brasileiras
    (2021-12-14) Amaral, Carlos Ivan Santos do; Garrozi, Cícero; http://lattes.cnpq.br/0488054917286587; http://lattes.cnpq.br/8099840025648951
    Com a crescente quantidade de veículos particulares no Brasil se faz cada vez mais necessário melhores métodos de gestão e fiscalização da frota veicular. As placas veiculares (PV) são objetos únicos e obrigatórios com o objetivo de identificar o veículo assim como seu proprietário. É recomendável que a coleta eficiente das informações presentes nas placas veiculares sejam realizadas por meio de sistemas automatizados para a detecção e reconhecimento de PV. Estes sistemas são fundamentais para se realizar a fiscalização e a gestão de diferentes atividades relacionadas ao tráfego de veículos. Neste sentido, este trabalho apresenta um estudo que identifica métodos de detecção e reconhecimento de PV com algoritmos baseados em aprendizagem de máquina. Para a produção desse experimento, sucedeu a coleta de um banco de imagens de veículos em praças de pedágio que estão localizadas no município de Cabo de Santo Agostinho - PE e fazem acesso ao Complexo Industrial Portuário Governador Eraldo Gueiros - SUAPE. O objetivo desse trabalho foi prover uma comparação entre o serviço de visão computacional da Microsoft Azure para detecção de objetos PV em conjunto com os serviços de Reconhecimento Óptico de Caracteres (Optical Character Recognition - OCR) da Google Vision com o algoritmo de Aprendizagem Profunda YOLO v4. O resultado do experimento expôs que em condições semelhantes de configurações em ambos dos modelos estudados, o YOLO v4 apresentou melhor desempenho, obtendo uma taxa de 92% de precisão na detecção e reconhecimento de placas veiculares.
  • Imagem de Miniatura
    Item
    Sistema para detecção de intrusão de botnets utilizando aplicações de machine learning
    (2021-12-13) Silva Neto, Francisco Queiroga da; Assad, Rodrigo Elia; http://lattes.cnpq.br/3791808485485116; http://lattes.cnpq.br/7900008638092251
    As ferramentas de comunicação e o avanço contínuo da Internet resultaram também na sofisticação de ferramentas e métodos para realizar ataques contra usuários e seus computadores, com recursos que facilitam atividades criminosas no ambiente cibernético. Dentre as ameaças cibernéticas, as botnets possuem características e vantagens que expandiram seu uso nos últimos anos, se tornando uma ferramenta empregada de forma abrangente por atacantes para conduzir ataques e obter o controle de diversos dispositivos conectados a redes de computadores. A forma como estas ameaças se comportam e são atualizadas traz diversos desafios para a área de detecção de intrusão. Nesse documento, é apresentado um estudo sobre a aplicação de técnicas de machine learning na detecção de botnets ao analisar fluxos de tráfego de rede. O estudo visa mostrar como técnicas de classificação de padrões podem ser aplicadas em sistemas de detecção de intrusão para identificar similaridades entre a infraestrutura de botnets, onde foram estudados trabalhos da literatura para abordar uma aplicação que visa melhorar os problemas relacionados às etapas de seleção de atributos e o processamento de dados, etapas cruciais em modelos de machine learning.
  • Imagem de Miniatura
    Item
    Uso de business intelligence como ferramenta de apoio em previsões de apostas de jogos de futebol
    (2021-12-16) Domingues, Marcela Soares; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/6238090449898774
    São muitos os brasileiros que atualmente recorrem a casas de apostas esportivas online, principalmente de futebol, como forma de investimento. Essa pratica vem sendo permitida no Brasil desde 2018, de acordo com a lei 13.756/18. Com a permissão liberada, somada a paixão do brasileiro pelo futebol, essa e uma área de investimento que vem crescendo muito desde então, atingindo altíssimos níveis de movimentação financeira, fazendo com que muitas pessoas recorram a essa pratica como garantia de fonte de renda extra ou fixa. Para investir em determinada aposta, o ideal e que se tenha uma noção dos riscos que você vai assumir. Apostar envolve chances de perda, e por isso, nem sempre o investimento valera à pena. Deve-se levar em conta algumas variáveis, como por exemplo dados históricos de times e jogadores de futebol. O uso de Business Intelligence (BI), que já e bastante utilizado por times de futebol para estudar comportamentos de outras equipes, também agrega bastante valor na hora de analisar as apostas nas quais se quer investir. Utilizando conceitos de BI, este trabalho apresenta o desenvolvimento de um Dashboard (painel de controle) contendo gráficos e relatórios, a fim de facilitar o processo de analise das apostas, além de um modelo de predição para prever a quantidade de gols em um jogo e o calculo de probabilidades de vitória de cada time em uma determinada partida.
  • Imagem de Miniatura
    Item
    Uso de Machine Learning para identificação de solicitação de teste de confirmação em projeto de teste de software
    (2022-06-06) Santos, Victor Leuthier dos; Monteiro, Cleviton Vinicius Fonsêca; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/9362573782715504; http://lattes.cnpq.br/8817589533156593
    Um estudo recente publicado pela Cambridge Judge Business School descobriu que os desenvolvedores perdem 620 milhões de horas por ano depurando falhas de software, o que acaba custando às empresas aproximadamente US$ 61 bilhões por ano. Este processo de depuração se torna ainda mais complexo e custoso às organizações quando o desenvolvedor não possui acesso aos recursos necessários. Utilizando a biblioteca TPOT como ferramenta de Auto Machine Learning para encontrar a melhor pipeline de um modelo foram analisados comentários do Jira afim de identificar pedidos de reteste por parte de desenvolvedores para os testadores de uma empresa. Foi construído um modelo para criação da ferramenta chamada “Preste atenção ao reteste ou Pay attention to retest” - PATRE, que utiliza Aprendizado de Máquina (Machine Learning) para identificação automática de pedido de teste de confirmação, otimizando assim a rotina dos profissionais envolvidos no desenvolvimento do software. O classificador gerado após 5 gerações foi o GradientBoostingClassifier e obteve uma precisão de 0.562, e um recall de 0.529, enquanto o f1-score encontrado foi de cerca de 0.545. Enquanto que o classificador escolhido pelo TPOT após 20 gerações foi o StackingEstimator obteve os seguintes resultados: precisão de 0.48, recall de 0.735 e f1-score de 0.581. Mostrando a influência direta do número de gerações na qualidade do modelo e do classificador final. Nenhuma informação ou dado confidencial foi utilizado para a realização deste trabalho.