Bacharelado em Sistemas de Informação (Sede)

URI permanente desta comunidadehttps://arandu.ufrpe.br/handle/123456789/12


Siglas das Coleções:

APP - Artigo Publicado em Periódico
TAE - Trabalho Apresentado em Evento
TCC - Trabalho de Conclusão de Curso

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 10 de 13
  • Imagem de Miniatura
    Item
    Comparação de técnicas de redução de dimensionalidade aplicadas à clusterização de dados do censo da educação superior
    (2025-08-08) Mercês, Thamires Lopes das; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/8266687622316308
    A grande quantidade de informações coletadas em censos da educação e avaliações nacionais demanda métodos eficientes para extração de conhecimento, permitindo identificar padrões e tendências relevantes. Nesse contexto, a clusterização se destaca como uma ótima técnica para segmentar e interpretar grandes volumes de dados educacionais, sendo o K-Means um dos algoritmos mais utilizados devido à sua simplicidade e eficiência. No entanto, quando aplicado a conjuntos de dados de alta dimensionalidade, seu desempenho pode ser comprometido, tornando necessário o uso de técnicas de redução de dimensionalidade como Principal Component Analysis (PCA), t-Distributed Stochastic Neighbor Embedding (t-SNE) e Uniform Manifold Approximation and Projection (UMAP). Este trabalho investiga o impacto dessas técnicas na qualidade dos agrupamentos gerados pelo K-Means em uma base de dados composta pela junção dos Microdados do Censo da Educação Superior de 2022 e os indicadores de qualidade educacional Conceito Enade e CPC. A análise é realizada utilizando o índice de silhueta como métrica de avaliação e comparando o tempo de execução de cada método. Com dois componentes, o PCA superou o t-SNE e o UMAP na maioria dos testes. Com três componentes, o PCA teve melhor desempenho que o t-SNE em todos os testes, mas ficou equilibrado com o UMAP, onde foi superior em cinco dos nove cenários. Observou-se, ainda, que a quantidade de clusters teve influência relevante nos resultados, especialmente no desempenho crescente do UMAP à medida que se aumentava o número de clusters. O UMAP e o t-SNE mostraram resultados equilibrados com dois componentes. Porém, com três componentes, o UMAP se mostrou melhor em todos os cenários. Além disso, o PCA foi a técnica mais rápida em todos os cenários avaliados, superando tanto o t-SNE quanto o UMAP em termos de tempo de execução.
  • Imagem de Miniatura
    Item
    Reestruturação ética na mineração de dados educacionais superiores: conformidade com a Lei Geral de Proteção de Dados
    (2025-08-12) Vasconcelos, Taciana dos Santos; Gouveia, Roberta Macêdo Marques; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/8691839294756407
    Este estudo aborda a reestruturação dos dados públicos educacionais do Ensino Superior promovida pelo INEP, alinhada à LGPD. Inspirado pelo estudo conduzido por Rodrigues (2021), que analisou concluintes de graduação, visando à construção de modelos de classificação utilizando fatores socioeconômicos e tempo estimado para conclusão da graduação em IES públicas. Este trabalho examina como as mudanças na configuração dos dados do ENADE e do Censo da Educação Superior afetam a realização de pesquisas científicas. Em resposta às mudanças nos microdados efetuadas pelo INEP, que impossibilitam a reprodução de trabalhos com finalidade de análise individual de discentes, este estudo direcionou seu enfoque para as informações dos cursos e tempo de graduação dos discentes nesses cursos, considerando medidas de tendência central. Consideraram-se os anos de 2016 a 2018 para dados do ENADE e 2018 para Censo da Educação Superior. Utilizou-se o processo de Knowledge Discovery in Database (KDD) ao longo do trabalho, desde a seleção até a interpretação de dados. Usando 5.170 registros de cursos, técnicas do Aprendizado de Máquina Supervisionado foram empregadas para construção de modelos de regressão e classificação. Essa abordagem visa superar os desafios éticos e metodológicos da reestruturação dos dados, garantindo a utilidade dos dados para fins de pesquisa científica. Resultados mostram que as mudanças permitiram o uso eficaz de modelos de Aprendizado de Máquina. O estudo destaca a importância da ética nos dados educacionais e na inteligência artificial, garantindo a proteção da privacidade e a responsabilidade na utilização dos dados para tomada de decisões futuras.
  • Imagem de Miniatura
    Item
    Implementação de um sistema mobile colaborativo para acompanhamento do quadro de pacientes com esclerose múltipla por meio de análise de sentimento
    (2024-10-02) Araujo, Paula Priscila da Cruz; Gouveia, Roberta Macêdo Marques; Tschá, Elizabeth Regina; http://lattes.cnpq.br/9598413463162759; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/0280090820230057
    O estudo visa desenvolver um sistema mobile para facilitar o acompanhamento de pacientes acometidos por Esclerose Múltipla (EM) baseado no Toolkit Human-Centered Design (HCD) para atender as necessidades dos pacientes. O aplicativo permite que eles registrem e monitorarem emoções, sintomas e tratamentos, oferecendo relatórios mensais e alertas personalizados. Para a análise de sentimentos, foram utilizados os algoritmos de aprendizado de máquina XGBoost e Naive Bayes, sendo o XGBoost demonstrando melhor desempenho, com uma acurácia de 87,56% e um F1-Score de 0,876, enquanto o Naive Bayes, obteve 62,25% de acurácia e um F1-Score de 0,524. Os resultados indicam a eficácia da ferramenta no acompanhamento emocional e médico, contribuindo para a melhoria na qualidade de vida.
  • Imagem de Miniatura
    Item
    Análise de sentimentos em reviews de jogos digitais da Plataforma Steam
    (2024-09-26) Albuquerque, Júlia de Melo; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584
    A análise de sentimento é uma área que investiga as expressões emocionais da linguagem humana, buscando compreender as necessidades e opiniões subjacentes expressas em textos. Sua complexidade existe na habilidade de discernir não apenas o conteúdo textual, mas também as matrizes emocionais implícitas. Com o avanço tecnológico, a facilidade de expressar a opinião publicamente se dissemina por diversos meios, sendo campo dos jogos online uma vertente que atrai inúmeras publicações de jogadores sobre os diversos títulos disponíveis. No entanto, essa diversidade de públicos e temas torna desafiador compreender o sentimento expresso que permeia esse universo. O objetivo deste estudo é aplicar técnicas de análise de sentimento em avaliações de jogos digitais, adotando uma abordagem focada em algoritmos de aprendizado de máquina supervisionados e bibliotecas pre-polarizadas, a fim de identificar o melhor caminho de classificação capaz de discernir os sentimentos expressos pelos usuários nas avaliações. Nessa operação está sendo considerada uma abordagem com todas as opiniões e outra focada em gênero específico de cada jogo. Essa análise foi conduzida por meio da exploração de dados provenientes de uma empresa de distribuição de jogos online (Steam), seguindo com uma preparação desses dados devido às particularidades presentes nos registros. Os resultados revelam que os modelos de aprendizado de máquina superam as abordagens tradicionais, como a utilização da biblioteca VADER, apresentando uma precisão maior em aproximadamente 10% nas capturas, observou-se uma diferença de 20% a mais em métricas como recall e F1-score. Esse estudo representa uma contribuição analítica para a área da análise de sentimento, destacando a capacidade do modelo construído em lidar com a complexidade da linguagem humana.
  • Imagem de Miniatura
    Item
    An implementation of a mathematical-computational method for the detection and treatment of financial outliers in higher education
    (2023-09-06) Freitas, Nathan Cavalcante; Gouveia, Roberta Macêdo Marques; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/1613649528791400
    O Censo da Educação Superior ocorre anualmente, coletando dados de Instituições de Ensino Superior (IES) no Brasil. Diferentes fatores podem levar a anomalias ou outliers em alguns destes dados coletados. Este trabalho propõe um método matemático-computacional para detectar e tratar valores financeiros atípicos das IES. Para tanto, adota-se as análises univariadas e bivariadas dos dados. Foram analisados dados de despesas e receitas das IES do Censo de 2016 a 2019. Esta análise revelou que 204 de 2.224 IES, aproximadamente 10%, reportaram algum dado atípico.
  • Imagem de Miniatura
    Item
    Técnica de clusterização aplicada à análise de perfis socioeconômicos de estudantes concluintes de cursos de computação
    (2022-07-03) Souza, Clarissa Cordeiro de; Gouveia, Roberta Macêdo Marques; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/1046530929912898
    As diferentes classes sociais e econômicas de estudantes de cursos de graduação podem impactar no percurso de formação acadêmica e na permanência de tais alunos nas instituições de ensino superior brasileiras. Este trabalho de conclusão de curso aplicou uma técnica de mineração de dados chamada de clusterização K-means aos microdados do Exame Nacional de Desempenho dos Estudantes (ENADE) do ano de 2017, exame aplicado pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep), com o objetivo de analisar os contextos que separam os concluintes dos diversos cursos de computação, seja bacharelado ou licenciatura, utilizando os dados socioeconômicos. Os resultados apontaram para quatro grandes grupos de estudantes e, a partir das suas análises é possível elencar um perfil de estudante concluinte de computação no ano analisado, visto que os clusters apresentam várias características em comum, tais como: a maioria dos estudantes são do sexo masculino, solteiros, de cor branca, optaram pela modalidade presencial, cursaram o ensino médio em escolas públicas, entre outras. Contudo algumas características foram encontradas em grupos específicos, como por exemplo existe um grupo de concluintes que são de instituições públicas de turno integral.
  • Imagem de Miniatura
    Item
    Análise de sentimentos em Tweets relacionados ao desmatamento da Floresta Amazônica
    (2021-12-17) Silva, Vinicius José Paes e; Andrade, Ermeson Carneiro de; http://lattes.cnpq.br/2466077615273972; http://lattes.cnpq.br/7437953784606274
    A Floresta Amazônica está sendo devastada no maior ritmo dos últimos anos. Em 2021, Amazônia registra o maior acúmulo de desmatamento em 5 anos, passando de 13 mil km2 entre agosto de 2020 a julho de 2021. Um aumento de 22% no desmatamento, em relação ao mesmo período do ano anterior, sendo o maior número desde 2006. Embora muitos trabalhos abordem o tema de desmatamento, nenhum deles foca em analisar os sentimentos da população brasileira com relação ao tema. Este trabalho apresenta uma análise dos sentimentos dos usuários brasileiros do Twitter relacionados ao desmatamento da Floresta Amazônica através da mineração de texto do Twitter e busca entender como os usuários brasileiros opinam e dialogam sobre a desmatamento da Floresta Amazônica. Os resultados revelam que os usuários brasileiros tendem a reagir a acontecimentos relacionados ao desmatamento da floresta Amazônica no Twitter e, que em sua maioria, os usuários apresentam sentimento negativo sobre o tema, alcançando picos de aproximadamente 60% dos tweets em determinado momento.
  • Imagem de Miniatura
    Item
    Raspagem de Dados Jurídicos Utilizando Scrapy
    (2021-12-20) Barbosa, Jadiel Eudes Mendonça; Bocanegra, Silvana; http://lattes.cnpq.br/4596111202208863; http://lattes.cnpq.br/8044959053132773
    A raspagem de dados é uma técnica computacional na qual através de um programa é realizada extração de dados que estão escondidos em páginas da web. Dessa forma, este trabalho acadêmico tem como objetivo utilizar técnicas de raspagem de dados para extrair dados de processos jurídicos dos sites dos tribunais com o intuito de auxiliar empresas contratantes a tomarem decisões estratégicas junto a seus departamentos jurídicos.
  • Imagem de Miniatura
    Item
    Técnicas de aprendizado de máquina para descoberta de conhecimento sobre dados abertos do ensino superior público brasileiro
    (2021-12-10) Rodrigues, Ebony Marques; Gouveia, Roberta Macêdo Marques; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/5929185711837204
    Este trabalho trata do uso de técnicas dos métodos de Knowledge Discovery in Databases — KDD — e Cross Industry Standard Process for Data Mining — CRISPDM — sobre bases de dados educacionais disponibilizadas pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira — INEP — visando à descoberta de conhecimento que permita a identificação, assim como a compreensão, do contexto de formação de discentes de Instituições de Ensino Superior — IES — públicas brasileiras. Três cenários de mineração de dados são observados, tendo em vista métodos do Aprendizado de Máquina Supervisionado e do Aprendizado de Máquina Não Supervisionado, abrangendo experimentos de classificação, agrupamento e associação de dados. O primeiro cenário, que contempla dados de concluintes de cursos de graduação de graus bacharelado e licenciatura, objetiva prever o tempo aproximado de conclusão da graduação, considerando informações socioeconômicas dos estudantes, por meio de 16 modelos de classificação construídos com o emprego de algoritmos de Árvore de Decisão, Floresta Aleatória, XGBoost e Rede Neural Perceptron Multicamadas. Os modelos XGBoost tiveram os melhores resultados em todos os experimentos. Por sua vez, o segundo cenário utiliza o algoritmo KMeans para a execução de um agrupamento de IES públicas que, a partir da análise de quatro grupos obtidos com a consideração de informações sobre despesas, quantidades de docentes e técnicos, localização e categoria administrativa das IES, entre outras, possibilitou a identificação de similaridades e dissimilaridades entre as instituições. Os grupos em questão, além de dados utilizados no primeiro cenário, que incluem informações sobre os estudantes, como faixa etária, tempo de graduação e forma de ingresso na graduação, observando se esse ocorreu por meio de políticas de ação afirmativa ou de inclusão social, entre outras, são considerados nos experimentos do terceiro cenário, com o uso do algoritmo Apriori, para a geração de regras de associação que podem suportar a descoberta de conhecimento no âmbito do ensino superior público brasileiro.
  • Imagem de Miniatura
    Item
    Uma proposta para agrupamento automático de horas de trabalho
    (2022-06-03) Félix, Matheus Rodrigues de Souza; Monteiro, Cleviton Vinicius Fonsêca; Lima, Rinaldo José de; http://lattes.cnpq.br/7645118086647340; http://lattes.cnpq.br/9362573782715504; http://lattes.cnpq.br/6209976572558281
    O registro de horas utilizadas em projetos é uma tarefa recorrente no dia-a-dia de grande parte dos profissionais. Esta tarefa é crucial em processos relacionados à administração e recursos humanos para análise de alinhamento com cronogramas e produtividade. Entretanto, o preenchimento correto e em prazo são pontos importantes para que o ciclo de realização de atividades e registro seja efetivo. Quando o profissional trabalha em diversos projetos de forma alternada no seu cotidiano, o registro dessas atividades tende a ganhar imprecisão. Neste artigo, será apresentada uma proposta para possibilitar a automatização do registro de horas através do uso de técnicas de mineração de texto. O objetivo deste projeto é criar uma abordagem que auxilie o usuário reduzindo horas diárias registrando atividades.