TCC - Bacharelado em Sistemas da Informação (Sede)
URI permanente para esta coleçãohttps://arandu.ufrpe.br/handle/123456789/427
Navegar
4 resultados
Resultados da Pesquisa
Item Comparação de técnicas de redução de dimensionalidade aplicadas à clusterização de dados do censo da educação superior(2025-08-08) Mercês, Thamires Lopes das; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/8266687622316308A grande quantidade de informações coletadas em censos da educação e avaliações nacionais demanda métodos eficientes para extração de conhecimento, permitindo identificar padrões e tendências relevantes. Nesse contexto, a clusterização se destaca como uma ótima técnica para segmentar e interpretar grandes volumes de dados educacionais, sendo o K-Means um dos algoritmos mais utilizados devido à sua simplicidade e eficiência. No entanto, quando aplicado a conjuntos de dados de alta dimensionalidade, seu desempenho pode ser comprometido, tornando necessário o uso de técnicas de redução de dimensionalidade como Principal Component Analysis (PCA), t-Distributed Stochastic Neighbor Embedding (t-SNE) e Uniform Manifold Approximation and Projection (UMAP). Este trabalho investiga o impacto dessas técnicas na qualidade dos agrupamentos gerados pelo K-Means em uma base de dados composta pela junção dos Microdados do Censo da Educação Superior de 2022 e os indicadores de qualidade educacional Conceito Enade e CPC. A análise é realizada utilizando o índice de silhueta como métrica de avaliação e comparando o tempo de execução de cada método. Com dois componentes, o PCA superou o t-SNE e o UMAP na maioria dos testes. Com três componentes, o PCA teve melhor desempenho que o t-SNE em todos os testes, mas ficou equilibrado com o UMAP, onde foi superior em cinco dos nove cenários. Observou-se, ainda, que a quantidade de clusters teve influência relevante nos resultados, especialmente no desempenho crescente do UMAP à medida que se aumentava o número de clusters. O UMAP e o t-SNE mostraram resultados equilibrados com dois componentes. Porém, com três componentes, o UMAP se mostrou melhor em todos os cenários. Além disso, o PCA foi a técnica mais rápida em todos os cenários avaliados, superando tanto o t-SNE quanto o UMAP em termos de tempo de execução.Item Reestruturação ética na mineração de dados educacionais superiores: conformidade com a Lei Geral de Proteção de Dados(2025-08-12) Vasconcelos, Taciana dos Santos; Gouveia, Roberta Macêdo Marques; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/8691839294756407Este estudo aborda a reestruturação dos dados públicos educacionais do Ensino Superior promovida pelo INEP, alinhada à LGPD. Inspirado pelo estudo conduzido por Rodrigues (2021), que analisou concluintes de graduação, visando à construção de modelos de classificação utilizando fatores socioeconômicos e tempo estimado para conclusão da graduação em IES públicas. Este trabalho examina como as mudanças na configuração dos dados do ENADE e do Censo da Educação Superior afetam a realização de pesquisas científicas. Em resposta às mudanças nos microdados efetuadas pelo INEP, que impossibilitam a reprodução de trabalhos com finalidade de análise individual de discentes, este estudo direcionou seu enfoque para as informações dos cursos e tempo de graduação dos discentes nesses cursos, considerando medidas de tendência central. Consideraram-se os anos de 2016 a 2018 para dados do ENADE e 2018 para Censo da Educação Superior. Utilizou-se o processo de Knowledge Discovery in Database (KDD) ao longo do trabalho, desde a seleção até a interpretação de dados. Usando 5.170 registros de cursos, técnicas do Aprendizado de Máquina Supervisionado foram empregadas para construção de modelos de regressão e classificação. Essa abordagem visa superar os desafios éticos e metodológicos da reestruturação dos dados, garantindo a utilidade dos dados para fins de pesquisa científica. Resultados mostram que as mudanças permitiram o uso eficaz de modelos de Aprendizado de Máquina. O estudo destaca a importância da ética nos dados educacionais e na inteligência artificial, garantindo a proteção da privacidade e a responsabilidade na utilização dos dados para tomada de decisões futuras.Item Uso de análise de sobrevivência como ferramenta na obtenção de indicadores de permanência no ensino superior(2024-03-06) Silva, Lhaíslla Eduarda Cavalcanti Rodrigues da; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/7477398253297436Este trabalho propõe uma abordagem integrada de técnicas estatísticas, Business Intelligence e conceitos de Data Science para criar um modelo de análise de sobrevivência visando compreender a permanência dos estudantes no ensino superior. Utilizando cursos de computação como estudo de caso, diferentes grupos são comparados para calcular a probabilidade de permanência dos discentes até o termino do curso. O trabalho faz uso da plataforma SABIA para dar suporte à gestão orientada a dados, destacando a importância das ferramentas tecnológicas na análise acadêmica. Os resultados revelam padrões entre os cursos de uma mesma área ao considerar a evasão como evento de interesse, apresentando quedas mais acentuadas nos períodos iniciais, especialmente em momentos críticos, como no segundo semestre, que apresentam probabilidades de permanência mais baixas em relação ao primeiro semestre, assim como o a modalidade de ingresso Outros que nos períodos finais refletem ocorrência da evasão, evidenciando a importância de intervenções personalizadas para evitar a evasão e desperdícios de recursos, contribuindo para uma gestão mais eficiente e eficaz das instituições de ensino superior.Item An implementation of a mathematical-computational method for the detection and treatment of financial outliers in higher education(2023-09-06) Freitas, Nathan Cavalcante; Gouveia, Roberta Macêdo Marques; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/1613649528791400O Censo da Educação Superior ocorre anualmente, coletando dados de Instituições de Ensino Superior (IES) no Brasil. Diferentes fatores podem levar a anomalias ou outliers em alguns destes dados coletados. Este trabalho propõe um método matemático-computacional para detectar e tratar valores financeiros atípicos das IES. Para tanto, adota-se as análises univariadas e bivariadas dos dados. Foram analisados dados de despesas e receitas das IES do Censo de 2016 a 2019. Esta análise revelou que 204 de 2.224 IES, aproximadamente 10%, reportaram algum dado atípico.
