Reestruturação ética na mineração de dados educacionais superiores: conformidade com a Lei Geral de Proteção de Dados
Data
2025-08-12
Autores
Lattes da Autoria
Orientação Docente
Lattes da Orientação Docente
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Este estudo aborda a reestruturação dos dados públicos educacionais do Ensino Superior promovida pelo INEP, alinhada à LGPD. Inspirado pelo estudo conduzido por Rodrigues (2021), que analisou concluintes de graduação, visando à construção de modelos de classificação utilizando fatores socioeconômicos e tempo estimado para conclusão da graduação em IES públicas. Este trabalho examina como as mudanças na configuração dos dados do ENADE e do Censo da Educação Superior afetam a realização de pesquisas científicas. Em resposta às mudanças nos microdados efetuadas pelo INEP, que impossibilitam a reprodução de trabalhos com finalidade de análise individual de discentes, este estudo direcionou seu enfoque para as informações dos cursos e tempo de graduação dos discentes nesses cursos, considerando medidas de tendência central. Consideraram-se os anos de 2016 a 2018 para dados do ENADE e 2018 para Censo da Educação Superior. Utilizou-se o processo de Knowledge Discovery in Database (KDD) ao longo do trabalho, desde a seleção até a interpretação de dados. Usando 5.170 registros de cursos, técnicas do Aprendizado de Máquina Supervisionado foram empregadas para construção de modelos de regressão e classificação. Essa abordagem visa superar os desafios éticos e metodológicos da reestruturação dos dados, garantindo a utilidade dos dados para fins de pesquisa científica. Resultados mostram que as mudanças permitiram o uso eficaz de modelos de Aprendizado de Máquina. O estudo destaca a importância da ética nos dados educacionais e na inteligência artificial, garantindo a proteção da privacidade e a responsabilidade na utilização dos dados para tomada de decisões futuras.
Resumo em outro idioma
This study addresses the restructuring of public educational data in Higher Education promoted by INEP, aligned with LGPD. Inspired by the study conducted by Rodrigues (2021), which analyzed undergraduate graduates, aiming to construct classification models using socioeconomic factors and estimated time for graduation completion in public HEIs. This work examines how changes in the configuration of ENADE and Higher Education Census data affect the conduct of scientific research. In response to changes in microdata made by INEP, which make it impossible to reproduce works for the purpose of individual analysis of students, this study directed its focus to course information and graduation time of students in these courses, considering measures of central tendency. The years 2016 to 2018 were considered for ENADE data and 2018 for the Higher Education Census. The Knowledge Discovery in Database (KDD) process was used throughout the work, from data selection to interpretation. Using 5,170 course records, techniques of Supervised Machine Learning were employed for the construction of regression and classification models. This approach aims to overcome the ethical and methodological challenges of data restructuring, ensuring the utility of data for scientific research purposes. Results show that the changes allowed the effective use of Machine Learning models. The study highlights the importance of ethics in educational data and artificial intelligence, ensuring the protection of privacy and responsibility in the use of data for future decision-making.
Descrição
Artigo publicado primeiramente na REDOC: Revista Docência e Cibercultura, Rio de Janeiro, v. 9, n. 1, p. 1-28, 2025. https://www.e-publicacoes.uerj.br/re-doc/article/view/83226
Referência
VASCONCELOS, Taciana dos Santos. Reestruturação ética na mineração de dados educacionais superiores: conformidade com a Lei Geral de Proteção de Dados. 2025. 26 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2025.
Identificador dARK
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como openAccess

