Explorando Curvas Principais com a Meta-Heurística Lobo Cinzento para a Classificação
do Desempenho Acadêmico dos Estudantes no ENEM
Dados Educacionais. Desempenho Acadêmico. Enem. Aprendizado de Máquina. Reconhecimento de Padrões. Curvas Principais. K-segmentos.
A educação é fundamental para o desenvolvimento de um país e, no Brasil, destaca-se a necessidade de melhorias que podem ser impulsionadas pelo uso da Tecnologia da Informação. Através do Exame Nacional do Ensino Médio (ENEM), maior exame educacional do país, que é uma das principais portas de entrada para o ensino superior, é possível avaliar a qualidade da educação quanto à geração de indicadores educacionais por meio do desempenho dos estudantes no exame. Para prever o desempenho dos estudantes no exame, técnicas de Aprendizagem de Máquina (ML) têm sido cada vez mais utilizadas nesse contexto, permitindo identificar padrões de desempenho, possíveis irregularidades e personalizar estratégias pedagógicas. O problema de prever o desempenho dos estudantes no ENEM tem sido investigado por diversos autores, porém, muitos não têm explorado outras técnicas de ML, como as Curvas Principais (CP). Nos últimos anos, o método de CP tem sido aplicado em diversas áreas, demonstrando potencial em problemas de classificação. Nesse contexto, esta pesquisa tem como objetivo aplicar e aprimorar o método de extração de CP K-segmentos para a classificação do desempenho acadêmico dos estudantes que realizaram o ENEM 2023. Além disso, aplicar o método de otimização de hiperparâmetros Grey Wolf Optimizer (GWO) para determinar automaticamente os valores dos hiperparâmetros do método de CP K-segmentos, o qual determinar de forma manual é uma tarefa complexa. A metodologia compreende as etapas de preparação, técnicas de redução de dimensionalidade, balanceamento e transformação dos dados, além da técnica GWO para otimizar os hiperparâmetros dos modelos. Os métodos de classificação foram avaliados por meio de métricas como acurácia, F1-Score, precisão, recall e coeficiente de Kappa. Nos experimentos realizados, a abordagem de CP apresentou resultados competitivos em relação aos métodos da literatura comparados (Extreme Learning Machine, Naive Bayes e Random Forest). Assim, a abordagem de CP mostrou-se um método promissor como suporte analítico para estudos educacionais, especialmente quando combinada a estratégias adequadas de técnicas de redução de dimensionalidade e otimização.