Aplicação do Algoritmo de Curvas Principais k-Segmentos na Classificação do Desempenho Acadêmico dos Estudantes no ENEM
Dados Educacionais. Desempenho Acadêmico. Enem. Aprendizado de Máquina. Reconhecimento de Padrões. Curvas Principais. K-segmentos.
O problema de prever o desempenho dos estudantes no ENEM tem sido investigado por diversos autores, porém, muitos não têm explorado outras técnicas de Aprendizagem de Máquina (ML), como as Curvas Principais (CP). Nos últimos anos, o método de CP tem sido aplicado em diversas áreas, demonstrando potencial em problemas de modelagem, previsão e classificação. Este trabalho propõe avaliar o desempenho desse método em comparação com algoritmos de ML, como Multilayer Perceptron (MLP), Random Forest (RF) e Support Vector Machine (SVM), aplicados à classificação do desempenho dos estudantes que participaram do ENEM. A metodologia compreende as etapas de preparação, seleção de características com técnicas de redução de dimensionalidade, balanceamento e transformação dos dados, além de métodos para otimizar os hiperparâmetros dos modelos, como o Grid-Search. As classificações serão avaliadas por meio de métricas como acurácia, F1-Score, precisão, recall e coeficiente de Kappa. Nos resultados preliminares, foi realizada uma análise exploratória das bases de dados do ENEM de 2019 a 2022 utilizando o algoritmo de aprendizado não supervisionado K-Means. A investigação permitiu identificar dois grupos principais de estudantes, diferenciados pelos níveis de desempenho no exame: um grupo com desempenho abaixo do esperado e outro com desempenho satisfatório. A análise revelou ainda desigualdades sociais relevantes, destacando que fatores como tipo de escola, cor/raça e renda familiar mensal exercem influência significativa sobre o desempenho dos estudantes. Diante disso, a utilização de métodos de aprendizado supervisionado mostra-se promissora para a classificação do desempenho acadêmico dos estudantes.