DETECÇÃO DE DRIFT E AVALIAÇÃO DE MODELOS PARA O APRENDIZADO ONLINE
Deriva de conceito; aprendizado de máquina online; fluxos de dados; pacote R; detecção de deriva.
O aprendizado de máquina online opera sobre fluxos contínuos de dados em cenários nos quais o processo gerador dos dados pode variar ao longo do tempo, fenômeno denominado deriva de conceito (concept drift). Esse fenômeno viola a hipótese de que os padrões aprendidos a partir dos dados históricos permanecem estáveis, o que ocasiona perda de desempenho dos modelos preditivos em produção. Embora ecossistemas como Python e Java disponham de bibliotecas consolidadas para detecção de deriva, o ambiente R ainda carece de uma infraestrutura unificada que integre esses métodos ao ciclo de modelagem preditiva sob uma semântica funcional, lacuna que motiva este trabalho. O presente projeto de pesquisa de mestrado tem como objetivo principal desenvolver, implementar e avaliar técnicas de monitoramento e detecção de deriva de conceito em fluxos contínuos de dados, provendo infraestrutura computacional em R para suporte à manutenção de modelos em tempo real. Para tanto, realiza-se uma revisão da literatura sobre os tipos de deriva de conceito e seus métodos de detecção, seguida do desenvolvimento de um pacote R estruturado sob os princípios do tidyverse, com validação por simulações computacionais em cenários controlados de deriva e avaliação comparativa com implementações de referência. Como resultados parciais, são apresentadas métricas de desempenho dos detectores implementados sobre diferentes bases de dados reais e sintéticas, com indicações preliminares acerca do comportamento dos algoritmos frente a distintos tipos de deriva e padrões de transição.