MODELOS DE CLASSIFICAÇÃO EM DADOS FINANCEIROS: COMPARAÇÃO DE DESEMPENHOS EM CASOS DE CRIME DE SMURFING
Fraudes financeiras. Machine Learning. Smurfing
A dificuldade de identificação de fraudes financeiras possui relação direta com o avanço tecnológico pois as novas possibilidades de formas de transações financeiras geram por sua vez novas formas de agentes fraudadores atuarem. Neste contexto, o objetivo deste estudo é explorar a teoria de seis modelos de machine learning (ML), além de compará-los por meio de métricas específicas de avaliação de desempenho. Ainda, este trabalho desenvolve um algoritmo de detecção de um tipo de crime financeiro conhecido como smurfing. Tal algoritmo não utiliza técnicas de ML, mas objetiva ranquear transações financeiras como possíveis fraudes, através de características analisadas de forma agrupada. Devido à impossibilidade de uso de dados financeiros reais, por causa de sua confidencialidade, este trabalho é desenvolvido utilizando dados simulados. Foram gerados dois diferentes cenários, ambos altamente desbalanceados, em que o comportamento das fraudes financeiras varia de acordo com parâmetros específicos. Os modelos de classificação escolhidos se referem ao modelo logístico, Sistemas Baseados em Regras Fuzzy, Redes Neurais Artificiais, Random Forest, Extreme Gradient Boosting e Support Vector Machine. A comparação dos modelos nos diferentes cenários foi feita através de uma combinação das métricas Area Under de Curve, Recall e Fb , tendo em vista o desbalanceamento dos dados. Os resultados apontaram que os modelos Random Forest e Extreme Gradient Boosting obtiveram os melhores desempenhos, entretanto o uso dos demais modelos para tarefas similares não deve ser descartado, uma vez que a inclusão de variáveis explicativas, ou ainda, o próprio uso de dados reais pode fazer com que os desempenhos de cada modelo sejam diferentes.