PREVISÃO DO RISCO DE INSOLVÊNCIA EMPRESARIAL NO BRASIL: UMA ABORDAGEM ESTATÍSTICA E DE APRENDIZADO DE MÁQUINA
Esta dissertação teve como objetivo geral analisar o desempenho preditivo de técnicas estatísticas e de aprendizado de máquina na previsão do risco de insolvência de empresas brasileiras não financeiras listadas na Brasil, Bolsa, Balcão (B3), no período de 2010 a 2024. A pesquisa foi estruturada em três estudos empíricos que aplicaram diferentes metodologias a um conjunto de indicadores financeiros tradicionais e dinâmicos, relacionados principalmente à liquidez, endividamento, rentabilidade e gestão do capital de giro, buscando identificar as variáveis de maior capacidade explicativa na classificação de empresas solventes e insolventes. O primeiro estudo empregou a Análise Discriminante, que apresentou desempenho robusto, com AUC de 0,955 e acurácia de 93,3% na amostra de teste, evidenciando a relevância combinada de indicadores tradicionais e do Modelo Dinâmico de Fleuriet na separação dos grupos solvente e insolvente. O segundo estudo utilizou Regressão Logística com dados em painel, estimada por Efeitos Aleatórios, permitindo captar a variação entre empresas, a evolução temporal do risco e os efeitos individuais não observados. O modelo alcançou AUC de 0,915 e acurácia de 90,2%, destacando a importância de indicadores associados à estrutura de capital, liquidez, capital de giro e disponibilidade financeira. O terceiro estudo, de caráter comparativo, avaliou seis algoritmos de aprendizado de máquina, sendo eles a Decision Tree, Random Forest, Support Vector Machine, K-Nearest Neighbors, Neural Networks e Extreme Gradient Boosting, revelando a superioridade das técnicas ensemble. O modelo desenvolvido por meio do Extreme Gradient Boosting obteve o melhor desempenho global, com AUC de 0,981 e acurácia de 95,4%, seguido de perto pelo Random Forest, com AUC de 0,978 e acurácia de 95,2%, evidenciando que indicadores de rentabilidade, estrutura de capital e liquidez, em conjunto, explicam a situação de insolvência empresarial. De forma integrada, os resultados mostram que tanto abordagens estatísticas quanto modelos de aprendizado de máquina são eficazes para antecipar a insolvência empresarial no contexto brasileiro, enquanto a análise de importância das variáveis confirma que indicadores tradicionais e dinâmicos relacionados à liquidez, endividamento, rentabilidade e capital de giro são determinantes na previsão e antecipação da insolvência. Sob a perspectiva científica, o estudo contribui ao incorporar múltiplas técnicas, utilizar uma amostra ampla e recente e integrar indicadores tradicionais e dinâmicos ao campo de estudos sobre insolvência, preenchendo lacunas na literatura nacional. No âmbito social, gerencial e institucional, os modelos propostos oferecem subsídios para melhorar políticas de crédito, avaliação de investimentos, renegociação de dívidas e práticas de monitoramento preventivo da saúde financeira, apoiando gestores, credores, investidores e órgãos reguladores na mitigação do risco de insolvência e na promoção da estabilidade econômica.