PROPOSIÇÃO DE TESTES BOOTSTRAP PARA IGUALDADE DE MATRIZES DE CORRELAÇÃO
Matrizes de correlação. Bootstrap não-paramétrico. Avaliação de teste. Simulação Monte Carlo.
A comparação de matrizes de correlação desempenha um papel fundamental em diversas áreas, como estatística, ciência de dados e análise multivariada, pois permite investigar a estrutura de dependência entre variáveis em diferentes populações. A correlação linear é amplamente utilizada para compreender relações entre conjuntos de dados, mas a simples observação dos coeficientes par a par não é suficiente para avaliar, de forma estatística, a equivalência de duas ou mais matrizes de correlação. Nesses casos, testes assintóticos tradicionais mostram-se extremamente liberais, sobretudo em amostras pequenas ou em cenários de alta dimensionalidade. Nesse caso, o método bootstrap se destaca como uma alternativa robusta e eficiente, cuja principal vantagem é a não necessidade do conhecimento prévio da distribuição de probabilidade populacional. Diante disso, este trabalho tem como objetivo propor testes para a igualdade de matrizes de correlação em populações multivariadas, não necessariamente normais, e com capacidade de lidar com outliers e alta dimensionalidade, por meio de métodos bootstrap não paramétricos. Para tal, foram estudados os principais métodos existentes na literatura para a hipótese de homogeneidade de I matrizes de correlação populacionais e propostas versões bootstrap dos testes de Jennrich, Kullback, MPCBT (Maximum Pearson Correlation Bootstrap Test), MSCBT (Maximum Spearman Correlation Bootstrap Test), MSEDBT (Maximum Spearman Euclidean Distance Bootstrap Test) e MPEDBT (Maximum Pearson Euclidean Distance Bootstrap Test). O desempenho desses testes foi avaliado por meio de simulações de Monte Carlo, considerando a taxa de erro tipo I e o poder como medidas de desempenho, sob diferentes cenários de baixa e alta dimensionalidade e na presença de outliers. Os resultados mostraram que os testes MSEDBT e MPEDBT apresentaram os melhores desempenhos, com controle da taxa de erro tipo I, ``muito bom'' e ``bom'', respectivamente, especialmente para tamanhos amostrais maiores (n=50 e 80). Na presença de outliers, os testes MSEDBT e MSCBT foram os que melhor controlaram a taxa de erro tipo I para amostras maiores, tanto em baixa quanto em alta dimensionalidade. Assim, considerando seu desempenho superior em todos os cenários e configurações estudadas, o teste MSEDBT pode ser amplamente recomendado para testes de igualdade entre matrizes de correlação.