Proposição de testes robustos para detecção de outliers multivariados baseados em resíduos da análise de componentes principais
comedian
simulação Monte Carlo
robustez
Em diversas pesquisas nos deparamos com amostras aleatórias de variáveis univariados ou multivariados. Em muitos casos a existência de observações denominadas de outliers são responsáveis por sérios comprometimento da inferência estatística. A detecção desses outliers se torna de extrema importância nestes casos, uma vez que as inferências realizadas podem levar à conclusões equivocadas. Em um conjunto de dados multivariados a detecção de outliers é mais complexa que nos casos univariados em razão da dimensão ser definida além da reta real. Vários testes existem para a detecção dos outliers multivariados, mas todos são dependentes de distribuições assintóticas, distribuições normais e são extremamente influenciados pela presença dos próprios outliers que se pretende identificar e excluir da amostra aleatória. Nesse sentido, o objetivo deste trabalho é propor testes assintóticos robustos baseados nos estimadores comedian e em resíduos da análise de componentes principais para detectar outliers multivariados. Também objetivou-se avaliar os desempenhos dos testes propostos e existentes avaliados no presente trabalho por meio de simulação Monte Carlo, mensurando a capacidade dos testes de identificar os outliers e os não outliers na amostra aleatória. Para a geração dos dados simulados, utilizou-se uma amostra proveniente de uma população normal multivariada utilizando o software R. A partir dos dados amostrais, foram obtidos os componentes principais para a realização dos testes através do programa R. Conclui-se que os testes propostos, utilizando o estimador robusto comedian, obtiveram os melhores resultados na detecção dos outliers. Além disso, o teste de Rao, ao utilizar o comedian, destacou-se como o melhor, pois também detectou corretamente os não outliers.