Novas alternativas de estimadores shrinkage para dados de contagens com sub e superdispersão: Desenvolvimento, Simulação e aplicações
Estimador ridge. Poisson. Binomial Negativa. Poisson Generalizada. Multicolinearidade.
Um problema que afeta tanto modelos lineares quanto modelos lineares generalizados é a multicolinearidade, sub e/ou superdispersão . Nesta pesquisa, se abordaram alternativas de estimadores shrinkage aplicadas a modelos de dados de contagem, e, com esse propósito, o trabalho está estruturado em duas partes: a primeira corresponde ao referencial teórico, e a segunda é composta por dois artigos. No primeiro artigo, foram propostos estimadores shrinkage modificados para avaliar a multicolinearidade em amostras com superdispersão, sendo sugerida uma modificação dos estimadores ridge com o intuito de obter estimativas mais precisas. Foram simuladas distribuições de Poisson e binomial negativa e, por meio de simulações de Monte Carlo, construíram-se diferentes cenários considerando variados tamanhos amostrais e graus de correlação. Os resultados mostraram que o estimador proposto apresentou maior eficiência para pequenas amostras e alta correlação, mantendo competitividade em outros cenários. O segundo artigo apresenta a adaptação de estimadores ridge ao modelo de Poisson Generalizado, caracterizado por sua flexibilidade ao incorporar um parâmetro que permite diagnosticar o grau de subdispersão e sobredispersão. Os estimadores adaptados promoveram melhor desempenho na estimação dos parâmetros, aumentando a precisão e contribuindo para a robustez da inferência estatística. Para validar a proposta, foram realizadas simulações de Monte Carlo em diferentes cenários envolvendo tamanhos amostrais variados com a inclusão de intercepto e diferentes níveis de correlação entre as variáveis independentes. Dois casos de aplicação foram analisados, um em situação de subdispersão e outro em sobredispersão, evidenciando que os estimadores ridge adaptados apresentaram desempenho consistente em relação aos erros quadráticos médios e aos erros padrão das estimativas, além de os resultados empíricos estarem em concordância com as simulações realizadas.