Modelos aditivos generalizados para locação, escala e forma: análise histórica e a proposição de novas distribuições zero-ajustadas
Modelos de Regressão; GAMLSS; Distribuições Zero-Ajustadas; Modelagem Estatística; Análise Bibliométrica; Seguro Agrícola
Do ponto de vista da classe dos modelos de regressão remontam ao século XIX e visa compreender como um conjunto de variáveis preditoras influencia ou explica uma ou mais variáveis respostas. Dentro dessa classe de modelos de regressão univariados, podemos construir uma linha histórica que começa com os modelos lineares (LM), seguidos pelos modelos lineares generalizados (GLM), modelos aditivos generalizados (GAM) e, finalmente, os modelos aditivos generalizados para locação, escala e forma (GAMLSS), também conhecidos atualmente como modelos de regressão distribucional. Os GAMLSS podem ser considerados os modelos de regressão mais flexíveis disponíveis na literatura, dada sua versatilidade para modelar respostas com diferentes características, como, por exemplo, forte assimetria, diferentes graus de curtose ou excesso de zeros. Este estudo teve objetivo construir distribuições contínuas com probabilidade extra de ocorrência de zeros (zero-ajustadas) utilizando os modelos aditivos generalizados para locação, escala e forma (GAMLSS). Para alcançar o objetivo geral, foram elencadas duas etapas. A primeira etapa, é apresentado um artigo que versa sobre a evolução histórica dos GAMLSS, desde seus primórdios, destacando suas principais contribuições e inovações em diversas áreas do conhecimento. Já à segunda etapa, é apresentado um artigo que busca contribuir para o avanço da modelagem de dados com os GAMLSS, focando em respostas contínuas positivas com excesso de zeros, desenvolvendo novas distribuições zero-ajustadas. Foram propostas duas distribuições pertencentes à família Box--Cox: Box-Cox Cole e Green Zero-Ajustada (zBCCG) e Box-Cox Exponencial Potência Zero-Ajustada (zBCPE). Os estudos de simulação mostraram que os estimadores de máxima verossimilhança para os parâmetros das distribuições zBCCG e zBCPE fornecem resultados consistentes para diferentes tamanhos amostrais e cenários, incluindo distribuições simétricas, assimétricas positivas e negativas, bem como cenários platicúrticos e leptocúrticos. Para o estudo de caso analisado a distribuição zBCPE apresentou maior flexibilidade e melhor desempenho estatístico em comparação a zBCCG. Assim pode-se concluir que, os modelos GAMLSS têm um impacto significativo em diversas áreas do conhecimento, como evidenciado pela crescente produção científica, além de sua reconhecida flexibilidade na modelagem de dados com características complexas.