TEORIA DA ESTIMAÇÃO SEQUENCIAL BAYESIANA PARA A DISTRIBUIÇÃO MULTINOMIAL E APLICAÇÕES
Amostragem sequencial. Estimação. Distribuição de Dirichlet. Custo.
A inferência é uma área fundamental da Estatística, que visa generalizar informações sobre uma população com base em dados amostrais. A estimação de parâmetros é um dos problemas centrais da inferência. Uma maneira de otimizá-la é utilizar a amostragem sequencial, que se caracteriza por utilizar amostras de tamanhos variáveis, sem a necessidade de fixar um tamanho previamente. Nesse caso, o tamanho amostral é determinado em função das observações realizadas, e o procedimento se encerra quando há informações suficientes para estimar os parâmetros, sendo a decisão de interromper a amostragem baseada em um critério de parada de comparação de riscos, atualizado a cada elemento amostral verificado. Esta amostragem, na maioria dos casos, resulta em tamanhos amostrais menores do que seriam adotados considerando amostras de tamanho fixo. Sendo assim, é útil para reduzir custos e tempo no processo de estimação de parâmetros, principalmente em processos de amostragem destrutivos, com alto custo financeiro e/ou tempo de execução exaustivo, ou em situações em que o tamanho amostral não é definido por uma regra pré-estabelecida. Além disso, pode-se incorporar a teoria da decisão bayesiana à amostragem sequencial para realizar a estimação de parâmetros, pois essa permite incluir informações a priori sobre os parâmetros, o que auxilia na tomada de decisão e pode otimizar o plano de amostragem. Contudo, o desafio da estimação sequencial bayesiana reside na dificuldade em estabelecer critérios de parada. Devido à dificuldade inerente ao procedimento, a maioria dos trabalhos desenvolvidos nessa área concentra-se em variáveis discretas e univariadas, mais precisamente para a distribuição binomial, deixando uma lacuna significativa para distribuições multivariadas, como a multinomial. Esta distribuição é pouco explorada na literatura, apesar de sua relevância para estimar proporções em problemas com mais de duas categorias de resposta. Situações em que a distribuição multinomial é aplicada são muito comuns, como por exemplo, na genética de populações, para estimar as proporções esperadas de genótipos e alelos. Na apicultura, para estimar a proporção de diferentes doenças em colônias de abelhas. No controle de qualidade de sementes, para estimar a proporção de sementes com diferentes tipos de danos, entre outros. Diante disso, o interesse é explorar a estimação sequencial bayesiana para parâmetros da distribuição multinomial, realizar aplicações, comparações e estudos de simulação. Além disso, tem-se o objetivo de desenvolver uma ferramenta prática, como um aplicativo interativo, para facilitar a aplicação desta técnica em diversas áreas.