Aspectos Teóricos, Simulação e Aplicações da Estimação Sequencial Bayesiana em Distribuições Multinomiais
Amostragem Sequencial. Critério de parada. Distribuição de Dirichlet. Custo
A amostragem sequencial é uma técnica estatística na qual o tamanho da amostra não é fixo. As observações são incorporadas sucessivamente ao processo, e a cada nova observação avalia-se o critério de parada estabelecido. O procedimento é interrompido quando esse critério é satisfeito, e o número total de observações realizadas até esse momento define o tamanho da amostra. A teoria da decisão bayesiana, associada à amostragem sequencial, constitui uma abordagem para a estimação de parâmetros de interesse, a qual permite incluir informações prévias na análise que auxiliam o plano de amostragem. A principal vantagem dessa abordagem é que ela geralmente resulta em tamanhos amostrais menores do que aqueles que seriam adotados considerando amostras de tamanho fixo, reduzindo custos e tempo. Entretanto, sua implementação apresenta desafios decorrentes da recursividade envolvida no processo, especialmente no que se refere à definição do critério de parada, os quais se tornam ainda mais complexos em modelos multivariados. Devido à dificuldade inerente ao procedimento, a maioria dos trabalhos nessa área existentes na literatura foram desenvolvidos para distribuições discretas e univariadas, notadamente para a distribuição binomial, havendo uma lacuna significativa no desenvolvimento e na aplicação de métodos de estimação
sequencial bayesiana para distribuições multivariadas, como a multinomial, amplamente utilizada para estimar proporções em problemas com mais de duas categorias de resposta. Diante dessa lacuna, esta tese tem como objetivo propor a estimação dos parâmetros da distribuição multinomial através da inferência bayesiana utilizando uma amostragem sequencial, explorando os aspectos teóricos e aplicações. Para isso, por meio de estudos de simulação, analisou-se o comportamento da estimação sequencial bayesiana dos parâmetros da distribuição multinomial sob diferentes cenários. Em seguida, foi desenvolvido um aplicativo interativo via Web, utilizando o pacote Shiny do software R, visando ampliar a acessibilidade e a aplicabilidade prática da abordagem. Além disso, a aplicabilidade da abordagem foi ilustrada em duas situações práticas reais: na genética de populações, em que se estimaram as proporções alélicas e genotípicas para verificar o equilíbrio de Hardy-Weinberg, e na apicultura, na qual se estimaram as proporções do conteúdo de alvéolos de favos de abelhas africanizadas. De modo geral, os resultados apresentados nesta tese demonstram que a estimação sequencial bayesiana para parâmetros da distribuição multinomial é uma alternativa eficiente e economicamente vantajosa, capaz de produzir estimativas precisas com menor tamanho amostral. Além das contribuições metodológicas e computacionais, os estudos aplicados reforçam o potencial da abordagem para problemas reais em diferentes áreas do conhecimento.