Comparando formas de análise para dados censurados por razões práticas em programas de melhoramento vegetal
palavras-chave: Análise Bayesiana; Componentes da variância; Dados censurados; Melhoramento vegetal; Modelos de limiar
Experimentos de melhoramento estão sujeitoa à ocorrência de dados censurados por razões práticas da pesquisa agronômica de campo ou laboratorial, como limiares de detecção dados por aparelhos além dos quais não se registram valores. Nestes casos, pode-se supor que há uma distribuição subjacente contínua que contém estes limiares e desta forma investigar as consequências disto para ajustar as distribuições associadas às populações experimentais. Este trabalho tem como objetivo desenvolver um método de análise para censura à esquerda desenvolvendo um algoritmo para a previsão condicional usando a amostragem Gibbs e verificar suas propriedades em comparação a métodos usuais de análise de ensaios deste tipo em um exemplo simulado. Para tanto, foi simulado um experimento em blocos incompletos balanceados organizados em látice quadrado (v = 11^2, r = 3, k = 11, b = 33, l = 1). São apresentados os resultados básicos de quatro formas de análise: Dados completos "DC" (caso fosse conhecidas todas as observações); Censura zero "C0" (considerando zero para as censuras); Censura à esquerda "CE" (considerando observações perdidas na censura); Previsão Condicional "PC" (análise com imputação condicional dos dados censurados) em dois cenários, que foram: 1) com baixa taxa de censura (\sim 30%) e 2) alta taxa de censura (\sim 50%). As análises foram comparadas à análise dos dados completos, tida como padrão ouro. Foram verificadas a acurácia, a precisão e o viés na estimação dos parâmetros genéticos (componenetes de variância e herdabilidades). Foram também calculadas as correlações entre os valores originalmente simulados com as observações que foram censuradas. Por fim, em cada análise, foram calculadas as correlações de Pearson, Spearman e Kendall entre os valores genéticos estimados e seus respectivos valores paraméticos. Os resultados mostraram que em ambos os cenários a análise "PC" foi a mais precisa para fins de seleção, apresentando correlaçãos dos efeitos de cruzamentos com o efeitos paramétricos próximos da análise sem censura. Além disso, o algoritmo proposto gerou cadeias nas quais os valores simulados são frequentes na distribuição marginal \textit{a posteriori}. Note que as formas usuais de análise ("C0" e "CE") apresentariam correlação nula entre os valores tomados como zero e os valores paramétricos. A análise "CE" foi a pior em ambos os cenários e deve ser evitada por subestimar as estimativas de parâmetros genéticos (especialmente variâncias e herdabilidades) e apresentar baixa correlação, prejudicando a seleção. Para o cenário 1), com baixo grau de desbalanceamento a análise "C0" mostrou-se uma alternativa interessante, mas com uma piora considerável com o aumento da censura. A análise proposta levou a declarações mais difíceis de interpretar em termos de variâncias e herdabilidades, sendo no entanto a com melhores resultados práticos, sendo a mais recomendada