Análise de dados circulares na presença de multimodalidade
Boxplot Circular; Distribuição von Mises; Regressão Linear-Circular; Simulação; Acidentes de trânsito; Captura de Abelhas
A estatística circular é aplicada em diversos ramos da ciência tais como meteorologia, planejamento urbano e estudos entomológicos, principalmente quando se trata de pesquisa sobre sazonalidade, horários e direções. A presença de multimodalidade em conjuntos de dados é um desafio na análise e modelagem estatística. Esse problema também é comum em dados circulares, em que muitas vezes a segmentação de cada conjunto modal é realizada de forma empírica utilizando convenções como dias da semana, meses ou estações do ano ou utilizando algoritmos de maximização a partir da modelagem por misturas de distribuições von Mises, que exige conhecimento teórico mais avançado. Essa tese propõe um método de segmentação a partir da construção de boxplot circular. No primeiro capítulo o método foi apresentado e sua eficácia verificada através de simulação em diferentes cenários e posteriormente aplicado a conjunto de dados sobre horários de acidentes de trânsito. Verificou-se que o método proposto foi mais adequado para o estudo de multimodalidade em dados circulares ao equilibrar simplicidade e precisão. Assim, foi eficiente ao ajustar os acidentes que apresentaram multimodalidade considerando a distribuição dos horários ao longo da semana. No segundo capítulo realizou-se um experimento de captura de enxames de abelhas Apis mellifera, durante um ano, a partir da instalação de ninhos-armadilha, registrando-se dados lineares tais como altura, precipitação, umidade e velocidade do vento e as circulares: direção do vento, época de captura (mês) e ângulo do alvado, que representa o posicionamento do ninho em relação ao norte magnético. Além disso, avaliou-se a variável qualitativa cor de revestimento do ninho-armadilha. A época de captura apresentou padrões bimodais, concentradas em dois períodos sazonais: outono (abril a junho) e primavera (agosto a outubro). Assim, utilizou-se a tecnica de segmentaçao por boxplot circular para estudá-la e também realizou-se a relação entre as variáveis registradas no experimento através da correlação linear-linear, linear-circular e circular-circular de acordo com a natureza de cada variável. No terceiro capítulo, devido a presença de dados censurados, já que, as datas de captura foram registradas em intervalos, entre o último dia com ausência do enxame e o dia da observação, foi utilizada a análise de sobrevivência considerando uma mistura de von Mises para estimar a função de sobrevivência da época de captura de enxames.