MÉTODO DE AGRUPAMENTO ITERATIVO BASEADO EM CURVAS PRINCIPAIS
Agrupamento de Dados. Curvas Principais. Representação de Dados.
A técnica de agrupamento de dados consiste em dividir um conjunto de dados em agrupamentos baseado nas semelhanças entre os dados. O objetivo deste trabalho é desenvolver um método de agrupamento de dados iterativo utilizando a técnica de Curvas Principais, que além de possuir alta capacidade de representação dos dados em uma única dimensão também é uma ferramenta robusta para análise e classificação de dados. O método proposto requer uma etapa de inicialização que é o particionamento dos dados em k grupos. Em seguida, curvas principais serão alocadas em cada um dos k grupos encontrados e, de forma iterativa, a distância de cada ponto às curvas será calculada, associando o ponto à curva que ele está mais próximo. Após isso as curvas serão atualizadas e o algoritmo irá convergir quando não houver mudança de grupo entre os eventos. Para testar o método pro-posto pretende-se utilizar tanto bases de dados reais do repositório UCI Machine Learning Repository quanto base de dados próprias simuladas. Como medidas de avaliação do método proposto, planeja-se utilizar os índices de Xie e Beni (XB) e Silhueta (SI) para as base de dados não-supervisionadas e Acurácia e FScore para as bases de dados supervisionadas.Em relação ao resultados obtidos pelo mé-todo proposto, pretende-se compará-los com os resultados de outros algoritmos de agrupamento de dados como K-means, Fuzzy C-means e K-segcluster.