Uso dos métodos natural vector e k-mer na análise de similaridade entre genomas de coronavírus
Dados de covid. Métodos livres de alinhamento. Árvores de classificação.
O mundo enfrentou e ainda enfrenta uma pandemia sem data para finalizar. O Brasil é um dos países com maior número de mortos e infectados por meio da covid-19, até o momento apresenta índice de infectados e mortes diárias, mesmo com a maior parte da população totalmente vacinada. Dessa forma, tendo em vista todos os dados disponíveis com relação a síndrome respiratória aguda grave coronavírus 2 (SARS-cov-2), o objetivo deste trabalho, é estudar dois métodos livres de alinhamento, k-mer e o natural vector, analisando 10 sequências genômicas de covid, com o intuito de classificá-las através de árvores filogenéticas e verificar similaridades entre elas. As sequências utilizadas na pesquisa foram obtidas a partir dos registros junto ao Centro Nacional de Informação em Biotecnologia (NCBI) e correspondem ao período de 2020 e 2021. Com isso, para o método k-mer observou-se que as sequências que possuíam as mesmas variantes ficaram agrupadas, enquanto que para o método natural vector, tanto com 12 componentes quanto 16, as variantes se misturaram dentro dos grupos, sendo que as sequências relacionadas às mesmas cidades ficaram em grupos análogos.