MIA-QSAR. Informação tridimensional. Projeções 2D. Fatias Moleculares. Faces moleculares. QSAR-3D.
A análise multivariada de imagens aplicada em QSAR (MIA-QSAR) é uma técnica baseada no tratamento de imagens bidimensionais resultantes das projeções de estruturas moleculares perfeitamente congruentes (alinhadas) e com geometrias não-otimizadas. Destaca-se por ser uma metodologia que balanceia simplicidade e eficácia na geração de modelos de predição de propriedades biológicas e físico-químicas. Por se tratar de uma técnica 2D, a MIA-QSAR não codifica, de forma eficiente, informações espaciais em seus descritores moleculares. Nesse sentido, e tendo em mente o papel fundamental das
informações 3D para modelagem e descrição de propriedades biológicas/físico-químicas de moléculas, o presente trabalho tem como objetivo principal investigar diferentes estratégias para codificar e modelar esse tipo de informação em descritores MIA-QSAR, bem como avaliar o papel da conformação em uma abordagem QSAR originalmente tridimensional. Três diferentes fontes de descritores foram propostas para codificação de informação 3D nos descritores MIA-QSAR: (I) imagens de projeções 2D de compostos com geometrias previamente otimizadas; (II) imagens de “fatias moleculares” obtidas após o escaneamento, ao longo de um dos eixos cartesianos, de moléculas com geometrias otimizadas; e (III) imagens da face frontal, direita e superior de estruturas químicas, com geometrias otimizadas, dispostas dentro de uma caixa teórica. Para a modelagem dos dados, duas ferramentas robustas de regressão multivariada foram empregadas: para os descritores oriundos das projeções 2D fez-se uso do método de máquina de vetores de suporte para regressão (SVR); para as duas outras estratégias o método dos mínimos quadrados parciais multilinear (N-PLS) foi empregado. As três rotinas foram empregadas em três diferentes grupos de compostos: uma série de moléculas com atividade contra o vírus da hepatite C (anti-HCV), outra com ação contra o coronavírus causador da síndrome respiratória aguda severa (SARS-CoV), e um grupo com atividade anti-HIV (vírus da imunodeficiência humana). Como resultado, parâmetros de boa qualidade, tanto de validação interna quanto externa, foram obtidos nas três estratégias e resultados estatísticos de correlação foram, no mínimo, similares aos reportados em outros estudos envolvendo os mesmos conjuntos de dados. No entanto, o risco de correlação casual não pôde ser excluído, como demonstrado por testes de randomização do bloco Y. Dessa forma, a metodologia MIA-QSAR tradicional, que faz uso de imagens de subestruturas farmacofóricas perfeitamente congruentes e com geometrias não-otimizadas, mostrou-se mais eficiente que as estratégias que codificaram informação tridimensional na modelagem. Para avaliar o papel da conformação em uma técnica QSAR originalmente 3D, foram comparados modelos construídos com variáveis que codificam aspectos tridimensionais completamente descritos, obtidos de estruturas químicas previamente ancoradas em seu alvo biológico, com descritores em que esse tipo de informação é suprimido (estruturas planas) ou apenas parcialmente descrito (estruturas químicas com geometrias computacionalmente otimizadas). Como resultado, os parâmetros de validação indicaram que a robustez dos modelos QSAR parece estar mais associada ao alinhamento das estruturas do que ao nível de detalhamento dos aspectos tridimensionais codificados pelos descritores moleculares.