UMA METODOLOGIA DE ENGENHARIA REVERSA PARA GERAÇÃO DE DADOS SINTÉTICOS E ANÁLISE PREDITIVA
EM CIÊNCIAS AGRÁRIAS
Machine Learning, Modelagem de Surrogados, IA Explicável (XAI).
A aplicação de modelos de machine learning (ML) em sistemas agronômicos complexos é um
campo promissor para a agricultura de precisão, mas seu avanço é frequentemente limitado pela
escassez de dados experimentais em larga escala. Esta tese aborda essa lacuna metodológica ao
propor e validar um framework para a geração de bases de dados sintéticas de alta fidelidade,
fundamentadas no conhecimento científico extraído de documentos acadêmicos. A metodologia
consiste em traduzir parâmetros estatísticos e relações funcionais, documentados em teses,
dissertações e artigos, em um modelo gerador estocástico que emula a dinâmica de sistemas
agronômicos. Sobre os datasets sintéticos gerados, foi conduzido um benchmarking de mais
de 20 algoritmos de ML para prever desfechos agronômicos chave, como a produtividade de
culturas e a severidade de doenças. Os resultados demonstram que os modelos, especialmente
os ensembles não-lineares, alcançaram alta capacidade preditiva (e.g., R2 > 0.92), com uma
notável coerência com os princípios biofísicos dos sistemas estudados. A aplicação de técnicas
de Inteligência Artificial Explicável (XAI), como SHAP, foi crucial para validar a lógica
interna dos modelos, confirmando que aprenderam relações agronomicamente relevantes e decodificando
interações complexas que métodos estatísticos tradicionais não haviam capturado.
Embora os dados sintéticos representem um sistema idealizado, este trabalho demonstra que
a metodologia gera modelos preditivos que servem como uma poderosa linha de base e uma
ferramenta para a formulação de hipóteses quantitativas. O framework aqui validado estabelece
uma ponte metodológica: ele permite desenvolver, testar e refinar modelos em um ambiente
computacional controlado, cujas predições e insights podem ser subsequentemente utilizados
como um referencial para validação com dados de campo, acelerando o ciclo de pesquisa e
inovação em Ciências Agrárias.