Q
ESTIMATIVA NÃO DESTRUTIVA DO PESO E CLASSIFICAÇÃO DE MORANGOS POR MODELOS AVANÇADOS DE APRENDIZADO DE MÁQUINA
aprendizado supervisionado; imagens digitais; predição de características; modelagem, Fragaria X ananassa
A classificação e estimativa de frutos de morango ainda dependem majoritariamente de métodos manuais e destrutivos, o que compromete a eficiência e a padronização no processo de pós-colheita. O uso de imagens digitais e algoritmos de aprendizado de máquina surge como alternativa promissora para automatizar essas etapas de forma precisa e não invasiva. O presente trabalho teve como objetivo avaliar modelos baseados em aprendizado de máquina, para desenvolver métodos não destrutivos que permitam mensurar o peso dos frutos de morango e realizar sua classificação comercial. Para isso, frutos de oito genótipos de morangueiro foram produzidos em casa de vegetação, colhidos e analisados entre setembro e outubro de 2023, na UFLA, Lavras/MG. Cada fruto foi fotografado em estúdio padronizado com dispositivo móvel e as imagens passaram por processamento para segmentação, remoção do fundo e extração de atributos morfológicos (ex: área, perímetro, fator de forma). Em paralelo, os frutos foram avaliados em laboratório quanto ao peso, diâmetros e tamanho em escala. Foram aplicados oito algoritmos de aprendizado supervisionado - MLR, PLSR, MLP, DT, SVM, RF, XGB e KNN - para predição do peso e classificação dos frutos de morango. As análises foram realizadas em Python, no Google Colab. Os modelos foram treinados com 70% dos dados e testados com os 30% restantes, com a aplicação de validação cruzada com K-fold. Para predição do peso os modelos foram avaliados pelas métricas R², RMSE, MAE e d, para a classificação seguindo as métricas Acurácia, F1- score, Recall e Precision. Para a predição do peso dos frutos, na fase de teste, o modelo SVM demonstrou os melhores resultados para ambos os conjuntos de dados. O KNN apresentou bom desempenho quanto ao conjunto de dados manuais, assim como, o XGB apresentou desempenho parecido ao SVM para o conjunto de dados de imagens. O modelo LGBM obteve os melhores desempenhos para treino, mas apresentou queda no teste, sugerindo sobreajuste. Para ambos os conjuntos de dados o modelo MLP teve o desempenho menos satisfatório. O uso dos modelos para a classificação dos frutos atingiu acuraria variando de 98% a 96%, para os dados manuais, com destaque para os modelos, SVM, XGBoost, LGBM e DT, e para os dados de imagens todos modelos tiveram acurácia acima de 0,91, exceto o MLP, que apresentou 0,83. Embora os dados de campo tenham proporcionado maior estabilidade e acerto, aos modelos testados, as variáveis extraídas das imagens demonstraram potencial para predição e classificação dos frutos de morango. Isso reforça o uso de imagens padronizadas como ferramenta não destrutiva, eficiente e escalável para estimar o peso dos frutos e classifica-los, abrindo caminhos para aplicações práticas em monitoramento automatizado, com ganhos em agilidade e redução de custos, contribuindo para avanços na agricultura de precisão e suporte na automação de estimativa de peso para a cultura do morango.