CURVAS DE APRENDIZADO EM MODELOS LINEARES COM RESPOSTAS OMISSAS APLICADAS A DADOS DE QUALIDADE DE CAFÉS UTILIZANDO OS CRITÉRIOS DA ABIC
ABIC, cafés, denominação geográfica, Mantiqueira, Canastra.
A associação brasileira de cafés (ABIC) apresenta critérios de pontuação que permite classificar os cafés em diferentes níveis de qualidade. A questão a ser envolvida, baseia em análise sensorias, das quais, supostamente amostras poderão ser selecionadas ou revisadas em provas de xícaras. Neste contexto, conjectura-se uma situação em a retirada dessas amostras, poderá ser feita de forma arbitrária ou sistematicamente em função de alguma de qualidade. Com este propósito, surge um problema de natureza estatística, no uso de modelos lineares convencionais, que não consideram a relação de viés e erros qudráticos médio. Desta forma, para este problema, sugere um aprimoramento na modelagem, pautada por técnicas de aprendizado em concordância com a regressão Lasso, a qual, estima-se um parâmetro de regulazização que permite controlar esta relação. Mediante ao exposto, este trabalho tem por objetivo realizar uma aplicação em duas bases de dados, referente a cafés produzidos em diferentes denominações geográficas, mais especificamente microrregiões produtoras a Serra da Mantiqueira e Canastra, sugerindo um modelagem estatística em consonância com os critérios da ABIC, tendo como nota de corte, a pontuação que classifica cafés aceitáveis e não aceitáveis ao consumo, com o propósito de comparar estimativas dos parâmetros da regressão múltipla convencional com a regressão lasso e propor uma recomendação de tamanho amostral, a ser utilizado como amostra de treinamento nos procedimentos de aprendizado de máquina.