Controle de Cadeira de Rodas por Sinais de Eletroencefalograma Utilizando Técnicas de Aprendizado de Máquina
Cadeira de Rodas; Sinais Miolétricos; Eletroencefalograma; Algoritmos Inteligentes; Interface cérebro-computador (BCI)
Esta pesquisa investiga o desenvolvimento e otimização de sistemas de Interface Cérebro-Computador (ICC) para controle de cadeiras de rodas utilizando sinais eletroencefalográficos (EEG). O estudo aborda o desafio de classificar com precisão padrões de imaginação motora em tempo real, focando na distinção entre imaginação motora da mão esquerda, mão direita e estados de repouso. O trabalho utiliza o conjunto de dados do projeto Milo, que contém sinais EEG adquiridos com frequência de amostragem de 250 Hz de oito canais posicionados sobre regiões sensório-motoras, resultando em 98.506 amostras brutas que foram processadas e segmentadas em 2.950 amostras caracterizadas para análise. A metodologia emprega uma abordagem comparativa, avaliando quatro algoritmos de aprendizado de máquina (Perceptron Multicamadas, Random Forest, K-Vizinhos Mais Próximos e Gradient Boosting) organizados em quatro grupos experimentais distintos: Grupo A (conjunto completo de 45 características sem balanceamento, servindo como linha de base), Grupo B (incorporando SMOTE para geração sintética de amostras das classes minoritárias), Grupo C (utilizando ADASYN para balanceamento adaptativo baseado na densidade local), e Grupo D (explorando técnicas avançadas como BorderlineSMOTE e balanceamento por pesos de classe). Dentro de cada grupo, cinco configurações específicas de pré-processamento foram testadas: Configuração 1 (StandardScaler para normalização z-score), Configuração 2 (SelectKBest + StandardScaler, selecionando 50% das características mais discriminativas), Configuração 3 (PCA + StandardScaler, preservando 95% da variância), Configuração 4 (SelectKBest + PCA + StandardScaler, abordagem híbrida com seleção de 25% das características seguida por PCA com 90% da variância), e Configuração 5 (RobustScaler para normalização resistente a outliers). O Grupo D implementa apenas três configurações focadas em técnicas avançadas de balanceamento. A avaliação comparativa revela que o Gradient Boosting com a configuração B2 constitui a melhor opção, apresentando F1-Score Macro de 78,84% e acurácia de 87,63%, demonstrando capacidade superior de lidar com o desbalanceamento dos dados e alcançando Recall Macro de 78,83% com desempenho equilibrado entre as três classes (93,0% para Esquerda, 80,5% para Direita e 63,0% para Repouso). O Random Forest configuração A1 representa alternativa competitiva com F1-Score Macro de 76,85% e acurácia de 87,97%, destacando-se pela precisão macro de 86,76% e eficiência computacional com tempo de treinamento 31 vezes menor (3,06 vs. 96,08 segundos). O Multi-Layer Perceptron configuração C2 oferece solução intermediária com F1-Score Macro de 72,8%, enquanto o K-Nearest Neighbors configuração B2 registra o menor desempenho geral com F1-Score Macro de 69,4%, evidenciando limitações significativas para este conjunto de dados desbalanceado, especialmente nas classes minoritárias.