META-APRENDIZAGEM APLICADA A CLASSIFICAÇÃO DE TEXTO MULTIRRÓTULO
Meta-aprendizagem. Classificação de Texto. Classificação Multirrótulo. Processamento de Linguagem Natural. Mineração de dados.
A classificação é uma tarefa preditiva da Mineração de Dados que utiliza um conjunto de dados
(instâncias), previamente rotulados, para o treinamento de um algoritmo que tem a função de
aprender com os dados apresentados e ser capaz de predizer os rótulos de novas instâncias. A
classificação multirrótulo, por sua vez, difere da tradicional classificação monorrótulo ao permitir
que cada instância do conjunto de dados esteja associada a mais de um rótulo. Dessa
forma, no domínio de textos, caracterizado pela diversidade, volume e produção crescente, a
classificação multirrótulo desempenha um papel importante ao permitir que, de forma automática,
seja extraído o máximo de informação embutida nesses dados. Por meio dos textos, é
possível identificar conteúdos de grande valor para a tomada de decisão, como interesses, opiniões
e sentimentos. Algumas áreas que exploram formas de trabalhar com os dados textuais
são Processamento de Linguagem Natural, Mineração de Dados e Aprendizado de Máquina.
A classificação multirrótulo dispõe de um significativo número de técnicas de aprendizagem
disponíveis para a sua execução. Porém, encontrar a que seja mais apropriada para um determinado
conjunto de dados, não é uma tarefa trivial, pois exige conhecimento das técnicas,
consecutivos experimentos e, consequentemente, tempo. Nesse contexto, a meta-aprendizagem
apresenta a relevância de sua aplicação ao investigar formas de automatizar o processo de seleção
das melhores técnicas para determinado problema. Portanto, o objetivo deste trabalho é
aplicar a meta-aprendizagem no desenvolvimento de um método para a classificação de textos
multirrótulo, o qual busca selecionar o melhor algoritmo de classificação para cada instância
do conjunto de dados apresentado. Os resultados experimentais demonstraram a eficácia do
método proposto.