EXTRAÇÃO E ANÁLISE DE INFORMAÇÃO SOBRE BEBIDAS A PARTIR DE TEXTOS COMPARTILHADOS NA WEB
Mineração de Texto. Aprendizagem de Máquina. Processamento de linguagem natural. Bebida. Cachaça.
Com o advento de mídias sociais como fóruns, blogs, páginas de revisão de produtos e redes sociais, houve um aumento considerável na quantidade de dados no formato de texto compartilhados na Web. Esses textos normalmente contêm informações relevantes sobre diferentes tópicos, por exemplo, a opinião ou sentimento do público a respeito de um determinado produto ou serviço. Tais informações são úteis para auxiliar empresas durante o processo de tomada de decisão, pois podem conter o feedback e a avaliação dos clientes. É possível encontrar na literatura muitas pesquisas focadas na automatização da descoberta de conhecimento em textos sobre produtos eletrônicos e bebidas. Entretanto, a maior parte desses estudos trabalha com textos no idioma inglês, pois os recursos existentes, por exemplo, os corpus, são mais abundantes para esse idioma. Neste trabalho será apresentada uma abordagem para a detecção automática de informações relevantes sobre bebidas a partir de textos compartilhados na Web que são escritos especificamente na língua portuguesa. Para tal, serão aplicadas aos dados tarefas de mineração de texto (ex.: reconhecimento de entidades nomeadas e análise de sentimentos), usando técnicas de processamento de linguagem natural e aprendizagem de máquina. Para validação da abordagem proposta será realizado um estudo de caso com a bebida cachaça.