Notícias

Banca de QUALIFICAÇÃO: FERNANDO CAIO SILVA AMARAL

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE: FERNANDO CAIO SILVA AMARAL
DATA: 19/10/2020
HORA: 16:00
LOCAL: https://meet.google.com/umw-xwcq-pqu
TÍTULO:

Uma proposta para classificação de dados em fluxos de textos com a presença de mudança de conceito


PALAVRAS-CHAVES:

Mineração de Fluxos de Textos. Mudança de Conceito. PU Learning.


PÁGINAS: 33
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
RESUMO:

Nos últimos anos a quantidade de dados textuais criados em sistemas computacionais vem crescendo de forma exponencial. Nesse cenário, grandes fluxos contínuos de dados são gerados a partir de redes sociais e fóruns na internet. Do ponto de vista dos usuários, encontrar as informações mais relevantes para si dentre essa grande quantidade de dados, pode ser uma tarefa lenta e cansativa. Em vista disso, sistemas buscam identificar, com base no comportamento dos usuários, quais documentos devem ser apresentados com maior prioridade, melhorando não só a experiência do usuário mas também gerando um melhor engajamento do usuário com o sistema. Tal problema vem sendo explorado pela área de classificação de dados únicos e não rotulados, a qual utiliza métodos de mineração de dados que visam detectar dados relevantes para o usuário em meio a um conjunto de dados que a princípio não são rotulados quanto a sua relevância para o usuário. Soma-se ao problema de classificar tais fluxos de textos o fato de que algoritmos convencionais de mineração de dados podem não ser capazes de lidar com fluxos contínuos de textos, decorrente do fato de que os fluxos de textos estão sujeitos a mudanças constantes, conhecidas como mudança de conceito (Concept Drift). Essas mudanças ocorrem, por exemplo, quando a distribuição de probabilidade dos dados que descrevem cada instância de dados ou mesmo o interesse do usuário muda ao longo do tempo. Com isso, um modelo de classificação treinado anteriormente pode não conseguir classificar corretamente instâncias atuais. Para evitar a perda de desempenho do classificador faz-se necessário o desenvolvimento de técnicas que permitam a detecção de mudança de conceito de forma que o classificador possa ser atualizado, ou seja, que aprenda os novos padrões oriundos das instâncias mais recentes. Dentre os trabalhos que exploram o problema da classificação de classe única no contexto de fluxos de textos com a presença de mudança de conceito destaca-se o Vote-Based LELC, o qual é capaz de detectar e adaptar seu funcionamento com a mudança de conceito. Porém, tal método tem seu desempenho deteriorado proporcionalmente ao aumento da taxa em que as mudanças de conceito ocorrem. Em vista disso, o presente trabalho visa propor uma técnica de classificação de dados em fluxos textuais com a presença de mudanças de conceito baseada no método Vote-Based LELC.


MEMBROS DA BANCA:
Interno - DENILSON ALVES PEREIRA (Suplente)
Externo ao Programa - ERICK GALANI MAZIERO - DAC/ICE (Membro)
Presidente - LUIZ HENRIQUE DE CAMPOS MERSCHMANN (Membro)
Interno - RENATA LOPES ROSA (Membro)
Notícia cadastrada em: 07/10/2020 08:25
SIGAA | DGTI - Diretoria de Gestão de Tecnologia da Informação - Contatos (abre nova janela): https://ufla.br/contato | © UFLA | appserver2.srv2inst1 05/05/2024 20:24