Estudos sobre um modelo de representação distribuída de palavras no contexto de análise de estados emocionais

Imagem de Miniatura
Tipo
Dissertação
Data
2018-08-07
Autores
Silva, Isabela Ruiz Roque da
Orientador
Silva, Leandro Nunes de Castro
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Silva, Leandro Augusto da
Pereira, André Luiz Vizine
Programa
Engenharia Elétrica
Resumo
Emoções são importantes nas relações interpessoais e fazem parte do ser humano. Muitas pessoas podem expressar seus sentimentos ou emoções nas mídias sociais, como no Twitter e no Facebook. Muitas técnicas computacionais foram propostas para o estudo das emoções e a maior parte delas utiliza uma representação baseada em conjuntos de palavras (bag of words) para os documentos. Recentemente, novas abordagens, como o Word2Vec, capazes de gerar representações distribuídas de palavras, chamadas de vetores de palavras ou word vectors, surgiram e vêm sendo empregadas para o estudo sintático e semântico de documentos. Para contribuir com a pesquisa nas áreas de análise de estados emocionais a partir de dados de mídias sociais e numa melhor compreensão sobre o uso de modelos de representação distribuída de palavras, essa dissertação propõe investigar três hipóteses de pesquisa: os parâmetros do Word2Vec influenciam as representações distribuídas das palavras e, consequentemente, o desempenho dos classificadores de estados emocionais que usam essas representações; as representações distribuídas de palavras podem melhorar o desempenho de classificadores convencionais aplicados ao estudo de estados emocionais; e o agrupamento dos vetores de palavras geram grupos que carregam o contexto semântico dos estados emocionais. Os experimentos realizados mostraram pouca influência dos parâmetros do algoritmo no seu desempenho para esse problema específico. Também observamos que os vetores de palavras não podem ser aplicados diretamente no treinamento dos classificadores e o vetor resultante deteriorou muito o desempenho dos classificadores quando comparado ao modelo tradicional do tipo bag of words. Por fim, verificamos que o agrupamento dos vetores de palavras, embora gere grupos com significado semântico claro, não gera os grupos que refletem os estados emocionais.
Descrição
Palavras-chave
classificação de emoções , mineração de dados , redes neurais artificiais , análise de sensibilidade paramétrica
Citação
SILVA, Isabela Ruiz Roque da. Estudos sobre um modelo de representação distribuída de palavras no contexto de análise de estados emocionais. 2018. 56 f. Dissertação( Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo.