Sentimentum: um método de detecção de discursos enganosos
Carregando...
Tipo
Dissertação
Data de publicação
2023-08-14
Periódico
Citações (Scopus)
Autores
Souza, Vitor da Silva
Orientador
Silva, Leandro Augusto da
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Sampaio, Gustavo Scalabrini
Souza, Alexandra Aparecida de
Souza, Alexandra Aparecida de
Programa
Engenharia Elétrica e Computação
Resumo
A popularização da internet e das mídias sociais ampliaram as possibilidades de comunicação, permitindo uma comunicação de muitos para muitos, em que conteúdos são publicados e compartilhados para milhares de pessoas em poucos minutos. Por outro lado, essa dinâmica de comunicação permite que conteúdos falsos, conhecidos como Fake News, sejam publicados na mesma velocidade para milhares de pessoas. A facilidade de produção e sua velocidade de propagação, fazem com que as Fake News se tornem um problema para a sociedade, podendo influenciar os ambientes políticos, econômicos e sociais. Esta pesquisa propõe o desenvolvimento de um método de detecção automática de Fake News, utilizando técnicas de processamento de linguagem natural, como “bag of words”, análise de sentimentos, Linguistic Inquiry and Word Count (LIWC) e algoritmos de aprendizagem de máquina como Support Vector Machine (SVM) e Árvores de decisão. O método apresentado nesta dissertação foi adaptado de uma proposta de discursos enganosos propagados por diretores executivos e diretores financeiros nas divulgações de resultados trimestrais de empresas. A adaptação realizada consistiu em utilizar as técnicas de detecção de discursos enganosos em notícias falsas publicadas em jornais de forma escrita. O método foi adaptado ao contexto de Fake News e testado em bases de dados textuais da literatura no idioma inglês e seu resultado comparado com outras abordagens da literatura. Após a aplicação dos algoritmos verificou-se resultados positivos da utilização do LIWC para a detecção de Fake News com uma acurácia de 99,6% para o algoritmo SVM o que significa um resultado positivo quando comparado com demais resultados encontrados na literatura. Também foi possível identificar categorias do LIWC que frequentemente estão mais associadas com Fake News como as categorias negate e I (pronome pessoal).
Descrição
Palavras-chave
processamento de língua natural , fake news , mídias sociais , inteligência artificial