Sentimentum: um método de detecção de discursos enganosos

dc.contributor.advisorSilva, Leandro Augusto da
dc.contributor.authorSouza, Vitor da Silva
dc.date.accessioned2024-03-06T12:51:53Z
dc.date.available2024-03-06T12:51:53Z
dc.date.issued2023-08-14
dc.description.abstractA popularização da internet e das mídias sociais ampliaram as possibilidades de comunicação, permitindo uma comunicação de muitos para muitos, em que conteúdos são publicados e compartilhados para milhares de pessoas em poucos minutos. Por outro lado, essa dinâmica de comunicação permite que conteúdos falsos, conhecidos como Fake News, sejam publicados na mesma velocidade para milhares de pessoas. A facilidade de produção e sua velocidade de propagação, fazem com que as Fake News se tornem um problema para a sociedade, podendo influenciar os ambientes políticos, econômicos e sociais. Esta pesquisa propõe o desenvolvimento de um método de detecção automática de Fake News, utilizando técnicas de processamento de linguagem natural, como “bag of words”, análise de sentimentos, Linguistic Inquiry and Word Count (LIWC) e algoritmos de aprendizagem de máquina como Support Vector Machine (SVM) e Árvores de decisão. O método apresentado nesta dissertação foi adaptado de uma proposta de discursos enganosos propagados por diretores executivos e diretores financeiros nas divulgações de resultados trimestrais de empresas. A adaptação realizada consistiu em utilizar as técnicas de detecção de discursos enganosos em notícias falsas publicadas em jornais de forma escrita. O método foi adaptado ao contexto de Fake News e testado em bases de dados textuais da literatura no idioma inglês e seu resultado comparado com outras abordagens da literatura. Após a aplicação dos algoritmos verificou-se resultados positivos da utilização do LIWC para a detecção de Fake News com uma acurácia de 99,6% para o algoritmo SVM o que significa um resultado positivo quando comparado com demais resultados encontrados na literatura. Também foi possível identificar categorias do LIWC que frequentemente estão mais associadas com Fake News como as categorias negate e I (pronome pessoal).
dc.identifier.urihttps://dspace.mackenzie.br/handle/10899/33887
dc.language.isopt_BR
dc.language.isoen
dc.publisherUniversidade Presbiteriana Mackenzie
dc.subjectprocessamento de língua natural
dc.subjectfake news
dc.subjectmídias sociais
dc.subjectinteligência artificial
dc.titleSentimentum: um método de detecção de discursos enganosos
dc.typeDissertação
local.contributor.advisorLatteshttp://lattes.cnpq.br/1396385111251741
local.contributor.advisorOrcidhttps://orcid.org/0000-0002-8671-3102
local.contributor.authorLatteshttp://lattes.cnpq.br/7644564152987666
local.contributor.board1Sampaio, Gustavo Scalabrini
local.contributor.board1Latteshttp://lattes.cnpq.br/6516369977507577
local.contributor.board1Orcidhttps://orcid.org/0000-0003-1150-5584
local.contributor.board2Souza, Alexandra Aparecida de
local.contributor.board2Latteshttp://lattes.cnpq.br/1119774618311172
local.description.abstractenWith the popularization of the Internet and social media, communication from many to many has become possible, which allows, among other things, the propagation of false information, known as Fake News. The ease of production and its propagation speed make them a problem for society, which can influence the political, economic, and social environments. This research proposes the development of an automatic Fake News Detection method, using natural language processing (NLP) techniques, such as bag of words, sentiment analysis through LIWC and machine learning such as Support Vector Machine (SVM) and Decision trees. The method presented was adapted from the article called Detecting Deceptive Discussions in Conference Calls, which identifies misleading speeches propagated by CEO and CFO in company quarterly earnings releases. The adapted method, in the context of Fake News, was tested in textual databases of literature in the English language and its result compared with other literature approaches. After applying the algorithms, there were positive results from the use of LIWC for the detection of Fake news with an accuracy of 99.6% for the best SVM algorithm when compared to other results found in the literature. It was also possible to identify LIWC categories that often more associated with fake news, such as negate and I (personal pronoun) categories.
local.keywordsnatural language processing
local.keywordsfake news
local.keywordssocial media
local.keywordsartificial intelligence
local.publisher.countryBrasil
local.publisher.departmentEscola de Engenharia Mackenzie (EE)
local.publisher.initialsUPM
local.publisher.programEngenharia Elétrica e Computação
local.subject.cnpqCNPQ::ENGENHARIAS
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
VITOR DA SILVA SOUZA - protegido.pdf
Tamanho:
826.18 KB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.22 KB
Formato:
Item-specific license agreed upon to submission
Descrição: