Sentimentum: um método de detecção de discursos enganosos
dc.contributor.advisor | Silva, Leandro Augusto da | |
dc.contributor.author | Souza, Vitor da Silva | |
dc.date.accessioned | 2024-03-06T12:51:53Z | |
dc.date.available | 2024-03-06T12:51:53Z | |
dc.date.issued | 2023-08-14 | |
dc.description.abstract | A popularização da internet e das mídias sociais ampliaram as possibilidades de comunicação, permitindo uma comunicação de muitos para muitos, em que conteúdos são publicados e compartilhados para milhares de pessoas em poucos minutos. Por outro lado, essa dinâmica de comunicação permite que conteúdos falsos, conhecidos como Fake News, sejam publicados na mesma velocidade para milhares de pessoas. A facilidade de produção e sua velocidade de propagação, fazem com que as Fake News se tornem um problema para a sociedade, podendo influenciar os ambientes políticos, econômicos e sociais. Esta pesquisa propõe o desenvolvimento de um método de detecção automática de Fake News, utilizando técnicas de processamento de linguagem natural, como “bag of words”, análise de sentimentos, Linguistic Inquiry and Word Count (LIWC) e algoritmos de aprendizagem de máquina como Support Vector Machine (SVM) e Árvores de decisão. O método apresentado nesta dissertação foi adaptado de uma proposta de discursos enganosos propagados por diretores executivos e diretores financeiros nas divulgações de resultados trimestrais de empresas. A adaptação realizada consistiu em utilizar as técnicas de detecção de discursos enganosos em notícias falsas publicadas em jornais de forma escrita. O método foi adaptado ao contexto de Fake News e testado em bases de dados textuais da literatura no idioma inglês e seu resultado comparado com outras abordagens da literatura. Após a aplicação dos algoritmos verificou-se resultados positivos da utilização do LIWC para a detecção de Fake News com uma acurácia de 99,6% para o algoritmo SVM o que significa um resultado positivo quando comparado com demais resultados encontrados na literatura. Também foi possível identificar categorias do LIWC que frequentemente estão mais associadas com Fake News como as categorias negate e I (pronome pessoal). | |
dc.identifier.uri | https://dspace.mackenzie.br/handle/10899/33887 | |
dc.language.iso | pt_BR | |
dc.language.iso | en | |
dc.publisher | Universidade Presbiteriana Mackenzie | |
dc.subject | processamento de língua natural | |
dc.subject | fake news | |
dc.subject | mídias sociais | |
dc.subject | inteligência artificial | |
dc.title | Sentimentum: um método de detecção de discursos enganosos | |
dc.type | Dissertação | |
local.contributor.advisorLattes | http://lattes.cnpq.br/1396385111251741 | |
local.contributor.advisorOrcid | https://orcid.org/0000-0002-8671-3102 | |
local.contributor.authorLattes | http://lattes.cnpq.br/7644564152987666 | |
local.contributor.board1 | Sampaio, Gustavo Scalabrini | |
local.contributor.board1Lattes | http://lattes.cnpq.br/6516369977507577 | |
local.contributor.board1Orcid | https://orcid.org/0000-0003-1150-5584 | |
local.contributor.board2 | Souza, Alexandra Aparecida de | |
local.contributor.board2Lattes | http://lattes.cnpq.br/1119774618311172 | |
local.description.abstracten | With the popularization of the Internet and social media, communication from many to many has become possible, which allows, among other things, the propagation of false information, known as Fake News. The ease of production and its propagation speed make them a problem for society, which can influence the political, economic, and social environments. This research proposes the development of an automatic Fake News Detection method, using natural language processing (NLP) techniques, such as bag of words, sentiment analysis through LIWC and machine learning such as Support Vector Machine (SVM) and Decision trees. The method presented was adapted from the article called Detecting Deceptive Discussions in Conference Calls, which identifies misleading speeches propagated by CEO and CFO in company quarterly earnings releases. The adapted method, in the context of Fake News, was tested in textual databases of literature in the English language and its result compared with other literature approaches. After applying the algorithms, there were positive results from the use of LIWC for the detection of Fake news with an accuracy of 99.6% for the best SVM algorithm when compared to other results found in the literature. It was also possible to identify LIWC categories that often more associated with fake news, such as negate and I (personal pronoun) categories. | |
local.keywords | natural language processing | |
local.keywords | fake news | |
local.keywords | social media | |
local.keywords | artificial intelligence | |
local.publisher.country | Brasil | |
local.publisher.department | Escola de Engenharia Mackenzie (EE) | |
local.publisher.initials | UPM | |
local.publisher.program | Engenharia Elétrica e Computação | |
local.subject.cnpq | CNPQ::ENGENHARIAS |