Sentimentum: um método de detecção de discursos enganosos

Souza, Vitor da Silva

Sentimentum: um método de detecção de discursos enganosos

dc.contributor.advisor	Silva, Leandro Augusto da
dc.contributor.author	Souza, Vitor da Silva
dc.date.accessioned	2024-03-06T12:51:53Z
dc.date.available	2024-03-06T12:51:53Z
dc.date.issued	2023-08-14
dc.description.abstract	A popularização da internet e das mídias sociais ampliaram as possibilidades de comunicação, permitindo uma comunicação de muitos para muitos, em que conteúdos são publicados e compartilhados para milhares de pessoas em poucos minutos. Por outro lado, essa dinâmica de comunicação permite que conteúdos falsos, conhecidos como Fake News, sejam publicados na mesma velocidade para milhares de pessoas. A facilidade de produção e sua velocidade de propagação, fazem com que as Fake News se tornem um problema para a sociedade, podendo influenciar os ambientes políticos, econômicos e sociais. Esta pesquisa propõe o desenvolvimento de um método de detecção automática de Fake News, utilizando técnicas de processamento de linguagem natural, como “bag of words”, análise de sentimentos, Linguistic Inquiry and Word Count (LIWC) e algoritmos de aprendizagem de máquina como Support Vector Machine (SVM) e Árvores de decisão. O método apresentado nesta dissertação foi adaptado de uma proposta de discursos enganosos propagados por diretores executivos e diretores financeiros nas divulgações de resultados trimestrais de empresas. A adaptação realizada consistiu em utilizar as técnicas de detecção de discursos enganosos em notícias falsas publicadas em jornais de forma escrita. O método foi adaptado ao contexto de Fake News e testado em bases de dados textuais da literatura no idioma inglês e seu resultado comparado com outras abordagens da literatura. Após a aplicação dos algoritmos verificou-se resultados positivos da utilização do LIWC para a detecção de Fake News com uma acurácia de 99,6% para o algoritmo SVM o que significa um resultado positivo quando comparado com demais resultados encontrados na literatura. Também foi possível identificar categorias do LIWC que frequentemente estão mais associadas com Fake News como as categorias negate e I (pronome pessoal).
dc.identifier.uri	https://dspace.mackenzie.br/handle/10899/33887
dc.language.iso	pt_BR
dc.language.iso	en
dc.publisher	Universidade Presbiteriana Mackenzie
dc.subject	processamento de língua natural
dc.subject	fake news
dc.subject	mídias sociais
dc.subject	inteligência artificial
dc.title	Sentimentum: um método de detecção de discursos enganosos
dc.type	Dissertação
local.contributor.advisorLattes	http://lattes.cnpq.br/1396385111251741
local.contributor.advisorOrcid	https://orcid.org/0000-0002-8671-3102
local.contributor.authorLattes	http://lattes.cnpq.br/7644564152987666
local.contributor.board1	Sampaio, Gustavo Scalabrini
local.contributor.board1Lattes	http://lattes.cnpq.br/6516369977507577
local.contributor.board1Orcid	https://orcid.org/0000-0003-1150-5584
local.contributor.board2	Souza, Alexandra Aparecida de
local.contributor.board2Lattes	http://lattes.cnpq.br/1119774618311172
local.description.abstracten	With the popularization of the Internet and social media, communication from many to many has become possible, which allows, among other things, the propagation of false information, known as Fake News. The ease of production and its propagation speed make them a problem for society, which can influence the political, economic, and social environments. This research proposes the development of an automatic Fake News Detection method, using natural language processing (NLP) techniques, such as bag of words, sentiment analysis through LIWC and machine learning such as Support Vector Machine (SVM) and Decision trees. The method presented was adapted from the article called Detecting Deceptive Discussions in Conference Calls, which identifies misleading speeches propagated by CEO and CFO in company quarterly earnings releases. The adapted method, in the context of Fake News, was tested in textual databases of literature in the English language and its result compared with other literature approaches. After applying the algorithms, there were positive results from the use of LIWC for the detection of Fake news with an accuracy of 99.6% for the best SVM algorithm when compared to other results found in the literature. It was also possible to identify LIWC categories that often more associated with fake news, such as negate and I (personal pronoun) categories.
local.keywords	natural language processing
local.keywords	fake news
local.keywords	social media
local.keywords	artificial intelligence
local.publisher.country	Brasil
local.publisher.department	Escola de Engenharia Mackenzie (EE)
local.publisher.initials	UPM
local.publisher.program	Engenharia Elétrica e Computação
local.subject.cnpq	CNPQ::ENGENHARIAS

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: VITOR DA SILVA SOUZA - protegido.pdf
Tamanho:: 826.18 KB
Formato:: Adobe Portable Document Format
Descrição:

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 2.22 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Engenharia Elétrica e Computação - Dissertações - EE Higienópolis