Um método para extração de palavras-chave de documentos representados em grafos

dc.contributor.advisorSilva, Leandro Nunes de Castropt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2741458816539568por
dc.contributor.authorAbilhoa, Willyan Danielpt_BR
dc.creator.Latteshttp://lattes.cnpq.br/9259859626470172por
dc.date.accessioned2016-03-15T19:37:48Z
dc.date.accessioned2020-05-28T18:08:35Z
dc.date.available2014-06-30pt_BR
dc.date.available2020-05-28T18:08:35Z
dc.date.issued2014-02-05pt_BR
dc.description.abstractO Twitter é um serviço de microblog que gera um grande volume de dados textuais. Todo esse conteúdo precisa ser explorado por meio de técnicas de mineração de textos, processamento de linguagem natural e recuperação de informação com o objetivo de extrair um conhecimento que seja útil de alguma forma ou em algum processo. Nesse contexto, a extração automática de palavras-chave é uma tarefa que pode ser usada para a indexação, sumarização e compreensão de documentos. Um passo fundamental nas técnicas de mineração de textos consiste em construir um modelo de representação de documentos. O modelo chamado mode-lo de espaço vetorial, VSM, é o mais conhecido e utilizado dentre essas técnicas. No entanto, algumas dificuldades e limitações do VSM, tais como escalabilidade e esparsidade, motivam a proposta de abordagens alternativas. O presente trabalho propõe o método TKG (Twitter Keyword Graph) de extração de palavras-chave de coleções de tweets que representa textos como grafos e aplica medidas de centralidade para encontrar vértices relevantes, correspondentes às palavras-chave. Para medir o desempenho da abordagem proposta, dois diferentes experimentos são realizados e comparações com TF-IDF e KEA são feitas, tendo classifica-ções humanas como referência. Os experimentos realizados mostraram que algumas variações do TKG são superiores a outras e também aos algoritmos usados para comparação.por
dc.description.sponsorshipFundação de Amparo a Pesquisa do Estado de São Paulopt_BR
dc.formatapplication/pdfpor
dc.identifier.citationABILHOA, Willyan Daniel. Um método para extração de palavras-chave de documentos representados em grafos. 2014. 87 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2014.por
dc.identifier.urihttp://dspace.mackenzie.br/handle/10899/24351
dc.languageporpor
dc.publisherUniversidade Presbiteriana Mackenziepor
dc.rightsAcesso Abertopor
dc.subjectmineração de textospor
dc.subjectrepresentação de textos em grafopor
dc.subjectextração de palavras-chavepor
dc.subjectmedidas de centralidadepor
dc.subjecttext miningeng
dc.subjecttext representation in graphseng
dc.subjectkeyword extractioneng
dc.subjectcentrality measureseng
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICApor
dc.thumbnail.urlhttp://tede.mackenzie.br/jspui/retrieve/3853/Willyan%20Daniel%20Abilhoa.pdf.jpg*
dc.titleUm método para extração de palavras-chave de documentos representados em grafospor
dc.typeDissertaçãopor
local.contributor.board1Oliveira, Pedro Paulo Balbi dept_BR
local.contributor.board1Latteshttp://lattes.cnpq.br/9556738277476279por
local.contributor.board2Omar, Nizampt_BR
local.contributor.board2Latteshttp://lattes.cnpq.br/2067336430076971por
local.contributor.board3Carvalho, Marco Antônio Garcia dept_BR
local.contributor.board3Latteshttp://lattes.cnpq.br/6366443994619479por
local.contributor.board4França, Fabricio Olivetti dept_BR
local.contributor.board4Latteshttp://lattes.cnpq.br/8788356220698686por
local.publisher.countryBRpor
local.publisher.departmentEngenharia Elétricapor
local.publisher.initialsUPMpor
local.publisher.programEngenharia Elétricapor
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Willyan Daniel Abilhoa.pdf
Tamanho:
1.87 MB
Formato:
Adobe Portable Document Format
Descrição: