Um método para extração de palavras-chave de documentos representados em grafos
dc.contributor.advisor | Silva, Leandro Nunes de Castro | pt_BR |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/2741458816539568 | por |
dc.contributor.author | Abilhoa, Willyan Daniel | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/9259859626470172 | por |
dc.date.accessioned | 2016-03-15T19:37:48Z | |
dc.date.accessioned | 2020-05-28T18:08:35Z | |
dc.date.available | 2014-06-30 | pt_BR |
dc.date.available | 2020-05-28T18:08:35Z | |
dc.date.issued | 2014-02-05 | pt_BR |
dc.description.abstract | O Twitter é um serviço de microblog que gera um grande volume de dados textuais. Todo esse conteúdo precisa ser explorado por meio de técnicas de mineração de textos, processamento de linguagem natural e recuperação de informação com o objetivo de extrair um conhecimento que seja útil de alguma forma ou em algum processo. Nesse contexto, a extração automática de palavras-chave é uma tarefa que pode ser usada para a indexação, sumarização e compreensão de documentos. Um passo fundamental nas técnicas de mineração de textos consiste em construir um modelo de representação de documentos. O modelo chamado mode-lo de espaço vetorial, VSM, é o mais conhecido e utilizado dentre essas técnicas. No entanto, algumas dificuldades e limitações do VSM, tais como escalabilidade e esparsidade, motivam a proposta de abordagens alternativas. O presente trabalho propõe o método TKG (Twitter Keyword Graph) de extração de palavras-chave de coleções de tweets que representa textos como grafos e aplica medidas de centralidade para encontrar vértices relevantes, correspondentes às palavras-chave. Para medir o desempenho da abordagem proposta, dois diferentes experimentos são realizados e comparações com TF-IDF e KEA são feitas, tendo classifica-ções humanas como referência. Os experimentos realizados mostraram que algumas variações do TKG são superiores a outras e também aos algoritmos usados para comparação. | por |
dc.description.sponsorship | Fundação de Amparo a Pesquisa do Estado de São Paulo | pt_BR |
dc.format | application/pdf | por |
dc.identifier.citation | ABILHOA, Willyan Daniel. Um método para extração de palavras-chave de documentos representados em grafos. 2014. 87 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2014. | por |
dc.identifier.uri | http://dspace.mackenzie.br/handle/10899/24351 | |
dc.language | por | por |
dc.publisher | Universidade Presbiteriana Mackenzie | por |
dc.rights | Acesso Aberto | por |
dc.subject | mineração de textos | por |
dc.subject | representação de textos em grafo | por |
dc.subject | extração de palavras-chave | por |
dc.subject | medidas de centralidade | por |
dc.subject | text mining | eng |
dc.subject | text representation in graphs | eng |
dc.subject | keyword extraction | eng |
dc.subject | centrality measures | eng |
dc.subject.cnpq | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA | por |
dc.thumbnail.url | http://tede.mackenzie.br/jspui/retrieve/3853/Willyan%20Daniel%20Abilhoa.pdf.jpg | * |
dc.title | Um método para extração de palavras-chave de documentos representados em grafos | por |
dc.type | Dissertação | por |
local.contributor.board1 | Oliveira, Pedro Paulo Balbi de | pt_BR |
local.contributor.board1Lattes | http://lattes.cnpq.br/9556738277476279 | por |
local.contributor.board2 | Omar, Nizam | pt_BR |
local.contributor.board2Lattes | http://lattes.cnpq.br/2067336430076971 | por |
local.contributor.board3 | Carvalho, Marco Antônio Garcia de | pt_BR |
local.contributor.board3Lattes | http://lattes.cnpq.br/6366443994619479 | por |
local.contributor.board4 | França, Fabricio Olivetti de | pt_BR |
local.contributor.board4Lattes | http://lattes.cnpq.br/8788356220698686 | por |
local.publisher.country | BR | por |
local.publisher.department | Engenharia Elétrica | por |
local.publisher.initials | UPM | por |
local.publisher.program | Engenharia Elétrica | por |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Willyan Daniel Abilhoa.pdf
- Tamanho:
- 1.87 MB
- Formato:
- Adobe Portable Document Format
- Descrição: