Use este identificador para citar ou linkar para este item: http://dspace.mackenzie.br/handle/10899/13043
Tipo do documento: Dissertação
Título: Enxame de partículas aplicado ao agrupamento de textos
Enxame de partículas aplicado ao agrupamento de textos
Autor: Prior, Ana Karina Fontes
Primeiro orientador: Silva, Leandro Nunes de Castro
Primeiro membro da banca: Silva, Leandro Augusto da
Segundo membro da banca: Carvalho, Marco Antônio Garcia de
Resumo: A grande quantidade de dados gerados por pessoas e organizações tem estimulado a pesquisa sobre métodos efetivos e automáticos de extração de conhecimentos a partir de bases de dados. Essa dissertação propõe duas novas técnicas bioinspiradas, denominadas cPSC e oPSC, baseadas no algoritmo de otimização por enxame de partículas (PSO - Particle Swarm Optimization) para resolver problemas de agrupamento de dados. Os algoritmos propostos são aplicados a problemas de agrupamento de dados e textos, e seus desempenhos são comparados com outros propostos na literatura específica. Os resultados obtidos nos permitem concluir que os algoritmos propostos são competitivos com aqueles já disponíveis na literatura, porém trazem outros benefícios como a determinação automática do número de grupos nas bases e a efetuação de uma busca pelo melhor particionamento possível da base considerando uma função de custo explícita.
Abstract: The large number of data generated by people and organizations has stimulated the research on effective and automatic methods of knowledge extraction from databases. This dissertation proposes two new bioinspired techniques, named cPSC and oPSC, based on the Particle Swarm Optimization Algorithm (PSO) to solve data clustering problems. The proposed algorithms are applied to data and text clustering problems and their performances are compared with a standard algorithm from the literature. The results allow us to conclude that the proposed algorithms are competitive with those already available in literature, but bring benefits such as automatic determination of the number of groups on the dataset and a search for the best partitioning of the dataset considering an explicit cost function.
Palavras-chave: enxame de partículas;  mineração de textos;  mineração de dados;  agrupamento de textos;  agrupamento de dados;  particle swarms;  text mining;  data mining;  clustering
Área(s) do CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Idioma: por
País: BR
Instituição: Universidade Presbiteriana Mackenzie
Sigla da instituição: UPM
Departamento: Engenharia Elétrica
Programa: Engenharia Elétrica
Tipo de acesso: Acesso Aberto
URI: http://tede.mackenzie.br/jspui/handle/tede/1398
http://dspace.mackenzie.br/handle/10899/13043
Data de defesa: 22-Dez-2010
metadata.dc.bitstream.url: http://tede.mackenzie.br/jspui/bitstream/tede/1398/1/Ana%20Karina%20Fontes%20Prior.pdf
Aparece nas coleções:Engenharia Elétrica - Dissertações - EE Higienópolis

Arquivos associados a este item:
Não existem arquivos associados a este item.


Este arquivo é protegido por direitos autorais



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.