Redução da dimensionalidade em bigdata

dc.contributor.advisorBorba, Anderson
dc.contributor.authorMachado, Lucca
dc.date.accessioned2024-03-26T14:40:47Z
dc.date.available2024-03-26T14:40:47Z
dc.date.issued2023-12-08
dc.descriptionIndicado para publicação.
dc.description.abstractDevido a revolução tecnológica, mais dados estão sendo gerados no dia a dia de forma exponencial, causando problemas de processamento e de armazenamento. Por este motivo, este projeto de TCC busca por meio dos algoritmos PCA, Kernel PCA e LDA reduzir a dimensionalidade dos dados solucionar este problema. O objetivo é comparar suas capacidades de redução de dimensionalidade em bases de dados estruturada e fazer uma análise na prática do tempo de processamento e, utilizando o RandomForest, relatar a taxa de acerto da previsão dos dados. A abordagem teórico-metodológica envolve revisão literária, análise matemática e estudo de aplicações. Também com o objetivo de comparar a capacidades de redução de dimensionalidade, vamos utilizar o PCA em uma base de dados não estruturada composta por 200 imagens. As comparações foram realizadas analisando a capacidade de preservação da qualidade, tempo de processamento e economia de armazenamento. Foram mostrados resultados que permitiram comparar as técnicas em termos de preservação de informações e tempo de processamento. Experimentos com conjuntos de dados e métricas de avaliação foram realizados. Os resultados forneceram percepções valiosos para aplicação prática em análise de dados multivariados.
dc.description.abstractDue to the technological revolution, more data is being generated exponentially on a daily basis, causing processing and storage problems. For this reason, this TCC project seeks, through PCA, Kernel PCA and LDA algorithms, to reduce the dimensionality of the data to solve this problem. The objective is to compare their dimensionality reduction capabilities in structured databases and carry out a practical analysis of processing time and, using RandomForest, report the accuracy rate of data prediction. The theoretical methodological approach involves literary review, mathematical analysis and study of applications. Also with the aim of comparing dimensionality reduction capabilities, we will use PCA on an unstructured database consisting of 200 images. Compa risons were carried out analyzing the ability to preserve quality, processing time and storage savings. Results were shown that allowed the techniques to be compared in terms of information preservation and processing time. Experiments with datasets and ev aluation metrics were carried out. The results provided valuable insights for practical application in multivariate data analysis.
dc.identifier.urihttps://dspace.mackenzie.br/handle/10899/38272
dc.languagept_BR
dc.publisherUniversidade Presbiteriana Mackenzie
dc.subjectredução da dimensionalidade
dc.subjectPCA
dc.subjectkernel PCA
dc.subjectLDA
dc.subjectreduction dimensionality
dc.subjectPCA
dc.subjectkernel PCA
dc.subjectLDA
dc.titleRedução da dimensionalidade em bigdata
dc.typeTCC
local.publisher.departmentFaculdade de Computação e Informática (FCI)
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
LUCCA DE CASTRO MACHADO ._5059161_assignsubmission_file_Redução da dimensionalidade em bigdata.pdf
Tamanho:
749.34 KB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.22 KB
Formato:
Item-specific license agreed upon to submission
Descrição: