Redução da dimensionalidade em bigdata
dc.contributor.advisor | Borba, Anderson | |
dc.contributor.author | Machado, Lucca | |
dc.date.accessioned | 2024-03-26T14:40:47Z | |
dc.date.available | 2024-03-26T14:40:47Z | |
dc.date.issued | 2023-12-08 | |
dc.description | Indicado para publicação. | |
dc.description.abstract | Devido a revolução tecnológica, mais dados estão sendo gerados no dia a dia de forma exponencial, causando problemas de processamento e de armazenamento. Por este motivo, este projeto de TCC busca por meio dos algoritmos PCA, Kernel PCA e LDA reduzir a dimensionalidade dos dados solucionar este problema. O objetivo é comparar suas capacidades de redução de dimensionalidade em bases de dados estruturada e fazer uma análise na prática do tempo de processamento e, utilizando o RandomForest, relatar a taxa de acerto da previsão dos dados. A abordagem teórico-metodológica envolve revisão literária, análise matemática e estudo de aplicações. Também com o objetivo de comparar a capacidades de redução de dimensionalidade, vamos utilizar o PCA em uma base de dados não estruturada composta por 200 imagens. As comparações foram realizadas analisando a capacidade de preservação da qualidade, tempo de processamento e economia de armazenamento. Foram mostrados resultados que permitiram comparar as técnicas em termos de preservação de informações e tempo de processamento. Experimentos com conjuntos de dados e métricas de avaliação foram realizados. Os resultados forneceram percepções valiosos para aplicação prática em análise de dados multivariados. | |
dc.description.abstract | Due to the technological revolution, more data is being generated exponentially on a daily basis, causing processing and storage problems. For this reason, this TCC project seeks, through PCA, Kernel PCA and LDA algorithms, to reduce the dimensionality of the data to solve this problem. The objective is to compare their dimensionality reduction capabilities in structured databases and carry out a practical analysis of processing time and, using RandomForest, report the accuracy rate of data prediction. The theoretical methodological approach involves literary review, mathematical analysis and study of applications. Also with the aim of comparing dimensionality reduction capabilities, we will use PCA on an unstructured database consisting of 200 images. Compa risons were carried out analyzing the ability to preserve quality, processing time and storage savings. Results were shown that allowed the techniques to be compared in terms of information preservation and processing time. Experiments with datasets and ev aluation metrics were carried out. The results provided valuable insights for practical application in multivariate data analysis. | |
dc.identifier.uri | https://dspace.mackenzie.br/handle/10899/38272 | |
dc.language | pt_BR | |
dc.publisher | Universidade Presbiteriana Mackenzie | |
dc.subject | redução da dimensionalidade | |
dc.subject | PCA | |
dc.subject | kernel PCA | |
dc.subject | LDA | |
dc.subject | reduction dimensionality | |
dc.subject | PCA | |
dc.subject | kernel PCA | |
dc.subject | LDA | |
dc.title | Redução da dimensionalidade em bigdata | |
dc.type | TCC | |
local.publisher.department | Faculdade de Computação e Informática (FCI) |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- LUCCA DE CASTRO MACHADO ._5059161_assignsubmission_file_Redução da dimensionalidade em bigdata.pdf
- Tamanho:
- 749.34 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 2.22 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: