Criação de um indicador de qualidade de dados para problemas de modelagem preditiva
Carregando...
Arquivos
Tipo
Dissertação
Data de publicação
2018-10-24
Periódico
Citações (Scopus)
Autores
Ferreira, Marcos
Orientador
Silva, Leandro Augusto da
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Vallim Filho, Arnaldo Rabello de Aguiar
Prado, Edmir Parada Vasques
Prado, Edmir Parada Vasques
Programa
Engenharia Elétrica
Resumo
Qualidade de dados é um tema relevante em tarefas de Mineração de Dados. Resultados errados podem ser obtidos quando se usa um conjunto de dados com qualidade pobre. Os padrões de governança adotados pela comunidade da prática em Mineração de Dados são genéricos e abstratos e, embora enfatizando a importância da tarefa de exploração do conjunto de dados, não fornecem um referencial de avaliação quantitativa de qualidade de um conjunto de dados. Nesse trabalho, propõe-se um indicador numérico para avaliação da qualidade de dados, usando as técnicas de estatística descritiva, avaliando a qualidade dos dados de uma maneira estruturada. Esse indicador avalia problemas no conjunto de dados, atribuindo notas ponderadas e gera uma média geral, indicando se ajustamentos devem ser efetuado antes de se prosseguir com as tarefas de mineração.
Descrição
Palavras-chave
qualidade de dados , complexidade de dados , governança , pré-processamento , data profiling
Assuntos Scopus
Citação
FERREIRA, Marcos. Criação de um indicador de qualidade de dados para problemas de modelagem preditiva. 2018. 172 f. Dissertação( Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo.