Criação de um indicador de qualidade de dados para problemas de modelagem preditiva

Thumbnail Image
item.page.type
Dissertação
Date
2018-10-24
item.page.ispartof
item.page.citationsscopus
Authors
Ferreira, Marcos
publication.page.advisor
Silva, Leandro Augusto da
Journal Title
Journal ISSN
Volume Title
publication.page.board
Vallim Filho, Arnaldo Rabello de Aguiar
Prado, Edmir Parada Vasques
publication.page.program
Engenharia Elétrica
Abstract
Qualidade de dados é um tema relevante em tarefas de Mineração de Dados. Resultados errados podem ser obtidos quando se usa um conjunto de dados com qualidade pobre. Os padrões de governança adotados pela comunidade da prática em Mineração de Dados são genéricos e abstratos e, embora enfatizando a importância da tarefa de exploração do conjunto de dados, não fornecem um referencial de avaliação quantitativa de qualidade de um conjunto de dados. Nesse trabalho, propõe-se um indicador numérico para avaliação da qualidade de dados, usando as técnicas de estatística descritiva, avaliando a qualidade dos dados de uma maneira estruturada. Esse indicador avalia problemas no conjunto de dados, atribuindo notas ponderadas e gera uma média geral, indicando se ajustamentos devem ser efetuado antes de se prosseguir com as tarefas de mineração.
Description
Keywords
qualidade de dados , complexidade de dados , governança , pré-processamento , data profiling
item.page.scopussubject
Citation
FERREIRA, Marcos. Criação de um indicador de qualidade de dados para problemas de modelagem preditiva. 2018. 172 f. Dissertação( Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo.