Otimização da seleção dinâmica de ensemble em classificação: integrando seleção de protótipos e metaclassificadores

Carregando...
Imagem de Miniatura
Tipo
Tese
Data de publicação
2024-09-27
Periódico
Citações (Scopus)
Autores
Manastarla, Alberto
Orientador
Silva, Leandro Augusto da
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Ruivo, Eurico Luiz Prospero
Cavalcanti, George Darmiton da Cunha
Vallim Filho, Arnaldo Rabello de Aguiar
Lorena, Ana Carolina
Programa
Engenharia Elétrica e Computação
Resumo
No campo da aprendizagem de máquina, o uso de sistemas de múltiplos classificadores (MCS) tem sido reconhecido como eficaz para alcançar altas taxas de reconhecimento no campo de aprendizado de máquina. Entre esses sistemas, as técnicas de seleção dinâmica de ensemble (DES) se destacam, porque diferentes modelos ou classificadores podem ser competentes (ou es pecialistas) em diferentes regiões locais do espaço de características, também conhecidas como regiões de competência. Por essa razão, uma abordagem conveniente é selecionar o(s) modelo(s) mais promissor(es) para uma dada instância em análise. A competência dos classificadores, ge ralmente, é estimada de acordo com um determinado critério, calculado na vizinhança (região de competência) da instância em análise, definida em um conjunto de validação previamente esta belecido. Um problema surge quando há um alto grau de ruído nos dados de validação, fazendo com que as instâncias pertencentes à região de competência não representem a instância em análise. Nesses casos, a técnica de seleção dinâmica pode escolher um classificador (modelo) que se ajustou demais ou se subajustou à região de competência em questão, em vez daquele com o melhor desempenho de generalização. Também, uma outra questão importante no DES é definir o critério adequado para calcular a competência dos classificadores, considerando que existem diversos critérios disponíveis. Usar apenas um critério pode levar a uma estimativa ina dequada da competência do(s) classificador(es). Para abordar essas questões, foi desenvolvido o SGP-DES (Self-generating Prototype Dynamic Ensemble Selection), um novo framework de seleção dinâmica de ensemble que combina técnicas de seleção de protótipos, extração de me tainformações e um metaclassificador versátil. A versatilidade deste metaclassificador provém de sua capacidade de operar tanto com modelos otimizados quanto com modelos baseados em instâncias, ambos destinados a avaliar e selecionar de forma dinâmica, a partir de um pool de classificadores inicialmente gerado, os classificadores mais promissores para compor os ensem bles de classificadores finais que farão a predição do rótulo de classe das instâncias analisadas durante a fase de generalização do framework. O SGP-DES incorpora diversos critérios de se leção para avaliar a competência dos classificadores e adapta-se às variações nas condições de classificação. Ele utiliza metacaracterísticas derivadas das regiões de competência das instân cias analisadas, estabelecidas por protótipos representativos do conjunto de treinamento original que foram utilizados para formar o conjunto de validação. Essa estratégia permite ao metaclas sificador prever quais serão os classificadores mais eficazes, dado uma instância em análise. No entanto, a adequação de alguns critérios de seleção pode variar conforme o tipo de problema de classificação. Condições particulares nos dados, como alta demanda de armazenamento, resposta lenta do processo de classificação e baixa tolerância a ruídos, podem comprometer a eficiência ou precisão desses critérios. Por isso, é importante que o método de seleção de pro tótipos, responsável por formar o conjunto de validação e de onde serão definidas as regiões de competência das instâncias analisadas, seja adaptável ao problema de classificação em questão, de modo a otimizar a eficácia do metaclassificador no processo de seleção dos classificadores mais aptos para predizer corretamente o rótulo de classe das instâncias analisadas. Experimentos realizados com conjuntos de dados públicos amplamente conhecidos na literatura demonstraram que o SGP-DES supera os métodos DES de última geração, assim como os métodos tradicionais de modelo único e de ensemble, em termos de acurácia, confirmando sua eficácia em uma ampla gama de contextos de classificação.
Descrição
Palavras-chave
ensemble de classificadores , sistemas de múltiplos classificadores , seleção de protótipos , seleção dinâmica de ensemble , meta-aprendizagem
Assuntos Scopus
Citação