Otimização da seleção dinâmica de ensemble em classificação: integrando seleção de protótipos e metaclassificadores
Carregando...
Tipo
Tese
Data de publicação
2024-09-27
Periódico
Citações (Scopus)
Autores
Manastarla, Alberto
Orientador
Silva, Leandro Augusto da
Título da Revista
ISSN da Revista
Título de Volume
Membros da banca
Ruivo, Eurico Luiz Prospero
Cavalcanti, George Darmiton da Cunha
Vallim Filho, Arnaldo Rabello de Aguiar
Lorena, Ana Carolina
Cavalcanti, George Darmiton da Cunha
Vallim Filho, Arnaldo Rabello de Aguiar
Lorena, Ana Carolina
Programa
Engenharia Elétrica e Computação
Resumo
No campo da aprendizagem de máquina, o uso de sistemas de múltiplos classificadores (MCS)
tem sido reconhecido como eficaz para alcançar altas taxas de reconhecimento no campo de
aprendizado de máquina. Entre esses sistemas, as técnicas de seleção dinâmica de ensemble
(DES) se destacam, porque diferentes modelos ou classificadores podem ser competentes (ou es pecialistas) em diferentes regiões locais do espaço de características, também conhecidas como
regiões de competência. Por essa razão, uma abordagem conveniente é selecionar o(s) modelo(s)
mais promissor(es) para uma dada instância em análise. A competência dos classificadores, ge ralmente, é estimada de acordo com um determinado critério, calculado na vizinhança (região de
competência) da instância em análise, definida em um conjunto de validação previamente esta belecido. Um problema surge quando há um alto grau de ruído nos dados de validação, fazendo
com que as instâncias pertencentes à região de competência não representem a instância em
análise. Nesses casos, a técnica de seleção dinâmica pode escolher um classificador (modelo)
que se ajustou demais ou se subajustou à região de competência em questão, em vez daquele
com o melhor desempenho de generalização. Também, uma outra questão importante no DES
é definir o critério adequado para calcular a competência dos classificadores, considerando que
existem diversos critérios disponíveis. Usar apenas um critério pode levar a uma estimativa ina dequada da competência do(s) classificador(es). Para abordar essas questões, foi desenvolvido
o SGP-DES (Self-generating Prototype Dynamic Ensemble Selection), um novo framework de
seleção dinâmica de ensemble que combina técnicas de seleção de protótipos, extração de me tainformações e um metaclassificador versátil. A versatilidade deste metaclassificador provém
de sua capacidade de operar tanto com modelos otimizados quanto com modelos baseados em
instâncias, ambos destinados a avaliar e selecionar de forma dinâmica, a partir de um pool de
classificadores inicialmente gerado, os classificadores mais promissores para compor os ensem bles de classificadores finais que farão a predição do rótulo de classe das instâncias analisadas
durante a fase de generalização do framework. O SGP-DES incorpora diversos critérios de se leção para avaliar a competência dos classificadores e adapta-se às variações nas condições de
classificação. Ele utiliza metacaracterísticas derivadas das regiões de competência das instân cias analisadas, estabelecidas por protótipos representativos do conjunto de treinamento original
que foram utilizados para formar o conjunto de validação. Essa estratégia permite ao metaclas sificador prever quais serão os classificadores mais eficazes, dado uma instância em análise. No
entanto, a adequação de alguns critérios de seleção pode variar conforme o tipo de problema
de classificação. Condições particulares nos dados, como alta demanda de armazenamento,
resposta lenta do processo de classificação e baixa tolerância a ruídos, podem comprometer a
eficiência ou precisão desses critérios. Por isso, é importante que o método de seleção de pro tótipos, responsável por formar o conjunto de validação e de onde serão definidas as regiões de
competência das instâncias analisadas, seja adaptável ao problema de classificação em questão,
de modo a otimizar a eficácia do metaclassificador no processo de seleção dos classificadores
mais aptos para predizer corretamente o rótulo de classe das instâncias analisadas. Experimentos
realizados com conjuntos de dados públicos amplamente conhecidos na literatura demonstraram
que o SGP-DES supera os métodos DES de última geração, assim como os métodos tradicionais
de modelo único e de ensemble, em termos de acurácia, confirmando sua eficácia em uma ampla
gama de contextos de classificação.
Descrição
Palavras-chave
ensemble de classificadores , sistemas de múltiplos classificadores , seleção de protótipos , seleção dinâmica de ensemble , meta-aprendizagem