Engenharia Elétrica e Computação - Teses - EE Higienópolis
URI Permanente para esta coleção
Navegar
Navegando Engenharia Elétrica e Computação - Teses - EE Higienópolis por Orientador "Silva, Leandro Augusto da"
Agora exibindo 1 - 5 de 5
Resultados por página
Opções de Ordenação
- TeseAlgoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19Sargiani, Vagner (2022-08-12)
Escola de Engenharia Mackenzie (EE)
A classificação de dados é um processo automático ou semi-automático que, utilizando Inteligência Artificial (IA), a relação das variáveis descritivas e de classificação de um conjunto de dados é aprendida por um algoritmo para uso a posteriori em situações onde o resultado da classe é desconhecido. Por muitos anos, o trabalho neste tópico tem tido como objetivo aumentar a taxa de acerto dos algoritmos. Entretanto, em aplicações no contexto da saúde, além da preocupação com o desempenho, também é necessário projetar algoritmos com resultado compreensível para o especialista responsável pela tomada de decisão. Dentre os problemas da medicina, um dos grandes focos de pesquisa neste período está relacionado a COVID. E o uso de IA pode auxiliar no diagnóstico precoce. Dentre os dados disponíveis de COVID-19, o exame de sangue é um procedimento típico realizado quando o paciente procura o hospital e o seu uso no diagnóstico permite, entre outras coisas, a reduzir a realização de outros exames de diagnóstico que pode impactar no tempo da detecção e nos gastos dos exames. Neste trabalho propõe-se o uso de redes neurais do tipo Self-Organizing Maps (SOM) como base para descobrir os fatores do exame de sangue que são mais relevantes no diagnóstico de COVID-19. O trabalho propões usar SOM e cálculo de entropia para criação de um modelo hierárquico semi supervisionado explicável, chamado TESSOM (de Tree-based Entropy Structured Self-Organizing Maps), o qual tem como característica ampliar a investigação de grupos de casos em que há maior sobreposição de classes (diagnóstico). Enquadrar o algoritmo TESSOM no contexto de Inteligência Artificial Explicável (XAI) permite que seja possível explicar os resultados ao especialista de uma forma simplificada. É demonstrado no trabalho que o uso do algoritmo TESSOM para identificação de atributos de exames de sangue pode auxiliar nas pesquisas sobre identificação de casos de COVID-19, além de possuir o desempenho 1,489% melhor em multicenários ao analisar uma base de 2207 casos de 3 hospitais no estado de São Paulo, Brasil. Este trabalho é um ponto de partida importante para que pesquisadores possam identificar atributos relevantes de exames de sangue não apenas para COVID-19, mas como apoio para diagnóstico de outras doenças. - TeseComposição de um indicador de qualidade para classificações binárias com base na qualidade e na complexidade dos dadosMendes, Renê de Ávila (2021-12-10)
Escola de Engenharia Mackenzie (EE)
A classificação de dados é uma tarefa de mineração de dados que consiste na aplicação de um algoritmo a conjunto de dados de treinamento com a finalidade de inferir a classe de um objeto (não classificado) em análise. Uma parte significa tiva do desempenho do algoritmo de classificação depende da complexidade e da qualidade do conjunto de dados. A Complexidade dos Dados envolve a investigação dos efeitos da dimensionalidade, da sobreposição de atributos e da separabilidade das classes. A Qualidade dos Dados, no que lhe concerne, se concentra em aspectos como ruídos e valores ausentes. Na literatura são poucos os estudos que debatem a relação entre os fatores, complexidade e qualidade, visando ponderar a influência de cada um na qualidade do desempenho de um algoritmo. Esta pesquisa aplica a Modelagem de Equações Estruturais (SEM) e o algoritmo Partial Least Squa res Structural Equation Modeling (PLS-SEM) e, de forma inovadora, apresenta um indicador composto, chamado de Indicador de Qualidade de Classificação para con juntos de dados binários (IQCb), que associa as contribuições da Complexidade dos Dados e da Qualidade dos Dados para a Qualidade da Classificação. A mode lagem experimental com 178 conjuntos de dados obtidos do repositório OpenML mostrou que o controle da complexidade melhora os resultados da classificação mais do que a qualidade dos dados. Adicionalmente, esta tese também apresenta uma ferramenta visual para a avaliação de conjuntos de dados quanto ao desempenho de classificação. - TeseFramework baseado em ciência de dados e engenharia de software para analisar a evolução de habilidades e competências do pensamento computacionalSouza, Alexandra Aparecida de (2019-12-09)
Escola de Engenharia Mackenzie (EE)
Pensamento Computacional tem se tornado uma capacidade requerida no processo de formação de estudantes para atender ao avanço tecnológico que está transformando os modelos de negócio. O uso de oficinas de jogos digitais que utilizam o Construcionismo como abordagem de ensino tem apresentado resultados educacionais promissores no desenvolvimento desta competência. Contudo a avaliação adequada da sua efetividade e, consequentemente, do progresso do aluno, ainda se constitui um desafio. Frente ao exposto, este trabalho apresenta um framework baseado em Ciência de Dados, que tem como objetivo facilitar o processo de descobrimento de padrões e comportamentos que remetem à aquisição do Pensamento Computacional, por meio da abordagem de análise sob diferentes níveis de abstração e da análise de agrupamento com uso de uma rede neural artificial não supervisionada conhecida na literatura como SOM (Self-Organizing Maps). O framework é estruturado em cinco visões: Ensino-Aprendizagem, Estrutural, Análise de Agrupamento, Processos e Learning Analytics, que organizam as atividades do processo de mineração dos dados e são norteadas pelas questões que devem ser respondidas pelo conhecimento adquirido, visando à avaliação da evolução das habilidades e competências do Pensamento Computacional. Um estudo de caso foi efetuado utilizando uma oficina de jogos digitais de características construcionistas utilizando Scratch (com 130 alunos de 3 cursos e 2 diferentes níveis, gerando 898 arquivos). Os resultados apontam para a viabilidade do framework, destacando: (1) o estabelecimento das questões direcionou o foco de todo o processo de mineração dos dados na busca de suas respostas; (2) o conhecimento provido pela Visão Ensino-Aprendizagem permitiu entender os dados gerados ao longo da execução da oficina; (3) a visão Estrutural permitiu identificar quais dados que devem compor a base de dados para responder às questões estabelecidas; (4) a influência e o conhecimento providos pela visão de Análise de Agrupamento devido à capacidade de uso dos mapas SOM em diferentes análises, permitiram a identificação de padrões e comportamentos que revelaram o efeito gerado pelo processo de ensino-aprendizagem, caracterizando o caminho praticado pelos alunos com construção do conhecimento abaixo, dentro e acima do esperado; por fim, as descobertas nos dados permitiram a visão Learning Analytics promover a melhoria contínua do processo de ensino-aprendizagem. - TeseOtimização da seleção dinâmica de ensemble em classificação: integrando seleção de protótipos e metaclassificadoresManastarla, Alberto (2024-09-27)
Escola de Engenharia Mackenzie (EE)
No campo da aprendizagem de máquina, o uso de sistemas de múltiplos classificadores (MCS) tem sido reconhecido como eficaz para alcançar altas taxas de reconhecimento no campo de aprendizado de máquina. Entre esses sistemas, as técnicas de seleção dinâmica de ensemble (DES) se destacam, porque diferentes modelos ou classificadores podem ser competentes (ou es pecialistas) em diferentes regiões locais do espaço de características, também conhecidas como regiões de competência. Por essa razão, uma abordagem conveniente é selecionar o(s) modelo(s) mais promissor(es) para uma dada instância em análise. A competência dos classificadores, ge ralmente, é estimada de acordo com um determinado critério, calculado na vizinhança (região de competência) da instância em análise, definida em um conjunto de validação previamente esta belecido. Um problema surge quando há um alto grau de ruído nos dados de validação, fazendo com que as instâncias pertencentes à região de competência não representem a instância em análise. Nesses casos, a técnica de seleção dinâmica pode escolher um classificador (modelo) que se ajustou demais ou se subajustou à região de competência em questão, em vez daquele com o melhor desempenho de generalização. Também, uma outra questão importante no DES é definir o critério adequado para calcular a competência dos classificadores, considerando que existem diversos critérios disponíveis. Usar apenas um critério pode levar a uma estimativa ina dequada da competência do(s) classificador(es). Para abordar essas questões, foi desenvolvido o SGP-DES (Self-generating Prototype Dynamic Ensemble Selection), um novo framework de seleção dinâmica de ensemble que combina técnicas de seleção de protótipos, extração de me tainformações e um metaclassificador versátil. A versatilidade deste metaclassificador provém de sua capacidade de operar tanto com modelos otimizados quanto com modelos baseados em instâncias, ambos destinados a avaliar e selecionar de forma dinâmica, a partir de um pool de classificadores inicialmente gerado, os classificadores mais promissores para compor os ensem bles de classificadores finais que farão a predição do rótulo de classe das instâncias analisadas durante a fase de generalização do framework. O SGP-DES incorpora diversos critérios de se leção para avaliar a competência dos classificadores e adapta-se às variações nas condições de classificação. Ele utiliza metacaracterísticas derivadas das regiões de competência das instân cias analisadas, estabelecidas por protótipos representativos do conjunto de treinamento original que foram utilizados para formar o conjunto de validação. Essa estratégia permite ao metaclas sificador prever quais serão os classificadores mais eficazes, dado uma instância em análise. No entanto, a adequação de alguns critérios de seleção pode variar conforme o tipo de problema de classificação. Condições particulares nos dados, como alta demanda de armazenamento, resposta lenta do processo de classificação e baixa tolerância a ruídos, podem comprometer a eficiência ou precisão desses critérios. Por isso, é importante que o método de seleção de pro tótipos, responsável por formar o conjunto de validação e de onde serão definidas as regiões de competência das instâncias analisadas, seja adaptável ao problema de classificação em questão, de modo a otimizar a eficácia do metaclassificador no processo de seleção dos classificadores mais aptos para predizer corretamente o rótulo de classe das instâncias analisadas. Experimentos realizados com conjuntos de dados públicos amplamente conhecidos na literatura demonstraram que o SGP-DES supera os métodos DES de última geração, assim como os métodos tradicionais de modelo único e de ensemble, em termos de acurácia, confirmando sua eficácia em uma ampla gama de contextos de classificação. - TeseOtimização de redes de sensores físicos e virtuais para monitoramento de monóxido de carbono na região metropolitana de São PauloBorges, Marco Aurelio (2024-12-06)
Escola de Engenharia Mackenzie (EE)
Um dos problemas que afeta as grandes cidades é a poluição do ar, causadora de doenças respiratórias. Embora existam sensores para monitorar este tipo de poluição, como Monóxido de Carbono (CO), um problema de pesquisa em aberto é identificar a quantidade ideal de sensores necessários para monitorar uma determinada região de maneira eficiente e precisa. Neste contexto, esta pesquisa propõe a elaboração de um método que otimize a quantidade de sensores utilizados para a criação de uma rede para monitorar a Região Metropolitana de São Paulo (RMSP). Para tanto, foi realizado um estudo de caso com a base de dados do Instituto Nacional de Metrologia (INMET), que fornece medições de temperatura e umidade pertinentes da área em questão, e sensores físicos que medem temperatura, umidade e CO. A proposta consiste em definir uma rede de sensores virtuais, na qual o valor de cada dispositivo é dado por um modelo de interpolação espacial denominado Inverse Distance Weighting (IDW). A partir disso, propõe-se o modelo de Fragmentação em Grupos por Rota (FGR), que visa distribuir os sensores em microrregiões com características semelhantes em termos de poluição. Como resultado, ´e apresentado, com detalhes, a distribuição do CO realizada pelo método de Monte Carlo, o qual tem a capacidade de gerar coordenadas dentro dos limites de latitude e longitude da área analisada. O principal resultado obtido foi o mapeamento de 36.378 medições de CO dentro da RMSP e a redução da quantidade de sensores empregados em 55% com uma variância média de 0.0563 para cada sensor.