Engenharia Elétrica e Computação - Dissertações - EE Higienópolis

URI Permanente para esta coleção

Navegar

Submissões Recentes

Agora exibindo 1 - 5 de 261
  • Dissertação
    Detecção de deriva em redes neurais convolucionais aplicada ao reconhecimento de intenções em frases curtas
    Gonçalves Junior, Jairo Rodrigues (2023-10-20)

    Escola de Engenharia Mackenzie (EE)

    Avanços notáveis ocorreram nos modelos de linguagem natural, impulsionados pelo surgimento de transformadores pré-treinados e aprendizado profundo. Embora os resultados sejam promissores, persistem desafios quando esses modelos são aplicados em ambientes produtivos. Modelos de classificação estão em constante evolução, sendo alimentados por novos dados e realizando previsões de forma contínua. Entretanto, os dados podem gradualmente alterar sua distribuição de probabilidades, divergindo do conjunto de treinamento original usado para treinar o modelo. Esse fenômeno, denominado deriva do modelo, implica na degradação do desempenho do modelo. A deriva do modelo pode ser ocasionada por diversas razões a ser uma delas o desvio de conceito, que ocorre quando há mudanças apenas na classe prevista, sem afetar outros atributos. Outra causa está relacionada à mudança na distribuição dos dados, independentemente de afetar diretamente a classe. Este estudo tem como foco analisar a deriva de modelos de linguagem natural, empregando métodos que detectem de forma eficaz a deriva do modelo ao longo do tempo. Para esse fim, foram explorados detectores de deriva, incluindo analises de distância, como a distância de Wasserstein, testes de hipótese multivariados como Maximum Mean Discrepancy e Least-Squares Density Dierence, teste de divergência e de classificação como os método Jensen-Shannon e Classifier. Essas abordagens foram integradas a um fluxo de gerenciamento durante o treinamento do modelo de aprendizado de máquina. Tais estratégias contribuem para a supervisão contínua e a sustentabilidade dos modelos de linguagem natural, emitindo alertas à medida que o desempenho do modelo se degrada com o tempo. Os resultados deste estudo evidenciaram um notável sucesso na previsão de intenções. Essa avaliação foi realizada por meio da métrica de acurácia. O bom desempenho foi alcançado ao empregar o modelo BERT para incorporação e transformação das sentenças no conjunto de dados analisado, originário de postagens da rede social X. O processo de classificação dentre alguns métodos de incorporação de palavras se mostrou necessário para a analise dos métodos de detecção de deriva. Além de destacar a eficácia do modelo BERT, este estudo explora o método Maximum Mean Discrepancy, que se sobressai como uma abordagem na detecção de deriva no modelo na proposta do estudo. Especificamente, ao comparar-se com outros métodos em termos de detecção de desequilíbrio nos lotes de dados, este método revelou sua capacidade para identificar padrões de deriva. Sua habilidade em lidar com fenômenos como data drift foi notável, demonstrando um desempenho superior e consistente aos demais métodos explorados.
  • Dissertação
    Graphene microribbon array on silicon waveguide for sensing applications at Terahertz
    Santos, Iris de Oliveira Corcino dos (2023-05-19)

    Escola de Engenharia Mackenzie (EE)

    Este estudo apresenta uma análise numérica de perfil lateral ao longo do eixo de propagação para investigar uma matriz de microfita de grafeno (GMR) depositada em um guia de onda de silício, que é colocado sobre um substrato de sílica, para detectar mudanças no índice de refração do analito de 1 para 2 com um respectivo passo de 0.2 . A estrutura proposta aproveita as propriedades únicas do grafeno, silício e sílica, oferecendo alta sensibilidade e baixa perda para detecção de THz. A aplicação de tecnologias de guias de ondas planares permite o desenvolvimento de dispositivos multissensores compactos e miniaturas que podem se conectar à instrumentação usando fibras ópticas, proporcionando operação remota. Através de diagramas de dispersão o guia de onda de espessura h = 15 µm ´e selecionado com a frequência de corte do primeiro modo fundamental em torno de 2 THz. Aqui, as microfitas de grafeno espaçadas com periodicidade Λ = 4 µm, , sintonizadas em EF = 0.45 eV e Γ = 3.7 meV , demonstraram excitar a ressonância plasmônica de superfície (SPR) com eficiência nas frequências entre 3 THz e 4 THz. O impacto da modificação de variáveis como a largura da fita (rw) e o número de fitas (numrib) são examinados. Os resultados mostram que a manipulação dessas variáveis aumenta a geração do plasmon, mas também afeta fortemente a distribuição plasmônica modal ao longo da matriz. O artigo conclui que o equilíbrio entre essas características pode levar à otimização do desempenho do sensor. Portanto, alterando o índice de refração do analito, um sensor de sensibilidade muito alta de 8658 nm/RIU é apresentado para rw = 3 µm e numrib = 200.
  • Dissertação
    Caracterização de guias de onda de nitreto de silício para aplicações em detecção no infravermelho médio
    Oliveira, Emerson Candido de (2020-02-04)

    Escola de Engenharia Mackenzie (EE)

    O infravermelho médio (MIR) é uma faixa espectral que contém preciosas características vibracionais de moléculas orgânicas e Inorgânicas. Sensores espectroscópicos capazes de detectas estas transições são de extrema importância para aplicações biomédicas, por exemplo, onde se necessita de alta sensibilidade e poder de detecção. Sensores para o MIR tradicionais usualmente possuem o problema de não serem compactos, impossibilitando algumas aplicações in situ e in loco, além de não conseguirem detectar analitos em baixas concentrações. Sensores ópticos integrados no MIR têm o potencial de aumentarem a interação da matéria com a luz nesta faixa espectral, possibilitando aumentos significativos de poder de detecção. Usando técnicas de fabricação muito bem consolidadas da fotônica do silício, tais dispositivos podem ser fabricados em larga escala e com baixo custo, possibilitando também a miniaturização e aumento da robustez. Uma maneira de aumentar ainda mais a interação da luz com o analito é através da integração de nanomateriais, tais como o grafeno, pois apresentam um grande potencial de aplicação no MIR. As propriedades optoeletrônicas do grafeno podem ser controladas a partir da inserção ou remoção de portadores de carga, alterando seu nível de Fermi. Tais propriedades podem ser aproveitadas para a criação de sensores integrados no MIR. Neste trabalho são apresentadas caracterizações ópticas de guias de onda fabricados por PECVD e litografia óptica em nitreto de silício além da transferência de grafeno e dopagem por métodos químicos em sua superfície para aplicações em sensoriamento no infravermelho médio. A caracterização destes guias se deu em três faixas espectrais: visível (633nm), infravermelho próximo (980 e 1520 a 1570 nm) e infravermelho médio (2000 a 3000 nm). Os resultados obtidos nestas caracterizações, sobretudo no infravermelho médio, sugerem perdas elevadas, variando entre 17 e 35 dB para comprimentos de 4 mm na faixa de 2,00 a 2,50 um, devido a imperfeições na estrutura do guia à presença de contaminação com hidrogênio no nitreto de silício. Na presença do grafeno, tais perdas são ainda maiores, na ordem de 35 dB para a faixa de 2,0 a 2,1 e acima de 40 dB para comprimentos de onda maiores do que 2,2 um. Ao dopar o grafeno por submersão em solução de ácido nítrico durante 10 minutos, observa-se uma redução do nível de Fermi de 330 para 220 meV. A caracterização após dopagem sugere uma pequena diminuição na atenuação.
  • Dissertação
    Inteligência artificial explicável aplicada a hemogramas simples como suporte à tomada de decisão em diagnósticos de Covid-19
    Vallim, Marco Vinicius Bhering de Aguiar (2022-01-28)

    Escola de Engenharia Mackenzie (EE)

    A pandemia causada pela COVID-19 em decorrência da infecção causada pelo vírus SARS COV 2 mudou a dinâmica da humanidade e mobilizou várias áreas científicas para explorar soluções diagnósticas e terapias alternativas de maneira sem precedentes. Dessa forma, a Inteligência Artificial (IA) emerge como aliada para compreender o comporta mento do vírus, sendo usada como ferramenta de suporte à tomada de decisão na definição de diagnósticos acerca da infecção pelo vírus. Porém, um dos principais desafios apresentados no uso de IA na área de saúde decorre do fato de que os algoritmos com melhores resultados nas tarefas de predição são caixa preta e, portanto, não é possível interpretar a lógica da tomada de decisão do algoritmo. Isso é um problema porque nessa área é essencial equilibrar precisão e interpretabilidade, visto que os profissionais de saúde precisam entender os motivos que levam o sistema a gerar determinadas recomendações. Dessa forma, é necessário que os modelos de IA sejam capazes de fornecer altos índices de precisão em suas recomendações, mas também precisam ser interpretáveis pelos usuários, apontando para uma abordagem de Inteligência Artificial Explicável. Para buscar otimizar o tradeoff entre desempenho e explicabilidade, o estudo aqui apresentado utiliza um modelo híbrido com dois algoritmos interpretáveis (Mapas Auto-Organizáveis, SOM e Classificação Baseada em Associação, CBA) para diagnosticar por meio de hemogramas simples a infecção pelo vírus causado da COVID-19 e, assim, buscando criar um modelo de Inteligência Artificial Explicável que seja uma ferramenta de suporte na tomada da decisão diagnóstica desta doença. Esse estudo apresentou índices de desempenho superiores a quaisquer experimentos feitos com CBA ou SOM individualmente neste trabalho, chegando a uma acurácia média superior a 74,5%, além de apontar as variáveis mais relevantes relacionadas ao diagnóstico de Covid-19, como Hematócritos, Plaquetas, Linfócitos Absolutos, Basófilos Absolutos e Eosinófilos Absolutos. Também foi possível extrair intervalos de valores para essas variáveis que apresentam maior probabilidade de infecção.
  • Dissertação
    Algoritmo de aprendizado por reforço em estratégia de negociação de ações em alta frequência
    Almiñana, Cesar Cavini (2022-08-19)

    Escola de Engenharia Mackenzie (EE)

    “Seria possível ganhar dinheiro, a todo minuto, comprando e vendendo ações na Bolsa?”. À primeira vista, este questionamento envolve diretamente o problema de predição dos preços de uma determinada ação – e que tem sido objeto de estudo, aprofundamento e evolução nas últimas décadas – buscando alcançar realizações financeiras positivas e relevantes, envolvendo o menor risco de operação possível. O uso de modelos de aprendizado por reforço (Reinforcement Learning, ou RL) aliados ao conceito de processos decisórios de Markov (Markov Decision Process, MDP), elimina a necessidade da previsão de preços ou valores específicos, otimiza e automatiza a tomada de decisões. Por sua vez, estratégias de compra e venda de ações em alta frequência (high frequency trading, ou HFT) permitem a redução dos riscos de operação, beneficiando-se de pequenas variações de preço para realização de pequenos lucros que, multiplicados por um alto volume diário, permitem acumular lucros relevantes. Este estudo busca validar, portanto, se o uso combinados de técnicas de RL, aliadas ao conceito de HFT e a execução automática de operações, são capazes de resultar em lucros múltiplas vezes ao longo do dia. Deste modo, foram desenvolvidas e testadas diferentes configurações de modelos para ações da bolsa brasileira e, a partir de um ambiente simulado, foram avaliadas segundo acurácia e aproveitamento do potencial máximo de ganho, e comparadas variação de cada ação no mesmo período (benchmark). Com isso, foi possível provar que as técnicas utilizadas permitem descrever o ambiente de compra e venda de ações em detalhe e, mesmo com a alta incidência de impostos sobre cada operação, apresentaram resultados bastante positivos para 81,25% das ações avaliadas, permitindo contabilizar ganhos relevantes (aproximadamente +480%), que ultrapassam com folga o benchmark, validando assim o modelo de alta frequência e risco controlado.