Teses
URI Permanente desta comunidade
Navegar
Navegando Teses por Orientador "Marengoni, Mauricio"
Agora exibindo 1 - 3 de 3
Resultados por página
Opções de Ordenação
- TeseInformação de contexto aplicada à detecção de pedestresCândido, Jorge (2019-02-14)
Faculdade de Computação e Informática (FCI)
The detection of objetcs in digital images is one of the most studied and developed subjects within the computer vision field. Unlike the problem of object identification, where the basic task is classify objects into predefined classes, object detection has the difficult task of searching the entire image and answering the following questions: how many objects are in the image and what is the location of these objects? When the object being searched is a pedestrian, it is characterized the problem of pedestrian detection. In this research project we evaluated the use of additional information in the scene, here called context information, aiding the task of pedestrians detection. The context information explored in this research were the presence of floor area and the relationship between the pedestrian height and the pedestrian vertical position within the image. The information of floor area presence is obtained by means of an artificial neural network that classifies a region in the image as belonging or not to a floor area. The neural network is applied in an area below the bounding box that delimits a pedestrian detection candidate. The relationship between the pedestrian height and the pedestrian vertical position is obtained by the bounding box at the output of the pedestrian detection algorithm. Based on a statistical model, this relationship represents additional information that may indicate that the pedestrian detected by the algorithm represents a false positive and can be eliminated from the final result. This additional information is incorporated into the detector information improving its accuracy. Based on the tests performed in this thesis, we can say that the use of this additional information considerably improves the precision in the pedestrian detection algorithms proposed in the literature, considerably reducing the number of false positives. - TeseReconhecimento facial através de limiares individuais por padrão de textura e sub-região facialD'Amore, Luiz Angelo (2016-10-14)
Escola de Engenharia Mackenzie (EE)
Neste trabalho são apresentados o desenvolvimento e os resultados de um novo método de reconhecimento facial baseado na utilização de limiares individuais por padrão de textura e sub-região facial, com aplicabilidade em sistemas biométricos de controle de acesso em ambientes controlados. Dentre os sistemas biométricos, o de reconhecimento facial apresenta destaque em relação às demais biometrias pelo fato de não ser intrusiva, sendo a captura da imagem facial realizada com certa distância entre a câmera e o indivíduo. O objetivo do método proposto é reduzir o custo computacional em relação a outros métodos existentes, sem prejuízo para a taxa de reconhecimento facial. O método proposto utiliza um descritor composto por quatro sub descritores, todos formados por padrões de texturas. Cada um dos sub descritores tem seu tamanho definido pela quantidade de sub-regiões que a região facial é dividida. No processo comparativo entre descritores, o método utiliza limiares individuais por padrão de textura e sub-região facial. Neste trabalho foram realizados três experimentos, cada um subdividido em testes específicos. O primeiro experimento foi realizado com o objetivo de avaliar variações relacionadas ao uso de padrões binários locais uniformes (LBPu2), os resultados obtidos foram utilizados como base comparativa para os demais experimentos deste trabalho. O segundo experimento teve como objetivo avaliar o método proposto quanto a redução do tamanho do descritor facial LBPu2 padrão de 59 texturas. O terceiro experimento foi realizado para avaliar o método proposto, com base na utilização de limiares individuais por padrão de textura e sub-região facial, método que objetiva melhorar o processo classificatório do reconhecimento facial. Para a realização dos experimentos, foram utilizadas as imagens faciais frontais dos conjuntos "The Facial Recognition Technology Database" (FERET) e "FEI Face Database" (FEI), com variações de luminosidade, expressões e sem restrições quanto ao uso de barba, bigode ou óculos. Após a realização dos experimentos, foi possível observar que o método proposto reduz consideravelmente o custo computacional para os sistemas de reconhecimento facial, além de melhorar sua taxa de reconhecimento, superando os resultados acadêmicos já publicados. - TeseSegmentação de disco ótico e vasos sanguíneos em imagens retinais usando wavelets, morfologia matemática e filtragem multiescalas baseada em hessianasRodrigues, Luiz Carlos Ferreira (2017-08-31)
Faculdade de Computação e Informática (FCI)
A importância de um acurado e precoce diagnostico de doenças retinais tem motivado o desenvolvimento de técnicas de visão computacional necessárias para uma completa avaliação automática das condições do sistema retinal. Nesta tese, apresentamos um novo algoritmo que aplica transformadas wavelets e morfologia matemática na detecção do disco ótico e exploramos as características tubulares dos vasos sanguíneos em espaço de escalas Gaussianas para segmentar veias e artérias. O disco ótico e a estrutura vascular são essenciais para a análise da imagem retinal. Em vez de usar tentativas empíricas para escolher os melhores parâmetros para segmentação de vasos, foi utilizado algoritmo genético (GA) e suas sequências de gerações e cruzamentos. Entretanto, a técnica de explorar as características tubulares dos vasos chega ao seu limite quando os vasos são representados por sequências curvilíneas e não continuas de 1 pixel de largura. Para superar essa limitação, foi criada uma nova metodologia baseada no algoritmo de Steger para segmentar uma estrutura curvilínea de duas dimensões que não são alcançadas pelo detector de vasos em espaço de escalas. O detector de estrutura curvilínea irá identificar e anexar as linhas aos vasos principais usando o algoritmo de caminho mais curto de Dijkstra, completando a segmentação de vasos grossos é nos. O método proposto foi desenvolvido e testado sobre duas bases de imagens abertas e gratuitamente disponíveis: DRIVE (Digital Retinal Images for Vessel Extraction) que contém 40 imagens retinais anotadas e sobre HRF-DB (High Resolution Fundus Image Database) que contém 45 imagens anotadas. Os resultados experimentais do método são demonstrados e exibem uma acurácia média de 0.9503 no banco de imagens DRIVE e 0.9445 no HRF-DB. Tais níveis de acurácia estão próximos ao estado da arte, que são mais complexos e requerem um, ocasionalmente dois, módulos de pré processamento, enquanto este método não requer pré ou pós processamento. O método desenvolvido possui um tempo médio de processamento, para cada imagem, de 35 segundos e for desenvolvido em um processador Intel Core i5-3320, CPU de 2.60 GHz com 8 GB de RAM.