• Audiovisual voice activity detection and localization of simultaneous speech sources 

      Minotto, Vicente Peruffo (2013) [Dissertação]
      Em vista da tentência de se criarem intefaces entre humanos e máquinas que cada vez mais permitam meios simples de interação, é natural que sejam realizadas pesquisas em técnicas que procuram simular o meio mais convencional ...
    • Crowd analysis using local neighborhood coherence 

      Almeida, Igor Rodrigues de (2020) [Tese]
      Large numbers of crowd analysis methods using computer vision have been developed in the past years. This dissertation presents an approach to explore characteristics inherent to human crowds – proxemics, and neighborhood ...
    • Dense 3D indoor scene reconstruction from spherical images 

      Silveira, Thiago Lopes Trugillo da (2019) [Tese]
      Image-based three-dimensional (3D) scene reconstruction approaches have been widely studied by the scientific community, with applications in archaeological and architectural modeling, infrastructure inspection, robot ...
    • Detecção e classificação de mudança de comportamento em multidões humanas 

      Almeida, Igor Rodrigues de (2014) [Dissertação]
      Este trabalho apresenta um método para detectar mudança de comportamento em multidões humanas baseado em histogramas de velocidade e orientação em coordenadas de mundo. Uma combinação de remoção de fundo e fluxo óptico é ...
    • Detecting and tracking cells in microscopic images using oriented representations 

      Kirsten, Lucas Nedel (2023) [Dissertação]
      Cell detection and tracking are paramount for bio-analysis. Recent approaches rely on the tracking by model evolution paradigm, which usually consists of training end-to-end deep learning models to detect and track the ...
    • Fast contextual text recognition with deep convolutional neural networks 

      Silva, Sérgio Montazzolli (2019) [Tese]
      In this work we explore Deep Learning techniques to effectively recognize text in images given some context, which we call Contextualized Text Recognition (CTR). CTR arises in many applications, such as Automatic License ...
    • Filtragem de imagens com preservação das bordas usando a Transformada Wavelet 

      Jung, Claudio Rosito (2002) [Tese]
      A filtragem de imagens visando a redução do ruído é uma tarefa muito importante em processamento de imagens, e encontra diversas aplicações. Para que a filtração seja eficiente, ela deve atenuar apenas o ruído na imagem, ...
    • Finding idiomaticity in word representations 

      Vieira, Tiago Kramer (2022) [Dissertação]
      Contextualised word representation models have been successfully used for capturing different word usages, and they may be an attractive alternative for representing idiomaticity in language. However, it is not clear how ...
    • Improving rare chord recognition through self-learning techniques and weak label generation 

      Bortolozzo, Marcelo Cardoso (2022) [Dissertação]
      In the context of Automatic Chord Recognition (ACR), the main goal is to extract and classify musical chords from sequential information (audio excerpts). It is a challenging task, not only when developing a classifier for ...
    • Joint-task learning to improve super-resolution of aerial images 

      Albuquerque Filho, José Eliton (2022) [Dissertação]
      Deep learning networks have become a very popular approach for solving multiple com puter vision problems. Amongst them, super resolution (SR) is a particularly challenging task because of its ill-posed nature, since one ...
    • Online frame-to-model pipeline to 3D reconstruction with depth cameras using RGB-D information 

      Dornelles, Thiago de Azevedo (2020) [Dissertação]
      Several challenges in computer vision and robotics involve developing algorithms capable of using partial spatial information to generate a reliable 3D perception of the world. Var- ious breakthrough applicable technologies ...
    • Pedestrian tracking and collective behavior recognition 

      Führ, Gustavo (2017) [Tese]
      Collective behavior detection and pedestrian tracking present many applications, specially in surveillance systems. In this dissertation, we proposed a complete pipeline for achieving robust tracking and collective behavior ...
    • Probabilistic Intersection-over-Union for Training and Evaluation of Oriented Object Detectors 

      Llerena, Jeffri Erwin Murrugarra (2022) [Dissertação]
      Using localization loss terms based on the Intersection-over-Union (IoU) is a recent and promising trend for object detection. However, exploring such loss functions for oriented bounding boxes is a complex task since the ...
    • Real time detection of traffic signs using onboard vehicular cameras 

      Selhorst, Álesson Scapinello (2018) [Dissertação]
      The application of new technologies has been profoundly affecting the automobile industry, especially when talking about autonomous cars. The self-driving scenario is close to becoming reality, however many challenges still ...
    • Síntese de fotografias e vídeos com depth-image-based rendering 

      Oliveira, Adriano Quilião de (2019) [Tese]
      O processo de síntese de vistas com Depth-Image-Based Rendering (DIBR) se apresenta como um meio promissor para viabilizar aplicações como TV3D, Free Viewpoint Video, e outras relacionadas com Realidade Virtual e Realidade ...
    • Síntese de vistas em depht-image-based rendering (DIBR) 

      Oliveira, Adriano Quilião de (2016) [Dissertação]
      Esta dissertação investiga soluções para o problema genérico de geração de vistas sintéticas a partir de um conjunto de imagens utilizando a abordagem Depth-Image-Based Rendering. Essa abordagem utiliza um formato compacto ...
    • Sistema audio visual para análise de solfejo 

      Schramm, Rodrigo (2015) [Tese]
      O solfejo, em seu conceito mais amplo, é uma técnica usual no processo de ensinoaprendizagem musical, o qual envolve a realização vocal de melodias, considerando as alturas e as durações dos sons musicais registrados em ...
    • Spatially varying defocus blur estimation and applications 

      Karaali, Ali (2017) [Tese]
      This dissertation presents two different defocus blur estimation methods for still images. Both methods assume a Gaussian Point Spread Function (PSF) and explore the ratio of gradient magnitudes of reblurred images computed ...
    • Técnica para interação com mãos em superficies planares utilizando uma câmera RGB-D 

      Weber, Henrique (2016) [Dissertação]
      Sistemas de Interação Humano-Computador baseados em toque são uma tecnologia disseminada em tablets, smartphones e notebooks. Trata-se de um grande avanço que aumenta a facilidade de comunicação e, ao mesmo tempo, diminui ...
    • Video view interpolation using temporally adaptive 3D meshes 

      Fickel, Guilherme Pinto (2015) [Tese]
      This thesis presents a new method for video view interpolation using multiview linear camera arrays based on 2D domain triangulation. The domain of the reference image is initially partitioned into triangular regions using ...