Aplicação de filtros aproximados de estimação de movimento fracionário para codificação de vídeo do padrão VVC
Visualizar/abrir
Data
2025Orientador
Nível acadêmico
Graduação
Outro título
Application of approximate fractional motion estimation filters for video coding in the VVC standard
Assunto
Resumo
A evolução das técnicas de compressão de vídeo tem sido impulsionada pela crescente demanda por conteúdos em alta resolução e pela popularização de serviços de streaming e videoconferência. Nesse contexto, o padrão Versatile Video Coding (VVC) introduz melhorias significativas na estimação de movimento, especialmente na interpolação de posições subpixel, etapa que, embora essencial para a precisão da predição inter-quadros, representa uma alta carga computacional. Este trabalho investiga altern ...
A evolução das técnicas de compressão de vídeo tem sido impulsionada pela crescente demanda por conteúdos em alta resolução e pela popularização de serviços de streaming e videoconferência. Nesse contexto, o padrão Versatile Video Coding (VVC) introduz melhorias significativas na estimação de movimento, especialmente na interpolação de posições subpixel, etapa que, embora essencial para a precisão da predição inter-quadros, representa uma alta carga computacional. Este trabalho investiga alternativas para reduzir a complexidade dessa etapa por meio da simplificação do processo de interpolação fracionária. Foram testadas versões que utilizam filtros de 6, 4 e 2 taps (usando este número de pixels de entrada), em comparação com o método original que utiliza filtros de 8 taps. A avaliação foi conduzida com um conjunto de oito vídeos codificados em quatro níveis de quantização (QP), sob dois modos de codificação distintos (Random Access e Low Delay B). Os resultados foram analisados utilizando a métrica Bjøntegaard-Delta, permitindo mensurar o impacto na qualidade e na compressão do vídeo. Em ambos os modos de codificação, a substituição dos filtros resultou geralmente em degradação na qualidade objetiva dos vídeos reconstruídos com um aumento na taxa de bits. Essas pioras, entretanto, foram marginais, sempre com reduções menores que 0.06 dB no BD-PSNR e aumento abaixo de 0.7% no BD-BR para ambos os modos de codificação. Os resultados sugerem que, apesar das perdas tanto em qualidade quanto em eficiência de compressão, a redução da complexidade das operações de interpolação pode ser explorada como uma estratégia viável, especialmente para aplicações com limitações computacionais. ...
Abstract
The evolution of video compression techniques has been driven by the growing demand for high-resolution content and the widespread adoption of streaming and videoconferencing services. In this context, the VVC (Versatile Video Coding) standard introduces significant improvements in motion estimation, particularly in the interpolation of subpixel positions, a step that, although essential for accurate inter-frame prediction, imposes a high computational cost. This work investigates alternatives ...
The evolution of video compression techniques has been driven by the growing demand for high-resolution content and the widespread adoption of streaming and videoconferencing services. In this context, the VVC (Versatile Video Coding) standard introduces significant improvements in motion estimation, particularly in the interpolation of subpixel positions, a step that, although essential for accurate inter-frame prediction, imposes a high computational cost. This work investigates alternatives to reduce the complexity of this step by simplifying the fractional interpolation process. Versions employing 6, 4, and 2 tap filters (using this number of input pixels) were tested and compared to the original method, which uses 8 tap filters. The evaluation was performed on a set of eight video sequences encoded at four quantization parameter (QP) levels, under two distinct encoding modes (Random Access and Low Delay B). The results were analyzed using the Bjøntegaard-Delta metric, allowing the evaluation of the impacts on video quality and compression efficiency. In both encoding modes, replacing the filters generally resulted in a degradation of the objective quality of the reconstructed videos, along with an increase in bitrate. However, these degradations were marginal, with BD-PSNR reductions consistently below 0.06 dB and BD-BR increases below 0.7%, for both encoding modes. The results suggest that, despite losses in both quality and compression efficiency, reducing the complexity of interpolation operations may be explored as a viable strategy, particularly for applications with computational limitations. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado.
Coleções
-
TCC Ciência da Computação (1165)
Este item está licenciado na Creative Commons License


