Aproximando a transformada discreta do cosseno por redes neurais ternárias

Transformadas discretas desempenham um papel fundamental em processamento de sinais. Em particular, a transformada discreta de cosseno (DCT) se destaca por ser uma importante ferramenta para compressão de imagens e vídeos. Algoritmos rápidos permitem a aplicação da DCT com complexidade reduzida mas requerem computações em ponto flutuante. Tais condições podem ser proibitivas em aplicações que demandam ação em tempo real ou hardware de baixo consumo energético. Diversos trabalhos formulam um problema de otimização em um espaço de busca discreto para aproximar o cômputo da DCT utilizando apenas operações de baixa complexidade aritmética. Geralmente, os coeficientes da transformada aproximada estão em (ou subconjunto de) 0, ± 1 2 , ±1, ±2}. Este trabalho modela o problema de derivação de transformadas aproximadas através da otimização (treinamento) de uma rede neural artificial (ANN) do tipo multilayer percep tron (MLP). São utilizados mecanismos recentes para treinamento de ANNs ternárias de tal forma que aproximações ortogonais para a DCT de 8 pontos que requerem apenas adições/subtrações possam ser derivadas. Duas transformadas conhecidas na literatura são obtidas pela metodologia proposta. Para avaliação, são utilizadas métricas de eficiência de codificação e proximidade com relação à DCT exata. As aproximações para a DCT obtidas são submetidas a um experimento de compressão de imagens similar ao JPEG, onde são avaliadas métricas de qualidade de imagem. Os resultados indicam que a meto dologia proposta permite derivar transformadas com alta eficiência de codificação e baixa complexidade aritmética. No futuro, a metodologia proposta será estendida de forma a contemplar outros tamanhos de transformada e outras transformadas discretas lineares. ...

Abstract

Discrete transforms play a fundamental role in signal processing. In particular, the dis crete cosine transform (DCT) is an essential tool for image and video compression. Fast algorithms allow the application of DCT with reduced complexity but require floating point computations. Such conditions can be prohibitive in applications that demand real time response or low-power hardware. Several works formulate an optimization problem in a discrete search space to approximate the computation of the DCT using only opera tions of low arithmetic complexity. Generally, approximate transform coefficients are in (or a subset of) 0, ± 1 2 , ±1, ±2}. This work models the approximate transform propo sition problem by optimizing (training) a multilayer perceptron (MLP) artificial neural network (ANN). Recent mechanisms for training ternary ANNs are used so that orthogo nal 8-point DCT approximations that require only additions/subtractions can be derived. Two well-known transformations in the literature are obtained by the proposed method ology. For evaluation, metrics of coding efficiency and proximity to the exact DCT are used. The obtained DCT approximations are submitted to a JPEG-like image compres sion experiment, where image quality assessment is performed. The results indicate that the proposed methodology allows for deriving transforms with high coding efficiency and low arithmetic complexity. In the future, the proposed methodology will be extended in order to contemplate other transform sizes and other discrete linear transforms. ...

Instituição

Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado.

Coleções

Trabalhos de Conclusão de Curso de Graduação (40293)

TCC Ciência da Computação (1127)

Outras opções

Mostrar todos os metadados

Estatísticas

Este item está licenciado na Creative Commons License