Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets
View/ Open
Date
2011Author
Advisor
Academic level
Doctorate
Type
Subject
Abstract in Portuguese (Brasil)
O método da análise de flutuações destendenciadas (Detrended Fluctuation Analysis - DFA), proposto por Peng et al. (1994), é um exemplo de metodologia recente, sendo utilizada em um crescente número de aplicações, para identificar longa dependência em séries temporais. Como não existe uma regra específica para a escolha dos números de regressores no método de DFA, apresentamos aqui uma escolha ótima assintótica. Para um ruído Gaussiano fracionário, provamos que o estimador bHDFA tem distribuiçã ...
O método da análise de flutuações destendenciadas (Detrended Fluctuation Analysis - DFA), proposto por Peng et al. (1994), é um exemplo de metodologia recente, sendo utilizada em um crescente número de aplicações, para identificar longa dependência em séries temporais. Como não existe uma regra específica para a escolha dos números de regressores no método de DFA, apresentamos aqui uma escolha ótima assintótica. Para um ruído Gaussiano fracionário, provamos que o estimador bHDFA tem distribuição Gaussiana exata e assintótica. O parâmetro mais importante para ser estimado em dados com caudas pesadas é a sua taxa de decaimento α que determina a probabilidade de ocorrência dos valores extremos da distribuição subjacente. Propomos, neste trabalho, um novo estimador para o parâmetro α, baseado na função característica empírica e no procedimento de encolhimento de wavelets. Estamos interessados em analisar a longa dependência em sequência de DNA utilizando a metodologia de mudança de regimes, proposta por Liu (2000). Nesta metodologia, se a duração dos regimes de uma série temporal tem uma distribuição de caudas pesadas com parâmetro α ∈ (1, 2), então a série temporal apresenta a característica de longa dependência. Além disso, aplicando-se qualquer transformação linear que preserva a propriedade de variância finita na série temporal, igualmente preservará a propriedade de longa dependência. Por fim, estudamos as distribuições de distâncias das regiões codantes e não codantes em sequências de DNA. Concluímos que todas as técnicas apresentadas neste trabalho, para analisar longa dependência em série temporais, envolvendo conceitos de análise de flutuações destendenciadas, distribuições com caudas pesadas e encolhimento de wavelets, mostram a existência de longa dependência em todas sequências de DNA aqui estudadas. ...
Abstract
The method of detrended fluctuation analysis (DFA), proposed by Peng et al. (1994), is useful in revealing the extent of long-range dependence in time series. Since there is not a specific rule for the choice of the numbers of regressors in DFA method, we present here an asymptotic optimal choice. For a fractional Gaussian noise, we prove the exact and the asymptotic Gaussian distributions for the bHDFA estimator. The most important parameter to estimate in a heavy-tailed data is the tail rate ...
The method of detrended fluctuation analysis (DFA), proposed by Peng et al. (1994), is useful in revealing the extent of long-range dependence in time series. Since there is not a specific rule for the choice of the numbers of regressors in DFA method, we present here an asymptotic optimal choice. For a fractional Gaussian noise, we prove the exact and the asymptotic Gaussian distributions for the bHDFA estimator. The most important parameter to estimate in a heavy-tailed data is the tail rate of decay α which determines the probability of occurrence of extreme values of the underlying distribution. Here we propose a novel estimator for α based on the empirical characteristic function and on the principal of wavelet shrinkage. Here we are interested in analyzing the long-range dependence in several DNA sequences, under the heavy-tail regime switching mechanism, proposed by Liu (2000). In this mechanism, if the duration of the regimes of a given time series has a heavy tail distribution with index parameter α ∈ (1, 2), then there is long-range dependence in this time series, and any functional transformation of the original time series preserving the property of finite variance, also preserves the property of long-range dependence. We also study the length distribution of coding and noncoding regions in DNA sequences. We conclude that all techniques presented in this paper to analyze longrange dependence in time series, involving concepts of detrended fluctuation analysis, heavy tail distributions and wavelet shrinkage, show the existence of long-range dependence in all DNA sequences studied here. ...
Institution
Universidade Federal do Rio Grande do Sul. Instituto de Matemática. Programa de Pós-Graduação em Matemática.
Collections
-
Exact and Earth Sciences (5143)Mathematics (367)
This item is licensed under a Creative Commons License