Moving average representation var model


2.1 Modelos de Média Móvel (Modelos MA) Modelos de séries temporais conhecidos como modelos ARIMA podem incluir termos autorregressivos e / ou termos médios móveis. Na semana 1, aprendemos um termo autoregressivo em um modelo de série temporal para a variável x t é um valor defasado de x t. Por exemplo, um termo autorregressivo lag 1 é x t-1 (multiplicado por um coeficiente). Esta lição define os termos da média móvel. Um termo de média móvel em um modelo de série temporal é um erro passado (multiplicado por um coeficiente). Let (wt overset N (0, sigma2w)), significando que wt são idênticos, independentemente distribuídos, cada um com uma distribuição normal tendo média 0 e a mesma variância. O modelo de média móvel de 1ª ordem, denotado por MA (1) é (xt mu wt theta1w) O modelo de média móvel de 2ª ordem, denotado por MA (2) é (xt mu wt theta1w teta2w) O modelo de média móvel de ordem q , indicado por MA (q) é (xt mu wt theta1w theta2w pontos thetaqw) Nota. Muitos livros didáticos e programas de software definem o modelo com sinais negativos antes dos termos. Isso não altera as propriedades teóricas gerais do modelo, embora inverta os sinais algébricos de valores de coeficientes estimados e termos (não-quadrados) em fórmulas para ACFs e variâncias. Você precisa verificar seu software para verificar se sinais positivos ou negativos foram usados ​​para escrever corretamente o modelo estimado. R usa sinais positivos em seu modelo subjacente, como fazemos aqui. Propriedades Teóricas de uma Série Temporal com um Modelo MA (1) Observe que o único valor diferente de zero no ACF teórico é para o atraso 1. Todas as outras autocorrelações são 0. Assim, uma amostra de ACF com uma autocorrelação significativa somente no lag 1 é um indicador de um possível modelo MA (1). Para estudantes interessados, as provas dessas propriedades são um apêndice a este folheto. Exemplo 1 Suponha que um modelo MA (1) seja x t 10 w t .7 w t-1. onde (wet overset N (0,1)). Assim, o coeficiente 1 0,7. O ACF teórico é dado por Um gráfico deste ACF segue. O gráfico que acabamos de mostrar é o ACF teórico para um MA (1) com 1 0,7. Na prática, uma amostra costuma oferecer um padrão tão claro. Usando R, simulamos n valores de 100 amostras usando o modelo xt 10 w t .7 w t-1 onde wt iid N (0,1). Para esta simulação, segue-se um gráfico de série temporal dos dados da amostra. Nós não podemos dizer muito desta trama. A amostra ACF para os dados simulados é a seguinte. Vemos um pico no atraso 1 seguido por valores geralmente não significativos para atrasos 1. Observe que o ACF da amostra não corresponde ao padrão teórico do MA subjacente (1), que é que todas as autocorrelações para atrasos anteriores 1 serão 0 Uma amostra diferente teria uma amostra ACF ligeiramente diferente mostrada abaixo, mas provavelmente teria as mesmas características gerais. Propriedades Teóricas de uma Série Temporal com um Modelo MA (2) Para o modelo MA (2), as propriedades teóricas são as seguintes: Observe que os únicos valores não nulos no ACF teórico são para os lags 1 e 2. As autocorrelações para lags maiores são 0 Assim, uma amostra ACF com autocorrelações significativas nos lags 1 e 2, mas autocorrelações não significativas para lags maiores indica um possível modelo MA (2). iid N (0,1). Os coeficientes são 1 0,5 e 2 0,3. Como este é um MA (2), o ACF teórico terá valores diferentes de zero apenas nos lags 1 e 2. Os valores das duas autocorrelações diferentes de zero são Uma plotagem do ACF teórico a seguir. Como quase sempre é o caso, dados de amostra não se comportarão tão perfeitamente quanto a teoria. Simulamos n valores de 150 amostras para o modelo x t 10 w t 0,5 w t-1 .3 w t-2. Onde está N (0,1). O gráfico da série temporal dos dados segue. Como no gráfico de séries temporais para os dados de amostra MA (1), você não pode dizer muito sobre isso. A amostra ACF para os dados simulados é a seguinte. O padrão é típico para situações em que um modelo MA (2) pode ser útil. Existem dois picos estatisticamente significativos nos lags 1 e 2, seguidos por valores não significativos para outros lags. Note que, devido ao erro de amostragem, a amostra ACF não corresponde exatamente ao padrão teórico. ACF para Modelos Gerais MA (q) Uma propriedade dos modelos MA (q) em geral é que existem autocorrelações diferentes de zero para as primeiras defasagens e autocorrelações 0 para todos os atrasos gt q. Não unicidade de conexão entre valores de 1 e (rho1) no modelo MA (1). No modelo MA (1), para qualquer valor de 1. o recíproco 1/1 fornece o mesmo valor para Como exemplo, use 0,5 para 1. e depois use 1 / (0.5) 2 para 1. Você receberá (rho1) 0,4 em ambos os casos. Para satisfazer uma restrição teórica chamada invertibilidade. restringimos os modelos MA (1) a ter valores com valor absoluto menor que 1. No exemplo dado, 1 0.5 será um valor de parâmetro permitido, enquanto 1 1 / 0.5 2 não. Invertibilidade dos modelos MA Um modelo MA é dito ser invertível se for algebricamente equivalente a um modelo AR de ordem infinita convergente. Convergindo, queremos dizer que os coeficientes de AR diminuem para 0 quando voltamos no tempo. A invertibilidade é uma restrição programada no software de séries temporais usado para estimar os coeficientes de modelos com termos de MA. Não é algo que nós verificamos na análise de dados. Informações adicionais sobre a restrição de invertibilidade para os modelos MA (1) são fornecidas no apêndice. Nota Teoria Avançada. Para um modelo MA (q) com um ACF especificado, existe apenas um modelo invertível. A condição necessária para a invertibilidade é que os coeficientes tenham valores tais que a equação 1- 1 y-. - q y q 0 tem soluções para y que estão fora do círculo unitário. Código R para os Exemplos No Exemplo 1, plotamos o ACF teórico do modelo x t 10 w t. 7w t-1. e então simulou n 150 valores deste modelo e plotou a série temporal da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados para traçar o ACF teórico foram: acfma1ARMAacf (mac (0,7), lag. max10) 10 defasagens de ACF para MA (1) com theta1 0,7 lags0: 10 cria uma variável denominada lags que varia de 0 a 10. plotagem (defasagens, acfma1, xlimc (1,10), ylabr, tipoh, ACF principal para MA (1) com teta1 0,7) abline (h0) adiciona um eixo horizontal ao gráfico O primeiro comando determina o ACF e o armazena em um objeto chamado acfma1 (nossa escolha de nome). O comando de plotagem (o terceiro comando) traça atrasos em relação aos valores de ACF para os lags de 1 a 10. O parâmetro ylab marca o eixo yeo parâmetro principal coloca um título na plotagem. Para ver os valores numéricos do ACF, simplesmente use o comando acfma1. A simulação e os gráficos foram feitos com os seguintes comandos. xcarima. sim (n150, list (mac (0.7))) Simula n 150 valores de MA (1) xxc10 adiciona 10 para fazer a média 10. A simulação assume como padrão 0. plotagem (x, typeb, mainSimulated MA (1) data) acf (x, xlimc (1,10), ACF principal para dados de amostras simuladas) No Exemplo 2, plotamos o ACF teórico do modelo xt 10 wt.5 wt-1 .3 w t-2. e então simulou n 150 valores deste modelo e plotou a série temporal da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados foram: acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 plot (defasagens, acfma2, xlimc (1,10), ylabr, typeh, ACF principal para MA (2) com teta1 0,5, teta20.3) abline (h0) xcarima. sim (n150, lista (mac (0.5, 0.3))) xxc10 plot (x, typeb, principal Sim Simulado (2) Séries) acf (x, xlimc (1,10), mainACF para Dados MA (2) simulados Apêndice: Prova de Propriedades do MA (1) Para estudantes interessados, aqui estão as provas de propriedades teóricas do modelo MA (1). Variação: (texto (xt) texto (mu wt theta1 w) 0 texto (wt) texto (teta1w) sigma2w teta21sigma2w (1theta21) sigma2w) Quando h1, a expressão anterior 1 w 2. Para qualquer h 2, a expressão anterior 0 A razão é que, por definição de independência do peso. E (wk w j) 0 para qualquer k j. Além disso, porque o w tem média 0, E (w j w j) E (w j 2) w 2. Para uma série temporal, aplique esse resultado para obter o ACF fornecido acima. Um modelo MA invertível é aquele que pode ser escrito como um modelo AR de ordem infinita que converge para que os coeficientes AR converjam para 0 à medida que nos movemos infinitamente de volta no tempo. Bem demonstre invertibilidade para o modelo MA (1). Substituímos então a relação (2) para wt-1 na equação (1) (3) (zt wt theta1 (z-teta1w) wt teta1z-teta2w) No tempo t-2. a equação (2) se torna Nós então substituímos a relação (4) para w t-2 na equação (3) (zt wt theta1 z-teta1w wt teta1z-teta21 (z-teta1w) wt teta1z-teta12z teta31w) Se continuarmos ( infinitamente), obteríamos o modelo AR de ordem infinita (zt wt theta1z - theta21z theta31z - theta41z dots) Note, no entanto, que se 1 1, os coeficientes multiplicando os lags de z aumentarão (infinitamente) em tamanho à medida que voltarmos Tempo. Para evitar isso, precisamos de 1 lt1. Esta é a condição para um modelo MA invertível (1). Na semana 3, veremos que um modelo AR (1) pode ser convertido em um modelo MA de ordem infinita: (xt - mu wt phi1w phi21w pontos phik1 w pontos soma phij1w) Este somatório dos termos de ruído branco passado é conhecido como a representação causal de um AR (1). Em outras palavras, x t é um tipo especial de MA com um número infinito de termos voltando no tempo. Isso é chamado de ordem infinita MA ou MA (). Uma ordem finita MA é uma ordem infinita AR e qualquer ordem finita AR é uma ordem infinita MA. Lembre-se na semana 1, notamos que um requisito para um AR estacionário (1) é aquele 1 lt1. Vamos calcular o Var (x t) usando a representação causal. Esta última etapa usa um fato básico sobre séries geométricas que requer (phi1lt1), caso contrário a série diverge. Navegação11.2: Modelos vetoriais autorregressivos Modelos VAR (p) Os modelos VAR (modelos vetoriais regressivos) são usados ​​para séries temporais multivariadas. A estrutura é que cada variável é uma função linear das defasagens anteriores de si e dos desfasamentos passados ​​das outras variáveis. Como exemplo, suponha que medimos três variáveis ​​de séries temporais diferentes, denotadas por (x), (x) e (x). O modelo vetorial autorregressivo de ordem 1, denominado VAR (1), é o seguinte: Cada variável é uma função linear dos valores de lag 1 para todas as variáveis ​​no conjunto. Em um modelo VAR (2), os valores de atraso 2 para todas as variáveis ​​são adicionados ao lado direito das equações. No caso de três variáveis ​​x (ou séries temporais), haveria seis preditores no lado direito de cada equação. , três lag 1 termos e três lag 2 termos. Em geral, para um modelo VAR (p), os primeiros pags de cada variável no sistema seriam usados ​​como preditores de regressão para cada variável. Os modelos VAR são um caso específico de modelos VARMA mais gerais. Modelos VARMA para séries temporais multivariadas incluem a estrutura VAR acima, juntamente com os termos de média móvel para cada variável. Mais geralmente ainda, estes são casos especiais de modelos ARMAX que permitem a adição de outros preditores que estão fora do conjunto multivariado de interesse principal. Aqui, como na Seção 5.8 do texto, enfoque bem nos modelos VAR. Na página 304, os autores ajustam o modelo da forma mathbf t Gamma mathbf t phi mathbf mathbf t onde (mathbf t (1, t)) inclui termos para ajustar simultaneamente a constante e a tendência. Surgiu de dados macroeconômicos nos quais grandes mudanças nos dados afetam permanentemente o nível da série. Existe aqui uma diferença não tão sutil das lições anteriores, que agora estamos ajustando um modelo a dados que não precisam ser estacionários. Nas versões anteriores do texto, os autores separaram separadamente cada série usando uma regressão linear com t, o índice de tempo, como a variável preditora. Os valores de trending para cada uma das três séries são os resíduos desta regressão linear em t. A destreza é útil conceitualmente porque tira a força de direção comum que o tempo pode ter em cada série e criou a estacionariedade, como vimos nas lições anteriores. Essa abordagem resulta em coeficientes semelhantes, embora um pouco diferentes, já que agora estamos ajustando simultaneamente o intercepto e a tendência juntos em um modelo OLS multivariado. A biblioteca R vars de autoria de Bernhard Pfaff tem a capacidade de ajustar esse modelo com tendência. Vamos dar uma olhada em 2 exemplos: um modelo estacionário de diferença e um modelo de tendência estacionária. Modelo Diferencial-Estacionário O Exemplo 5.10 do texto é um modelo estacionário-diferencial em que as primeiras diferenças são estacionárias. Vamos examinar o código e exemplo do texto, ajustando o modelo acima: install. packages (vars) Se ainda não estiver instalado install. packages (astsa) Se ainda não estiver instalado biblioteca (vars) biblioteca (astsa) x cbind (cmort, tempr, plot. ts (x. main, xlab) resumo (VAR (x, p1, typeboth)) Os dois primeiros comandos carregam os comandos necessários da biblioteca vars e os dados necessários da nossa biblioteca de textos. O comando cbind cria um vetor de variáveis ​​de resposta (uma etapa necessária para respostas multivariadas). O comando VAR estima os modelos de AR usando mínimos quadrados ordinários enquanto ajusta simultaneamente o modelo de tendência, interceptação e ARIMA. O argumento p 1 solicita uma estrutura AR (1) e ambas se ajustam a constante e tendência. Com o vetor de respostas, é realmente um VAR (1). A seguir, a saída do comando VAR para a variável tempr (o texto fornece a saída para cmort): Os coeficientes de uma variável são listados na coluna Estimativa. O. l1 anexado a cada nome de variável indica que são variáveis ​​de atraso 1. Utilizando a notação T temperatura, ttime (coletada semanalmente), M taxa de mortalidade e P poluição, a equação para temperatura é 67.586 - .007 t - 0.244 M 0.487 T - 0.128 P A equação para taxa de mortalidade é hat t 73.227 0.014 t 0,465 M - 0,361 T 0,099 P A equação para poluição é considerada t 67,464 - 0,005 t - 0,125 M - 0,477 T 0,581 P. A matriz de covariância dos resíduos do VAR (1) para as três variáveis ​​é impressa abaixo dos resultados da estimação. As variações estão na diagonal e podem ser usadas para comparar esse modelo com VARs de ordem mais alta. O determinante dessa matriz é usado no cálculo da estatística BIC que pode ser usada para comparar o ajuste do modelo ao ajuste de outros modelos (ver fórmulas 5.89 e 5.90 do texto). Para obter mais referências sobre essa técnica, consulte Análise de séries temporais integradas e co-integradas com R de Pfaff e também Campbell e Perron 1991. No exemplo 5.11 na página 307, os autores fornecem resultados para um modelo VAR (2) para dados de taxa de mortalidade . Em R, você pode ajustar o modelo VAR (2) com o resumo do comando (VAR (x, p2, typeboth)). A saída, conforme exibida pelo comando VAR, é a seguinte: Novamente, os coeficientes de uma variável particular são listados em a coluna Estimativa. Como exemplo, a equação estimada para temperatura é de 49.88 - .005 t - 0.109 M 0.261 T 0.051 P - 0.041 M 0.356 T 0.095 P Vamos discutir as estatísticas dos critérios de informação para comparar modelos VAR de diferentes ordens no trabalho de casa. Residuais também estão disponíveis para análise. Por exemplo, se atribuirmos o comando VAR a um objeto chamado fitvar2 em nosso programa, fitvar2 VAR (x, p2, typeboth), teremos acesso aos residuais da matriz (fitvar2). Esta matriz terá três colunas, uma coluna de resíduos para cada variável. Por exemplo, podemos usar para ver o ACF dos resíduos para a taxa de mortalidade após o ajuste do modelo VAR (2). A seguir está o ACF que resultou do comando que acabamos de descrever. Parece bom para um ACF residual. (O grande pico no início é a correlação sem importância de defasagem 0.) Os dois comandos a seguir criarão ACFs para os resíduos das outras duas variáveis. Eles também se assemelham ao ruído branco. Podemos também examinar essas parcelas na matriz de correlação cruzada fornecida por acf (residuals (fitvar2)): As parcelas ao longo da diagonal são os ACFs individuais para cada modelo de resíduos que acabamos de discutir. Além disso, vemos agora os gráficos de correlação cruzada de cada conjunto de resíduos. Idealmente, estes também se assemelham a ruído branco, no entanto, vemos remanescentes correlações cruzadas, especialmente entre temperatura e poluição. Como nossos autores observam, esse modelo não captura adequadamente a associação completa entre essas variáveis ​​no tempo. Modelo de tendência estacionária Vamos explorar um exemplo em que os dados originais são estacionários e examinar o código VAR, ajustando o modelo acima com uma constante e uma tendência. Usando R, simulamos n 500 valores de amostra usando o modelo VAR (2) Usando o comando VAR explicado acima: y1scan (var2daty1.dat) y2scan (var2daty2.dat) summary (VAR (cbind (y1, y2), p2, typeboth) ) Obtemos a seguinte saída: As estimativas são muito próximas aos coeficientes simulados e a tendência não é significativa, como esperado. Para dados estacionários, quando a restrição é desnecessária, você também pode usar o comando ar. ols para ajustar um modelo VAR: fitvar2 ar. ols (cbind (y1, y2), order2) Na primeira matriz fornecida, leia através de uma linha para obter os coeficientes de uma variável. As vírgulas precedentes seguidas de 1 ou 2 indicam se os coeficientes são lag 1 ou 2, respectivamente. Os interceptos das equações são dados sob x. interceptar um intercepto por variável. A matriz sob var. pred fornece a matriz de variância-covariância dos resíduos do VAR (2) para as duas variáveis. As variâncias estão na diagonal e podem ser usadas para comparar este modelo com VARs de ordem mais alta, como observado acima. Os erros padrão dos coeficientes de AR são dados pelo comando fitvar2asy. se. coef. A saída é Como com os coeficientes, leia as linhas. A primeira linha fornece os erros padrão dos coeficientes para as variáveis ​​de atraso 1 que predizem y1. A segunda linha fornece os erros padrão para os coeficientes que predizem y2. Você pode notar que os coeficientes estão próximos ao comando VAR, exceto a interceptação. Isso ocorre porque ar. ols estima o modelo para x-mean (x). Para corresponder ao intercepto fornecido pelo comando summary (VAR (cbind (y1, y2), p2, typeconst)), você deve calcular a interceptação da seguinte forma: No nosso exemplo, a interceptação para o modelo simulado para yt, 1 é igual a -0.043637 -2.733607 (1-0.29300.4523) 15.45479 (-0.1913-0.6365) 9.580768 e a equação estimada para yt, 1 Estimação com Minitab Para usuários do Minitab, veja o fluxo geral do que fazer. Leia os dados em colunas. Use Time Series gt Lag para criar as colunas desfasadas necessárias dos valores estacionários. Use Stat gt ANOVA gt Geral MANOVA. Digite a lista de variáveis ​​de tempo presente como as variáveis ​​de resposta. Insira as variáveis ​​x com defasagem como covariáveis ​​(e como o modelo). Clique em Resultados e selecione Análise Univariada (para ver os coeficientes de regressão estimados para cada equação). Se desejar, clique em Armazenamento e selecione Residuais e / ou Ajustes. Representação Navegação-Média de Aproximações Autorregressivas Estudamos as propriedades de uma representação infinita de MA de uma aproximação autorregressiva para um processo estacionário, de valor real. Ao fazê-lo, damos uma extensão do Teorema de Wiener na configuração da aproximação determinística. Ao lidar com dados, podemos usar esse novo resultado de chave para obter uma visão da estrutura de infinitas representações de MA de modelos autorregressivos ajustados, nos quais a ordem aumenta com o tamanho da amostra. Em particular, damos um limite uniforme para estimar os coeficientes médios móveis via aproximação autorregressiva sendo uniforme sobre todos os inteiros.

Comments

Popular Posts