Moving average examples time series


Média móvel Este exemplo ensina como calcular a média móvel de uma série temporal no Excel. Um avarge movente é usado para suavizar irregularidades (picos e vales) para reconhecer facilmente as tendências. 1. Primeiro, vamos dar uma olhada em nossa série temporal. 2. Na guia Dados, clique em Análise de dados. Nota: não é possível localizar o botão Análise de dados Clique aqui para carregar o suplemento Analysis ToolPak. 3. Selecione Média Móvel e clique em OK. 4. Clique na caixa Intervalo de entrada e selecione o intervalo B2: M2. 5. Clique na caixa Interval (Intervalo) e digite 6. 6. Clique na caixa Output Range (Intervalo de saída) e selecione a célula B3. 8. Plote um gráfico desses valores. Explicação: porque definimos o intervalo para 6, a média móvel é a média dos 5 pontos de dados anteriores e do ponto de dados atual. Como resultado, picos e vales são suavizados. O gráfico mostra uma tendência crescente. O Excel não pode calcular a média móvel dos primeiros 5 pontos de dados porque não há pontos de dados anteriores suficientes. 9. Repita os passos 2 a 8 para o intervalo 2 e intervalo 4. Conclusão: Quanto maior o intervalo, mais os picos e vales são suavizados. Quanto menor o intervalo, mais próximas as médias móveis dos pontos de dados reais. Exemplo de Séries Temporais Os exemplos a seguir ilustram como o XLMiner pode ser usado para explorar os dados para descobrir tendências e sazonalidades. Na faixa de opções XLMiner, na guia Applying Your Model, selecione Help - Examples. em seguida, Exemplos de Previsão / Mineração de Dados e abra o conjunto de dados de exemplo, Income. xlsx. Esse conjunto de dados contém a renda média dos contribuintes por estado. Normalmente, as etapas a seguir são executadas em uma análise de série temporal. 1. Os dados são particionados em dois conjuntos com 60 dos dados atribuídos ao Conjunto de Treinamento e 40 atribuídos ao Conjunto de Validação. 2. Técnicas exploratórias são aplicadas aos Conjuntos de Treinamento e Validação. Se os resultados estiverem sincronizados, o modelo pode ser ajustado. Se os gráficos ACF e PACF forem iguais, o mesmo modelo pode ser usado para ambos os conjuntos. 3. O modelo é ajustado usando o método ARIMA (Autoregressive Integrated Moving Average). 4. Quando um modelo é ajustado usando o método ARIMA, o XLMiner exibe os gráficos ACF e PACF para os resíduos. Se essas parcelas estiverem na faixa de UCL e LCL, os resíduos serão aleatórios e o modelo será adequado. 5. Se os resíduos não estiverem dentro das bandas, existem algumas correlações e o modelo deve ser melhorado. Primeiro, execute uma partição nos dados. Selecione uma célula dentro do conjunto de dados e, em seguida, na ribboon XLMiner, na guia Time Series, selecione Partition para abrir o diálogo Data de Partição de Série Temporal. Na lista Variáveis, selecione Ano e clique em gt para ir para a variável de tempo. Selecione as variáveis ​​restantes na lista Variáveis ​​e clique em gt para incluí-las nas Variáveis ​​na lista Dados de Partição. Em Especificar opções de particionamento, selecione Especificar registros para especificar o número de registros atribuídos aos conjuntos de treinamento e validação. Em Especificar Registros para Particionamento, selecione Especificar registros, insira 50 para o número de registros do Conjunto de Treinamento e 21 para o número de registros do Conjunto de Validação. Se Especificar porcentagens estiver selecionado em Especificar opções de particionamento, o XLMiner atribuirá uma porcentagem de registros a cada conjunto de acordo com os valores inseridos pelo usuário ou inseridos automaticamente pelo XLMiner em Especificar porcentagens para particionamento. Clique OK . A planilha DataPartitionTS é inserida à direita da planilha de renda. Na saída acima, o método de particionamento é seqüencial (versus aleatório). As primeiras 50 observações foram atribuídas ao Conjunto de Treinamento e as 21 observações restantes foram atribuídas ao Conjunto de Validação. Selecione uma célula na planilha DataPartitionTS e, na faixa de opções XLMiner, na guia Série Temporal, selecione ARIMA - Autocorrelações para exibir a caixa de diálogo ACF. Selecione CA como a variável selecionada, insira 10 para ambos os parâmetros ACF para dados de treinamento e dados de validação. Gráfico de plotagem ACF é selecionado por padrão. Clique OK . A planilha ACFOutput é inserida após a planilha DataPartitionTS. Observe em cada gráfico que a autocorrelação diminui à medida que o número de lags aumenta. Isso sugere que um padrão definido existe em cada partição. No entanto, como o padrão não se repete, pode-se supor que nenhuma sazonalidade está incluída nos dados. Além disso, como os dois gráficos exibem um padrão semelhante, podemos ajustar o mesmo modelo aos Conjuntos de Validação e Treinamento. Clique de volta para a planilha DataPartitionTS e na faixa de opções XLMiner, na guia Série Temporal, selecione ARIMA - Autocorrelações Parciais para abrir o diálogo PACF. Selecione CA na lista Variáveis ​​na entrada de dados e, em seguida, clique em gt para mover a variável para a variável selecionada. Digite 40 para Máximo Atraso nos Parâmetros PACF para Dados de Treinamento e 15 para Parâmetros PACF para Dados de Validação. O gráfico PACF de plotagem é selecionado por padrão. Clique OK . A planilha ACFOutput é inserida diretamente à direita da planilha DataPartitionTS. Ambos os gráficos de PACF mostram padrões semelhantes nos Conjuntos de Validação e Treinamento. Como resultado, podemos usar o mesmo modelo para ambos os conjuntos. Saída de PACF para dados de treinamento Saída de PACF para dados de validação A função PACF mostra um padrão definido, o que significa que há uma tendência nos dados. No entanto, como o padrão não se repete, podemos concluir que os dados não mostram sazonalidade. Ambos os gráficos ACF e PACF sugerem que existe um padrão definido, mas sem qualquer sazonalidade. Ambos os conjuntos de dados exibem o mesmo comportamento nos Conjuntos de Treinamento e Validação, o que sugere que o mesmo modelo é apropriado para cada um. Agora estamos prontos para encaixar o modelo. O modelo ARIMA aceita três parâmetros: p - o número de termos autorregressivos d - o número de diferenças não sazonais, e q - o número de erros atrasados ​​(médias móveis). Lembre-se de que o gráfico ACF não mostrou sazonalidade nos dados, o que significa que a autocorrelação é quase estática, diminuindo com o aumento do número de atrasos. Isso sugere configurar q 0, pois parece não haver erros atrasados. O gráfico PACF exibia um valor grande para o primeiro atraso, mas parcelas mínimas para atrasos sucessivos. Isto sugere a configuração p 1. Com a maioria dos conjuntos de dados, a configuração d 1 é suficiente ou pode ser, pelo menos, um ponto de partida. Clique de volta para a planilha DataPartitionTS e na faixa de opções XLMiner, na guia Série Temporal, selecione o modelo ARIMA - ARIMA para abrir a caixa de diálogo Série Temporal - ARIMA. Selecione CA na lista Variáveis ​​na entrada de dados e, em seguida, clique em gt para mover a variável para o campo Variável selecionada. Em Parâmetros não sazonais defina Autoregressive (p) como 1, Diferença (d) como 1 e Moving Average (q) como 0. Clique em Advanced para abrir a caixa de diálogo ARIMA - Advanced Options. Selecione Valores ajustados e residuais, Produzir previsões e Relatar intervalos de confiança de previsão. A configuração padrão de nível de confiança de 95 é inserida automaticamente. A matriz de variância-covariância é selecionada por padrão. Clique em OK na caixa de diálogo Opções avançadas do ARIMA e novamente na caixa de diálogo Série temporal - ARIMA. O XLMiner calcula e exibe vários parâmetros e gráficos em duas folhas de saída, ARIMAOput e ARIMAResiduals. A planilha ARIMAOutput contém o modelo ARIMA, mostrado abaixo. Nesta mesma planilha, a XLMiner calculou o termo constante e o termo AR1 para o nosso modelo. Estes são os termos constantes e f1 da equação de previsão. Veja a seguinte saída do teste do qui-quadrado. O pequeno valor p para o termo constante (0,9704) e o termo AR1 (0) sugere que o modelo é um bom ajuste para nossos dados. Abra a planilha ARIMARiduals. Esta tabela representa os valores reais e ajustados e os resíduos resultantes. Conforme mostrado no gráfico abaixo, os valores real e previsto correspondem bastante bem. A utilidade do modelo na previsão dependerá de quão próximos os valores reais e previstos estão no gráfico de tempo do conjunto de validação. Em seguida, veremos os gráficos ACF e PACF para erros encontrados na parte inferior da planilha ARIMAOutput. Todas as defasagens, exceto o atraso 1, estão claramente dentro das bandas UCL e LCL. Isso indica que os resíduos são aleatórios e não estão correlacionados, o que é a primeira indicação de que os parâmetros do modelo são adequados para esses dados. Veja a tabela de previsão na planilha ARIMAOutput. A tabela mostra o valor real e previsto. Os valores Lower e Upper representam os limites inferior e superior do intervalo de confiança. Há 95 chances de que o valor previsto caia nesse intervalo. O gráfico de tempo à direita indica como o modelo, que nós ajustamos usando o Conjunto de Treinamento e executamos no Conjunto de Validação. Os valores reais e previstos são bastante próximos, o que confirma que nosso modelo deve ser bom para previsão. Para plotar os valores nas colunas inferior e superior no mesmo gráfico, selecione o gráfico e, na faixa de opções do Excel, selecione Design - Selecionar dados para abrir a caixa de diálogo Selecionar fonte de dados. Para o intervalo de dados do gráfico, insira ARIMAOutputB56: G77. em seguida, desmarque Erro em Entradas de legenda. Clique OK . Este gráfico mostra que os valores Real e Previsto estão dentro das faixas de nível de confiança inferior e superior de 95. Embora os valores reais flutuem um pouco, esses valores caem no centro do intervalo. Podemos concluir a partir da saída ARIMA, que o nosso modelo usando parâmetros (1, 1, 0) foi mostrado para ajustar adequadamente os dados. Time Series Analysis e seus aplicativos: Com R Exemplos R correção rápida série temporal A página usa JavaScript para sintaxe destacando. Não é necessário ativá-lo, mas o código será mais difícil de ler. Este é apenas um breve passeio pela pista do seRies. Meu conselho é abrir R e tocar junto com o tutorial. Espero que você tenha instalado R e encontrado o ícone em seu desktop que se parece com um R. bem, é um R. Se você estiver usando o Linux, então pare de procurar porque não está lá. basta abrir um terminal e entrar em R (ou instalar o R ​​Studio.) Se você quiser mais gráficos de séries temporais, particularmente usando o ggplot2. veja a correção rápida de gráficos. A solução rápida destina-se a expô-lo às capacidades básicas da série temporal R e é considerada divertida para pessoas com idades entre os 8 e os 80 anos. Esta não é uma lição na análise de séries temporais, mas existe a tsaEZ. uma introdução gratuita e fácil à análise de séries temporais. loz passos de bebê. sua primeira sessão R. Fique à vontade, então inicie-a e tente alguma adição simples: Ok, agora você é um especialista em usar R. ia ficar astsa agora: Agora que você está carregado, podemos começar. vamos Primeiro, jogue bem com o conjunto de dados Johnson & Johnson. Está incluído em astsa como jj. aquele personagem dinamita do Good Times. Primeiro, olhe para isso. e você vê que jj é uma coleção de 84 números chamados de objetos de séries temporais. Para ver / remover seus objetos: Se você é um usuário Matlab (ou similar), você pode pensar que jj é um vetor 84 vezes 1, mas não é. Tem ordem e comprimento, mas sem dimensões (sem linhas, sem colunas). R chama esses tipos de vetores de objetos, então você tem que ter cuidado. Em R, as matrizes têm dimensões, mas os vetores não - elas apenas oscilam no ciberespaço. Agora, vamos fazer um objeto de série temporal mensal que comece em junho do ano 2293. Entramos no Vortex. Observe que os dados da Johnson & Johnson são ganhos trimestrais, portanto, tem frequência4. A série temporal zardoz é um dado mensal, portanto tem frequência12. Você também obtém algumas coisas úteis com o objeto ts, por exemplo: Agora tente uma plotagem dos dados da Johnson Johnson: O gráfico mostrado é um pouco mais sofisticado do que o código fornecerá. Para mais detalhes, consulte a página de correção rápida de gráficos. Isso vale para o resto das parcelas que você verá aqui. Experimente e veja o que acontece: e enquanto estiver aqui, confira plot. ts e ts. plot. Observe que, se seus dados forem um objeto de série temporal, plot () fará o truque (por um simples gráfico de tempo, isto é). Caso contrário, plot. ts () irá coagir o gráfico em um gráfico de tempo. Que tal filtrar / suavizar a série Johnson & Johnson utilizando uma média móvel de dois lados Vamos tentar isto: fjj (t) 8539 jj (t-2) frac14 jj (t-1) frac14 jj (t) frac14 jj (t1) 8539 jj (t2) e bem adicionar um ajuste de baixa (lowess - você sabe a rotina) para se divertir. Permite diferenciar os dados registrados e chamá-lo de dljj. Então jogue bem com dljj. Agora, um histograma e um gráfico Q-Q, um em cima do outro (mas de uma maneira agradável): Vamos verificar a estrutura de correlação do dljj usando várias técnicas. Primeiro, olhe bem para uma grade de gráficos de dispersão de valores dljj (t) versus defasados. As linhas são um ajuste de baixa intensidade e a amostra acf é azul na caixa. Agora vamos dar uma olhada no ACF e no PACF do dljj. Note que o eixo LAG está em termos de frequência. então 1,2,3,4,5 correspondem a defasagens 4,8,12,16,20 porque frequência4 aqui. Se você não gosta deste tipo de rotulagem, você pode substituir dljj em qualquer um dos itens acima por ts (dljj, freq1), e. acf (ts (dljj, freq1), 20) Seguindo em frente, vamos tentar uma decomposição estrutural do log (jj) erro de estação de tendência usando lowess. Se você quiser inspecionar os resíduos, por exemplo, eles estão em dogtime. series, 3. a terceira coluna da série resultante (os componentes sazonais e de tendência estão nas colunas 1 e 2). Confira o ACF dos resíduos, acf (dogtime. series, 3) os residuais não são brancos - nem mesmo próximos. Você pode fazer um pouco (muito pouco) melhor usando uma janela sazonal local, ao contrário da global usada especificando por. Digite stl para detalhes. Há também algo chamado StructTS que se ajustará aos modelos estruturais paramétricos. Nós não usamos essas funções no texto quando apresentamos a modelagem estrutural no Capítulo 6 porque preferimos usar nossos próprios programas. loz Este é um bom momento para explicar. Acima, o cachorro é um objeto que contém um monte de coisas (termo técnico). Se você digitar cachorro. você verá os componentes, e se você digitar resumo (cachorro) você terá um pequeno resumo dos resultados. Um dos componentes do cão é o time. series. que contém a série resultante (sazonal, tendência, restante). Para ver este componente do cão objeto. você digita dogtime. series (e você verá 3 séries, a última das quais contém os resíduos). E essa é a história de. você verá mais exemplos à medida que avançamos. E agora, bem, faça um problema no Capítulo 2. Vamos ajustar o log de regressão (jj) betatime alfa 1 Q1 alfa 2 Q2 alfa 3 Q3 alfa 4 Q4 epsilon onde Qi é um indicador do trimestre i 1,2,3,4 . Então inspecione bem os resíduos. Você pode ver a matriz do modelo (com as variáveis ​​dummy) desta maneira: Agora verifique o que aconteceu. Veja um gráfico das observações e seus valores ajustados: o que mostra que um gráfico dos dados com o ajuste sobreposto não vale o ciberespaço que ele ocupa. Mas um gráfico dos resíduos e do ACF dos resíduos vale seu peso em joules: Esses resíduos parecem brancos Ignore a correlação de 0-lag, é sempre 1. Dica: a resposta é NÃO. então a regressão acima é nula. Então, qual é o remédio Desculpe, você terá que fazer a aula porque esta não é uma lição de série temporal. Eu te avisei no topo. Você precisa ter cuidado ao regredir uma série temporal em componentes com atraso de outro usando lm (). Existe um pacote chamado dynlm que facilita o ajuste de regressões defasadas, e discutirei isso logo após este exemplo. Se você usar lm (). então o que você tem que fazer é amarrar a série usando ts. intersect. Se você não amarrar a série juntos, eles não serão alinhados corretamente. Aqui está um exemplo de mortalidade cardiovascular semanal regressiva (cmort) na poluição de partículas (parte) pelo valor presente e ficou para trás quatro semanas (cerca de um mês). Para detalhes sobre o conjunto de dados, consulte o Capítulo 2. Certifique-se de que o astsa esteja carregado. Nota: Não houve necessidade de renomear lag (part, -4) para part4. é apenas um exemplo do que você pode fazer. Uma alternativa ao acima é o dynlm pacote que tem que ser instalado, é claro (como fizemos para astsa lá no início). Depois que o pacote é instalado, você pode fazer o exemplo anterior da seguinte maneira: Bem, é hora de simular. O cavalo de batalha para simulações ARIMA é arima. sim (). Aqui estão alguns exemplos que nenhuma saída é mostrada aqui, então você está sozinho. Usando astsa é fácil encaixar um modelo ARIMA: Você pode estar se perguntando sobre a diferença entre aic e AIC acima. Para isso você tem que ler o texto ou simplesmente não se preocupe porque não vale a pena arruinar o seu dia pensando nisso. E sim, esses resíduos parecem brancos. Se você quiser fazer uma previsão ARIMA, o sarima. for está incluído no astsa. E agora para alguma regressão com erros autocorrelacionados. Vamos encaixar o modelo M t alpha betat gammaPt e t onde Mt e Pt são as séries de mortalidade (cmort) e de partículas (parte), e e t é erro autocorrelacionado. Primeiro, faça um ajuste OLS e verifique os resíduos: Agora, ajuste o modelo A análise residual (não mostrada) parece perfeita. Heres um modelo ARMAX, M t beta 0 phi 1 M t-1 phi 2 M t-2 beta 1 t beta 2 T t-1 beta 3 P t beta 4 P t-4 e t. onde e t é possivelmente autocorrelacionado. Primeiro nós tentamos e ARMAX (p2, q0), então olhamos os resíduos e percebemos que não há correlação, então foi feito. Finalmente, uma análise espectral rápida: Isso é tudo por agora. Se você quiser mais gráficos de séries de tempo, consulte a página de Correção Rápida de Gráficos.

Comments

Popular Posts