Média móvel Este exemplo ensina como calcular a média móvel de uma série temporal no Excel. Uma média móvel é usada para suavizar irregularidades (picos e vales) para reconhecer facilmente as tendências. 1. Primeiro, vamos dar uma olhada em nossas séries temporais. 2. Na guia Dados, clique em Análise de dados. Nota: não consigo encontrar o botão Análise de dados Clique aqui para carregar o complemento Analysis ToolPak. 3. Selecione Média móvel e clique em OK. 4. Clique na caixa Intervalo de entrada e selecione o intervalo B2: M2. 5. Clique na caixa Intervalo e digite 6. 6. Clique na caixa Escala de saída e selecione a célula B3. 8. Traçar um gráfico desses valores. Explicação: porque definimos o intervalo para 6, a média móvel é a média dos 5 pontos de dados anteriores e o ponto de dados atual. Como resultado, picos e vales são alisados. O gráfico mostra uma tendência crescente. O Excel não pode calcular a média móvel para os primeiros 5 pontos de dados porque não há suficientes pontos de dados anteriores. 9. Repita os passos 2 a 8 para o intervalo 2 e o intervalo 4. Conclusão: quanto maior o intervalo, mais os picos e os vales são alisados. Quanto menor o intervalo, mais próximas as médias móveis são para os pontos de dados reais. Tornar uma média móvel é um processo de suavização Uma maneira alternativa de resumir os dados passados é calcular a média de sucessivos conjuntos menores de números passados da seguinte maneira. Lembre-se do conjunto de números 9, 8, 9, 12, 9, 12, 11, 7, 13, 9, 11, 10, que foram a quantidade de dólares de 12 fornecedores selecionados aleatoriamente. Vamos definir (M), o tamanho do conjunto menor igual a 3. Então a média dos três primeiros números é: (9 8 9) 3 8.667. Isso é chamado de suavização (ou seja, alguma forma de média). Este processo de suavização é continuado avançando um período e calculando a próxima média de três números, deixando cair o primeiro número. Exemplo de média em movimento A próxima tabela resume o processo, que é referido como Lotação ambulante. A expressão geral para a média móvel é Mt frac cdots X. Resultados do exemplo da série Moving AverageTime Os exemplos a seguir ilustram como o XLMiner pode ser usado para explorar os dados para descobrir tendências e estanquidades. Na faixa XLMiner, na guia Aplicar seu modelo, selecione Ajuda - Exemplos. Então ForecastingData Mining Examples e abra o conjunto de dados de exemplo, Income. xlsx. Este conjunto de dados contém a renda média dos contribuintes por estado. Normalmente, as seguintes etapas são realizadas em uma análise de séries temporais. 1. Os dados são divididos em dois conjuntos com 60 dos dados atribuídos ao Conjunto de Treinamento e 40 atribuídos ao Conjunto de Validação. 2. As técnicas exploratórias são aplicadas tanto aos Conjuntos de Treinamento e Validação. Se os resultados estiverem sincronizados, o modelo pode ser ajustado. Se os gráficos ACF e PACF forem iguais, então o mesmo modelo pode ser usado para ambos os conjuntos. 3. O modelo está em forma usando o método ARIMA (Automatismo Integrado Mínimo Integrado). 4. Quando um modelo estiver ajustado usando o método ARIMA, o XLMiner exibe os gráficos ACF e PACF para resíduos. Se essas parcelas estiverem na banda de UCL e LCL, então os resíduos são aleatórios e o modelo é adequado. 5. Se os resíduos não estiverem dentro das bandas, então existem algumas correlações, e o modelo deve ser melhorado. Primeiro, execute uma partição nos dados. Selecione uma célula dentro do conjunto de dados e, em seguida, no ribboon XLMiner, na guia Time Series, selecione Partition para abrir a caixa de diálogo Time Series Partition Data. Sob a lista Variáveis, selecione Ano e clique em gt para passar para a Variável de Tempo. Selecione as variáveis restantes na lista de variáveis e clique em gt para incluí-las nas variáveis na lista de dados de partição. Em Especificar Opções de Particionamento, selecione Especificar Registros para especificar o número de registros atribuídos aos Conjuntos de Treinamento e Validação. Em Especificar registros para particionamento, selecione Especificar registros e, em seguida, insira 50 para o número de registros de Treinamento e 21 para o número de registros de validação. Se Specify percentages for selecionado em Specify Partitioning Options, o XLMiner atribui uma porcentagem de registros a cada conjunto de acordo com os valores inseridos pelo usuário ou inserido automaticamente pelo XLMiner em Especificar porcentagens para particionamento. Clique em OK. A planilha do DataPartitionTS é inserida à direita da planilha da Renda. Na saída acima, o método de particionamento é seqüencial (versus aleatório). As primeiras 50 observações foram atribuídas ao Conjunto de Treinamento e as 21 observações restantes foram atribuídas ao Conjunto de Validação. Selecione uma célula na planilha DataPartitionTS e, na faixa XLMiner, na guia Time Series, selecione ARIMA - Autocorrelations para exibir a caixa de diálogo ACF. Selecione CA como a variável Selecionada, insira 10 para ambos os Parâmetros do ACF para Dados de Treinamento e Dados de Validação. O gráfico ACF Plot é selecionado por padrão. Clique em OK. A folha de cálculo ACFOutput é inserida após a planilha DataPartitionTS. Observe em cada gráfico que a autocorrelação diminua à medida que o número de atrasos aumenta. Isso sugere que existe um padrão definido em cada partição. No entanto, uma vez que o padrão não se repete, pode assumir-se que não há dados sazonais nos dados. Além disso, uma vez que ambos os gráficos apresentam um padrão semelhante, podemos ajustar o mesmo modelo para os Conjuntos de Validação e Treinamento. Clique de volta para a planilha DataPartitionTS e na faixa XLMiner, na guia Time Series, selecione ARIMA - Autocorrelations parciais para abrir a caixa de diálogo PACF. Selecione CA a partir da lista Variáveis em dados de entrada e, em seguida, clique em gt para mover a variável para a variável Selecionada. Insira 40 para Laguna Máxima em Parâmetros PACF para Dados de Treinamento e 15 para Parâmetros PACF para Dados de Validação. O gráfico PACF Plot é selecionado por padrão. Clique em OK. A folha de cálculo ACFOutput é inserida diretamente à direita da planilha DataPartitionTS. Ambos os lotes de PACF mostram padrões similares nos Conjuntos de Validação e Treinamento. Como resultado, podemos usar o mesmo modelo para ambos os conjuntos. Saída PACF para dados de treinamento Saída PACF para dados de validação A função PACF mostra um padrão definido, o que significa que há uma tendência nos dados. No entanto, uma vez que o padrão não se repete, podemos concluir que os dados não mostram qualquer sazonalidade. Ambos os gráficos ACF e PACF sugerem que existe um padrão definido, mas sem qualquer sazonalidade. Ambos os conjuntos de dados exibem o mesmo comportamento nos Conjuntos de Treinamento e Validação, o que sugere que o mesmo modelo é apropriado para cada um. Agora estamos prontos para ajustar o modelo. O modelo ARIMA aceita três parâmetros: p - o número de termos autorregressivos d - o número de diferença não sazonal e q - o número de erros atrasados (médias móveis). Lembre-se de que o gráfico ACF não mostrou uma sazonalidade nos dados, o que significa que a autocorrelação é quase estática, diminuindo com o número de atrasos aumentando. Isso sugere configuração q 0, pois parece não haver erros atrasados. O argumento PACF exibiu um grande valor para o primeiro intervalo, mas parcelas mínimas para atrasos sucessivos. Isso sugere configuração p 1. Com a maioria dos conjuntos de dados, a configuração d 1 é suficiente ou pode ser pelo menos um ponto de partida. Clique de volta para a planilha DataPartitionTS e na fita XLMiner, na guia Time Series, selecione o modelo ARIMA - ARIMA para exibir a caixa de diálogo Time Series - ARIMA. Selecione CA a partir da lista de Variáveis de dados de entrada e, em seguida, clique em gt para mover a variável para o campo Variável selecionado. Em Parâmetros não sazonais, ajuste Autoregressivo (p) para 1, Diferença (d) para 1 e Média Mover (q) para 0. Clique em Avançado para abrir a caixa de diálogo ARIMA - Opções Avançadas. Selecione Valores ajustados e resíduos, Produza previsões e Relate os intervalos de confiança da previsão. A configuração padrão de Confiança de 95 é inserida automaticamente. A matriz de variância-covariância é selecionada por padrão. Clique em OK na caixa de diálogo Opções avançadas do ARIMA e novamente na caixa de diálogo Série temporal - ARIMA. O XLMiner calcula e exibe vários parâmetros e gráficos em duas folhas de saída, ARIMAOutput e ARIMAResiduais. A planilha ARIMAOutput contém o modelo ARIMA, mostrado abaixo. Nesta mesma planilha, o XLMiner calculou o termo constante e o termo AR1 para o nosso modelo. Estes são os termos constantes e f1 da equação de previsão. Veja a seguinte saída do teste Qui-quadrado. O pequeno valor de p para o termo constante (0.9704) eo termo AR1 (0) sugerem que o modelo é um ajuste adequado aos nossos dados. Abra a planilha ARIMAResiduais. Esta tabela traça os valores reais e ajustados e os resíduos resultantes. Conforme mostrado no gráfico abaixo, os valores reais e previstos correspondem bastante bem. A utilidade do modelo na previsão dependerá de quão perto os valores reais e previstos estejam no gráfico de tempo do conjunto de validação. Em seguida, veremos os gráficos ACF e PACF para Erros encontrados na parte inferior da planilha ARIMAOutput. Todos os atrasos, exceto o atraso 1, estão claramente dentro das bandas UCL e LCL. Isso indica que os resíduos são aleatórios e não estão correlacionados, que é a primeira indicação de que os parâmetros do modelo são adequados para esses dados. Consulte a tabela de previsão na planilha ARIMAOutput. A tabela mostra o valor real e previsto. Os valores inferior e superior representam os limites inferior e superior do intervalo de confiança. Há 95 chances de que o valor previsto caia nessa faixa. O gráfico de tempo para a direita indica como o modelo, que montamos usando o Conjunto de Treinamento e realizado no Conjunto de Validação. Os valores reais e previstos são bastante próximos, o que confirma que nosso modelo deve ser bom para a previsão. Para traçar os valores abaixo da coluna inferior e superior no mesmo gráfico, selecione o gráfico e, na faixa de Excel, selecione Design - Selecionar dados para abrir a caixa de diálogo Selecionar fonte de dados. Para o intervalo de dados do gráfico, digite ARIMAOutputB56: G77. Depois desmarque o erro em Legend Entries. Clique em OK. Esta trama mostra que os valores reais e previstos estão dentro das bandas de nível de confiança inferior e superior 95. Embora os valores reais flutuem um pouco, esses valores se enquadram no centro do intervalo. Podemos concluir a partir da saída ARIMA, que nosso modelo usando parâmetros (1, 1, 0) mostrou adequar-se adequadamente aos dados.
No comments:
Post a Comment