média móvel Média de dados de séries temporais (observações igualmente espaçadas no tempo) de vários períodos consecutivos. Chamado de movimento porque é continuamente recalculado à medida que novos dados se tornam disponíveis, ele progride descartando o valor mais antigo e adicionando o valor mais recente. Por exemplo, a média móvel das vendas de seis meses pode ser calculada considerando a média das vendas de janeiro a junho, a média das vendas de fevereiro a julho, depois de março a agosto e assim por diante. As médias móveis (1) reduzem o efeito de variações temporárias nos dados, (2) melhoram o ajuste dos dados a uma linha (um processo chamado suavização) para mostrar a tendência dos dados mais claramente e (3) destacam qualquer valor acima ou abaixo do tendência. Se você está calculando algo com uma variação muito alta, o melhor que você pode fazer é calcular a média móvel. Eu queria saber qual era a média móvel dos dados, então eu teria uma melhor compreensão de como estávamos indo. Quando você está tentando descobrir alguns números que mudam frequentemente, o melhor que você pode fazer é calcular a média móvel. média móvel ponderada exponencialmente (EWMA) Médias móveis Médias móveis Com conjuntos de dados convencionais, o valor médio é geralmente o primeiro e um dos mais úteis, estatísticas de sumarização a serem calculadas. Quando os dados estão na forma de uma série temporal, a média da série é uma medida útil, mas não reflete a natureza dinâmica dos dados. Valores médios calculados sobre períodos curtos, seja precedendo o período atual ou centralizados no período atual, são geralmente mais úteis. Como esses valores médios variam ou se movem, à medida que o período atual se move do tempo t 2, t 3. etc., eles são conhecidos como médias móveis (Mas). Uma média móvel simples é (tipicamente) a média não ponderada de k valores anteriores. Uma média móvel exponencialmente ponderada é essencialmente a mesma que uma média móvel simples, mas com contribuições para a média ponderada pela sua proximidade com o tempo atual. Como não há uma, mas uma série inteira de médias móveis para qualquer série, o conjunto de Mas pode ser plotado em gráficos, analisado como uma série e usado na modelagem e previsão. Uma gama de modelos pode ser construída usando médias móveis, e estes são conhecidos como modelos MA. Se tais modelos forem combinados com modelos autorregressivos (AR), os modelos compostos resultantes são conhecidos como modelos ARMA ou ARIMA (o I é para integrado). Médias móveis simples Como uma série temporal pode ser considerada como um conjunto de valores,, 1,2,3,4, a média desses valores pode ser calculada. Se assumirmos que n é bem grande, selecionamos um inteiro k que é muito menor que n. Podemos calcular um conjunto de médias de blocos, ou médias móveis simples (de ordem k): Cada medida representa a média dos valores de dados ao longo de um intervalo de k observações. Note que o primeiro MA possível de ordem k gt0 é aquele para t k. Mais genericamente, podemos eliminar o subscrito extra nas expressões acima e escrever: Isso indica que a média estimada no tempo t é a média simples do valor observado no tempo t e os passos de tempo k -1 anteriores. Se forem aplicados pesos que diminuam a contribuição das observações que estão mais distantes no tempo, dizemos que a média móvel é suavizada exponencialmente. As médias móveis são frequentemente usadas como uma forma de previsão, pelo que o valor estimado para uma série no tempo t 1, S t1. é considerado como o MA para o período até e incluindo o tempo t. por exemplo. a estimativa de hoje é baseada em uma média de valores registrados anteriormente até e incluindo ontens (para dados diários). Médias móveis simples podem ser vistas como uma forma de suavização. No exemplo ilustrado abaixo, o conjunto de dados de poluição do ar mostrado na introdução deste tópico foi aumentado por uma linha de média móvel de 7 dias (MA), mostrada aqui em vermelho. Como pode ser visto, a linha MA suaviza os altos e baixos nos dados e pode ser muito útil na identificação de tendências. A fórmula padrão de cálculo para a frente significa que os primeiros pontos de dados k-1 não têm valor MA, mas, a partir daí, os cálculos se estendem até o ponto final de dados na série. PM10 daily daily mean, Greenwich source: Rede de Qualidade do Ar de Londres, londonair. org. uk Uma razão para calcular médias móveis simples da maneira descrita é que ela permite que valores sejam calculados para todos os horários desde o tempo até o presente, e como uma nova medição é obtida para o tempo t 1, a MA para o tempo t 1 pode ser adicionada ao conjunto já calculado. Isso fornece um procedimento simples para conjuntos de dados dinâmicos. No entanto, existem alguns problemas com essa abordagem. É razoável argumentar que o valor médio dos últimos 3 períodos, digamos, deveria estar localizado no tempo t -1, não no tempo t. e para um MA em um número par de períodos, talvez ele deva estar localizado no ponto médio entre dois intervalos de tempo. Uma solução para esse problema é usar os cálculos MA centrados, nos quais o MA no tempo t é a média de um conjunto simétrico de valores em torno de t. Apesar de seus méritos óbvios, essa abordagem geralmente não é usada porque exige que os dados estejam disponíveis para eventos futuros, o que pode não ser o caso. Nos casos em que a análise é inteiramente de uma série existente, o uso de Mas centralizado pode ser preferível. Médias móveis simples podem ser consideradas como uma forma de suavização, removendo alguns componentes de alta freqüência de uma série temporal e destacando (mas não removendo) as tendências de maneira semelhante à noção geral de filtragem digital. De fato, as médias móveis são uma forma de filtro linear. É possível aplicar um cálculo de média móvel a uma série que já tenha sido suavizada, isto é, suavizar ou filtrar uma série já suavizada. Por exemplo, com uma média móvel de ordem 2, podemos considerá-la como sendo computada usando pesos, de modo que o MA em x 2 0,5 x 1 0,5 x 2. Da mesma forma, o MA em x 3 0,5 x 2 0,5 x 3. Se aplicar um segundo nível de suavização ou filtragem, temos 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3, ou seja, a filtragem de 2 estágios processo (ou convolução) produziu uma média móvel simétrica com peso variável, com pesos. Múltiplas convoluções podem produzir médias móveis ponderadas bastante complexas, algumas das quais foram encontradas de uso particular em campos especializados, como em cálculos de seguro de vida. Médias móveis podem ser usadas para remover efeitos periódicos se computados com o comprimento da periodicidade como um conhecido. Por exemplo, com dados mensais, as variações sazonais geralmente podem ser removidas (se esse for o objetivo) aplicando uma média móvel simétrica de 12 meses com todos os meses ponderados igualmente, exceto o primeiro e o último que são ponderados por 1/2. Isso ocorre porque haverá 13 meses no modelo simétrico (tempo atual, t / - 6 meses). O total é dividido por 12. Procedimentos semelhantes podem ser adotados para qualquer periodicidade bem definida. Médias móveis ponderadas exponencialmente (EWMA) Com a fórmula média móvel simples: todas as observações são igualmente ponderadas. Se chamamos esses pesos iguais, alfa t. cada um dos pesos k seria igual a 1 / k. Portanto, a soma dos pesos seria 1 e a fórmula seria: Já vimos que vários aplicativos desse processo resultam em pesos variados. Com médias móveis exponencialmente ponderadas, a contribuição para o valor médio das observações que são mais removidas no tempo é deliberadamente reduzida, enfatizando, assim, eventos mais recentes (locais). Essencialmente um parâmetro de suavização, 0lt alpha lt1, é introduzido e a fórmula revisada para: Uma versão simétrica dessa fórmula seria da seguinte forma: Se os pesos no modelo simétrico forem selecionados como os termos dos termos da expansão binomial, (1/21/2) 2q. eles somarão 1 e, quando o q se tornar grande, se aproximarão da distribuição Normal. Esta é uma forma de ponderação do kernel, com o Binomial agindo como a função do kernel. A convolução de dois estágios descrita na subseção anterior é precisamente essa disposição, com q 1, produzindo os pesos. Na suavização exponencial é necessário usar um conjunto de pesos que somam 1 e que reduzem o tamanho geometricamente. Os pesos usados normalmente são da forma: Para mostrar que esses pesos somam 1, considere a expansão de 1 / como uma série. Podemos escrever e expandir a expressão entre parênteses usando a fórmula binomial (1- x) p. onde x (1-) e p -1, que fornece: Isso fornece uma forma de média móvel ponderada da forma: Essa soma pode ser escrita como uma relação de recorrência: o que simplifica muito o cálculo e evita o problema de que o regime de ponderação deve ser estritamente infinito para os pesos somarem 1 (para valores pequenos de alfa. normalmente não é o caso). A notação utilizada por diferentes autores varia. Alguns usam a letra S para indicar que a fórmula é essencialmente uma variável suavizada, e escrevem: enquanto a literatura de teoria de controle usa Z ao invés de S para valores exponencialmente ponderados ou suavizados (ver, por exemplo, Lucas e Saccucci, 1990, LUC1 e o site do NIST para mais detalhes e exemplos trabalhados). As fórmulas citadas acima derivam do trabalho de Roberts (1959, ROB1), mas Hunter (1986, HUN1) usa uma expressão da forma: que pode ser mais apropriada para uso em alguns procedimentos de controle. Com alfa 1, a estimativa média é simplesmente seu valor medido (ou o valor do item de dados anterior). Com 0,5 a estimativa é a média móvel simples das medições atuais e anteriores. Nos modelos de previsão, o valor, S t. é frequentemente usado como a estimativa ou o valor previsto para o próximo período de tempo, ou seja, como a estimativa para x no tempo t 1. Assim, temos: Isso mostra que o valor de previsão no tempo t 1 é uma combinação da média móvel ponderada exponencialmente anterior mais um componente que representa o erro de previsão ponderada, epsilon. no tempo t. Assumindo que uma série temporal é fornecida e uma previsão é necessária, um valor para alfa é necessário. Isso pode ser estimado a partir dos dados existentes, avaliando a soma dos erros de previsão quadráticos obtidos com valores variáveis de alfa para cada t 2,3. definindo a primeira estimativa como sendo o primeiro valor de dados observados, x 1. Nas aplicações de controle, o valor de alfa é importante na medida em que é usado na determinação dos limites de controle superior e inferior e afeta a duração média de execução (ARL) esperada antes que esses limites de controle sejam quebrados (sob a suposição de que a série temporal representa um conjunto de variáveis independentes aleatoriamente distribuídas identicamente com variância comum). Nestas circunstâncias, a variância da estatística de controlo: é (Lucas e Saccucci, 1990): Os limites de controlo são normalmente definidos como múltiplos fixos desta variância assintótica, e. / - 3 vezes o desvio padrão. Se alpha 0.25, por exemplo, e os dados sendo monitorados forem assumidos como tendo uma distribuição Normal, N (0,1), quando em controle, os limites de controle serão / - 1,134 e o processo atingirá um ou outro limite em 500 passos em média. Lucas e Saccucci (1990 LUC1) derivam os ARLs para uma ampla gama de valores alfa e sob várias hipóteses usando procedimentos da Cadeia de Markov. Eles tabular os resultados, incluindo o fornecimento de ARLs quando a média do processo de controle foi alterada por um múltiplo do desvio padrão. Por exemplo, com um desvio de 0,5 com alpha 0,25, o ARL é inferior a 50 intervalos de tempo. As abordagens descritas acima são conhecidas como suavização exponencial simples. como os procedimentos são aplicados uma vez para a série temporal e, em seguida, os processos de análise ou controle são executados no conjunto de dados suavizado resultante. Se o conjunto de dados incluir uma tendência e / ou componentes sazonais, a suavização exponencial de dois ou três estágios pode ser aplicada como um meio de remover (modelar explicitamente) esses efeitos (consulte a seção sobre Previsão abaixo e o exemplo do NIST ). CHA1 Chatfield C (1975) A Análise da Série dos Tempos: Teoria e Prática. Chapman e Hall, Londres HUN1 Hunter J S (1986) A média móvel exponencialmente ponderada. J de Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Esquemas de controle médio móvel com ponderação exponencial: propriedades e aprimoramentos. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Testes de cartas de controle baseados em médias móveis geométricas. Technometrics, 1, 239-250Method of Moving Averages Os comentários estão desativados Suponha que haja períodos de tempo denotados por e os valores correspondentes da variável. Primeiro de tudo, temos que decidir o período das médias móveis. Para séries temporais curtas, usamos período de 3 ou 4 valores. Para séries temporais longas, o período pode ser 7, 10 ou mais. Para séries temporais trimestrais, sempre calculamos as médias levando 4 quartos de cada vez. Em séries temporais mensais, as médias móveis de 12 meses são calculadas. Suponha que a série temporal fornecida seja em anos e decidimos calcular a média móvel de 3 anos. As médias móveis denotadas por são calculadas como abaixo:
Comments
Post a Comment