Thursday 23 November 2017

Media Móvil De Series De Tiempo


La función Promedio móvil (Serie de tiempo) devuelve el promedio móvil de un campo durante un período de tiempo dado basado en una regresión lineal. Parámetros ------------------ Datos Los datos a utilizar en la regresión. Esto es típicamente un campo en una serie de datos o un valor calculado. Período El número de barras de datos a incluir en la regresión, incluyendo el valor actual. Por ejemplo, un período de 3 incluye el valor actual y los dos valores previos. Función Valor -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- El valor actual para esa línea. Una línea de regresión lineal es una línea recta que está tan cerca de todos los valores dados como sea posible. El promedio móvil de series temporales al principio de una serie de datos no se define hasta que haya suficientes valores para llenar el período dado. Tenga en cuenta que un promedio móvil de series de tiempo difiere mucho de otros tipos de promedios móviles en que el valor actual sigue la tendencia reciente de los datos, no un promedio real de los datos. Debido a esto, el valor de esta función puede ser mayor o menor que todos los valores que se usan si la tendencia de los datos está generalmente aumentando o disminuyendo. Uso ---------- Los promedios móviles son útiles para suavizar datos brutos, como los precios diarios. Los datos de precios pueden variar mucho de día a día, oscureciendo si el precio sube o disminuye con el tiempo. Al observar la media móvil del precio, se puede ver un cuadro más general de las tendencias subyacentes. Dado que los promedios móviles pueden usarse para ver las tendencias, también pueden usarse para ver si los datos están obstaculizando la tendencia. Los sistemas de entrada / salida a menudo comparan datos con un promedio móvil para determinar si está soportando una tendencia o comenzando una nueva. Consulte los sistemas de entrada / salida de ejemplo para ver un ejemplo de utilización de un promedio móvil en un sistema de entrada / salida. Esta función es igual que el indicador de regresión lineal. También es el mismo que el Pronóstico de Series de Tiempo con un desplazamiento de cero. Promedios de Movimiento Promedios de Movimiento Con conjuntos de datos convencionales, el valor medio es a menudo el primero y uno de los estadísticos de resumen más útiles para calcular. Cuando los datos están en forma de series temporales, la media de la serie es una medida útil, pero no refleja la naturaleza dinámica de los datos. Los valores medios calculados en periodos de cortocircuito, ya sea antes del período actual o centrados en el período actual, suelen ser más útiles. Debido a que tales valores medios variarán o se moverán, a medida que el periodo actual se desplaza desde el tiempo t2, t3, etc., se conocen como medias móviles (Mas). Un promedio móvil simple es (típicamente) el promedio no ponderado de k valores previos. Una media móvil exponencialmente ponderada es esencialmente la misma que una media móvil simple, pero con contribuciones a la media ponderada por su proximidad al tiempo actual. Debido a que no hay una, sino toda una serie de promedios móviles para cualquier serie dada, el conjunto de Mas puede ser trazado en gráficos, analizado como una serie, y utilizado en el modelado y la predicción. Una gama de modelos puede ser construida usando medias móviles, y éstos se conocen como modelos del MA. Si estos modelos se combinan con modelos autorregresivos (AR), los modelos compuestos resultantes se conocen como modelos ARMA o ARIMA (el I es para integrado). Promedios móviles simples Puesto que una serie temporal puede considerarse como un conjunto de valores, t 1,2,3,4, n se puede calcular el promedio de estos valores. Si asumimos que n es bastante grande, y seleccionamos un entero k que es mucho menor que n. Podemos calcular un conjunto de promedios de bloques, o medias móviles simples (de orden k): Cada medida representa el promedio de los valores de datos sobre un intervalo de k observaciones. Obsérvese que la primera MA posible de orden k gt0 es que para t k. De forma más general, podemos eliminar el subíndice extra en las expresiones anteriores y escribir: Esto indica que la media estimada en el tiempo t es el promedio simple del valor observado en el tiempo t y los pasos de tiempo anteriores k -1. Si se aplican pesos que disminuyen la contribución de las observaciones que están más lejos en el tiempo, se dice que el promedio móvil se alisa exponencialmente. Los promedios móviles se usan a menudo como una forma de pronóstico, por lo que el valor estimado para una serie en el tiempo t 1, S t1. Se toma como la MA para el período hasta e incluyendo el tiempo t. p. ej. La estimación de hoy se basa en un promedio de valores anteriores registrados hasta e incluyendo ayer (para datos diarios). Los promedios móviles simples pueden ser vistos como una forma de suavizado. En el ejemplo ilustrado a continuación, el conjunto de datos sobre contaminación atmosférica que se muestra en la introducción a este tema se ha aumentado con una línea de 7 días de media móvil (MA), que se muestra aquí en rojo. Como se puede ver, la línea de MA suaviza los picos y valles en los datos y puede ser muy útil para identificar las tendencias. La fórmula estándar de cálculo de forward significa que los primeros k -1 puntos de datos no tienen ningún valor MA, pero a partir de entonces los cálculos se extienden hasta el punto final de datos de la serie. Una razón para calcular promedios móviles simples de la manera descrita es que permite calcular los valores para todos los intervalos de tiempo desde el tiempo tk hasta el presente, y A medida que se obtiene una nueva medida para el tiempo t1, se puede añadir el MA del tiempo t1 al conjunto ya calculado. Esto proporciona un procedimiento sencillo para conjuntos de datos dinámicos. Sin embargo, hay algunos problemas con este enfoque. Es razonable argumentar que el valor medio en los últimos 3 períodos, digamos, debería estar situado en el tiempo t -1, no en el tiempo t. Y para una MA sobre un número par de períodos tal vez debería estar situado en el punto medio entre dos intervalos de tiempo. Una solución a este problema es usar cálculos de MA centrados, en los que la MA en el tiempo t es la media de un conjunto simétrico de valores alrededor de t. A pesar de sus obvios méritos, este enfoque no se utiliza generalmente porque requiere que los datos estén disponibles para eventos futuros, lo que puede no ser el caso. En casos donde el análisis es enteramente de una serie existente, el uso de Mas centrado puede ser preferible. Los promedios móviles simples pueden considerarse como una forma de suavizado, eliminando algunos componentes de alta frecuencia de una serie temporal y destacando (pero no eliminando) las tendencias de manera similar a la noción general de filtrado digital. De hecho, las medias móviles son una forma de filtro lineal. Es posible aplicar un cálculo del promedio móvil a una serie que ya ha sido suavizada, es decir, suavizar o filtrar una serie ya suavizada. Por ejemplo, con un promedio móvil de orden 2, podemos considerar que se calcula usando pesos, por lo que la MA en x 2 0,5 x 1 0,5 x 2. Igualmente, la MA en x 3 0,5 x 2 0,5 x 3. Si Aplicar un segundo nivel de suavizado o filtrado, tenemos 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 es decir, el filtro de 2 etapas Proceso (o convolución) ha producido una media móvil simétrica ponderada variablemente, con pesos. Las convoluciones múltiples pueden producir promedios móviles ponderados bastante complejos, algunos de los cuales se han encontrado de uso particular en campos especializados, como en los cálculos del seguro de vida. Medias móviles se pueden utilizar para eliminar los efectos periódicos si se calcula con la longitud de la periodicidad como un conocido. Por ejemplo, con datos mensuales, las variaciones estacionales pueden ser eliminadas (si este es el objetivo) aplicando una media móvil simétrica de 12 meses con todos los meses ponderados igualmente, excepto el primero y el último que se ponderan en 1/2. Esto es porque habrá 13 meses en el modelo simétrico (tiempo actual, t. / - 6 meses). El total se divide por 12. Se pueden adoptar procedimientos similares para cualquier periodicidad bien definida. Promedios móviles ponderados exponencialmente (EWMA) Con la fórmula del promedio móvil simple: todas las observaciones son igualmente ponderadas. Si llamamos a estos pesos iguales, alfa t. Cada uno de los k pesos sería igual a 1 / k. Por lo que la suma de los pesos sería 1, y la fórmula sería: Ya hemos visto que las aplicaciones múltiples de este proceso resultan en los pesos que varían. Con las medias móviles exponencialmente ponderadas, se reduce la contribución al valor medio de las observaciones que se eliminan más en el tiempo, haciendo hincapié en los acontecimientos más recientes (locales). Esencialmente se introduce un parámetro de suavizado, 0lt alfa lt1, y la fórmula se revisa a: Una versión simétrica de esta fórmula sería de la forma: Si los pesos en el modelo simétrico son seleccionados como los términos de los términos de la expansión binomial, (1/21/2) 2q. Se sumarán a 1, y cuando q se haga grande, se aproximará a la distribución Normal. Esta es una forma de peso del núcleo, con el binomio actuando como la función del núcleo. La convolución de dos etapas descrita en la subsección anterior es precisamente esta disposición, con q1, dando los pesos. En el suavizado exponencial es necesario utilizar un conjunto de pesos que suman a 1 y que se reducen en tamaño geométricamente. Los pesos utilizados son típicamente de la forma: Para mostrar que estos pesos suman a 1, considere la expansión de 1 / como una serie. Podemos escribir y expandir la expresión entre paréntesis usando la fórmula binomial (1-x) p. Donde x (1-) y p -1, lo que da: Esto proporciona entonces una forma de media móvil ponderada de la forma: Esta suma puede escribirse como una relación de recurrencia: lo que simplifica enormemente el cálculo y evita el problema de que el régimen de ponderación Debe ser estrictamente infinito para que los pesos sumen a 1 (para valores pequeños de alfa, esto no suele ser el caso). La notación utilizada por diferentes autores varía. Algunos usan la letra S para indicar que la fórmula es esencialmente una variable suavizada y escriben: mientras que la literatura de la teoría de control usualmente usa Z en lugar de S para los valores exponencialmente ponderados o suavizados (véase, por ejemplo, Lucas y Saccucci, 1990, LUC1 , Y el sitio web del NIST para más detalles y ejemplos trabajados). Las fórmulas citadas anteriormente derivan del trabajo de Roberts (1959, ROB1), pero Hunter (1986, HUN1) utiliza una expresión de la forma: que puede ser más apropiada para su uso en algunos procedimientos de control. Con alfa 1, la estimación media es simplemente su valor medido (o el valor del elemento de datos anterior). Con 0.5 la estimación es el promedio móvil simple de las mediciones actuales y anteriores. En los modelos de predicción el valor, S t. Se utiliza a menudo como estimación o valor de pronóstico para el siguiente período de tiempo, es decir, como la estimación de x en el tiempo t 1. Así, tenemos: Esto muestra que el valor pronosticado en el tiempo t 1 es una combinación de la media móvil ponderada exponencial anterior Más un componente que representa el error de predicción ponderado, epsilon. En el tiempo t. Suponiendo que se da una serie de tiempo y se requiere un pronóstico, se requiere un valor para alfa. Esto puede estimarse a partir de los datos existentes mediante la evaluación de la suma de los errores de predicción al cuadrado obtenidos con valores variables de alfa para cada t 2,3. Estableciendo la primera estimación como el primer valor de datos observado, x 1. En aplicaciones de control, el valor de alfa es importante porque se usa en la determinación de los límites de control superior e inferior y afecta a la longitud de ejecución media (ARL) esperada Antes de que estos límites de control se rompen (bajo el supuesto de que las series temporales representan un conjunto de variables independientes aleatorias, distribuidas de forma idéntica con varianza común). En estas circunstancias, la varianza de la estadística de control es (Lucas y Saccucci, 1990): Los límites de control se establecen usualmente como múltiplos fijos de esta varianza asintótica, p. / - 3 veces la desviación estándar. Si alfa 0.25, por ejemplo, y se supone que los datos que se están supervisando tienen una distribución Normal, N (0,1), cuando están en control, los límites de control serán / - 1.134 y el proceso alcanzará uno u otro límite en 500 Pasos en promedio. Lucas y Saccucci (1990 LUC1) derivan los ARLs para una amplia gama de valores alfa y bajo diversas suposiciones usando procedimientos de cadena de Markov. Ellos tabulan los resultados, incluyendo el suministro de ARLs cuando la media del proceso de control ha sido desplazada por un múltiplo de la desviación estándar. Por ejemplo, con un desplazamiento 0.5 con alfa 0.25 el ARL es menos de 50 pasos de tiempo. Los enfoques descritos anteriormente se conocen como suavizado exponencial simple. Ya que los procedimientos se aplican una vez a la serie temporal y luego los procesos de análisis o control se llevan a cabo en el conjunto de datos suavizado resultante. Si el conjunto de datos incluye una tendencia y / o componentes estacionales, se puede aplicar el suavizado exponencial de dos o tres etapas como un medio para eliminar (modelar explícitamente) estos efectos (véase más adelante la sección sobre Pronóstico y el ejemplo trabajado del NIST ). CHA1 Chatfield C (1975) El Análisis de la Serie de Tiempos: Teoría y Práctica. Chapman y Hall, Londres HUN1 Hunter J S (1986) La media móvil exponencialmente ponderada. J of Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Esquemas de control del promedio móvil ponderado exponencialmente: Propiedades y mejoras. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Pruebas de gráficos de control basadas en medias móviles geométricas. Technometrics, 1, 239-2505.2 Smoothing Time Series El suavizado se suele hacer para ayudarnos a ver mejor patrones, tendencias por ejemplo, en series de tiempo. Por lo general suavizar la irregularidad irregular para ver una señal más clara. Para los datos estacionales, podemos suavizar la estacionalidad para que podamos identificar la tendencia. Smoothing no nos proporciona un modelo, pero puede ser un buen primer paso para describir varios componentes de la serie. A veces se utiliza el término filtro para describir un procedimiento de suavizado. Por ejemplo, si el valor suavizado para un tiempo determinado se calcula como una combinación lineal de observaciones para tiempos circundantes, podría decirse que hemos aplicado un filtro lineal a los datos (no es lo mismo que decir que el resultado es una línea recta, por la manera). El uso tradicional del término media móvil es que en cada punto en el tiempo determinamos (posiblemente ponderado) promedios de los valores observados que rodean un tiempo particular. Por ejemplo, en el tiempo t. Un promedio móvil centrado de la longitud 3 con pesos iguales sería el promedio de los valores a veces t -1. T Y t1. Para quitar la estacionalidad de una serie, para que podamos ver mejor la tendencia, usaríamos un promedio móvil con un lapso de duración de temporada. Así, en la serie suavizada, cada valor suavizado se ha promediado en todas las estaciones. Esto puede hacerse mirando un promedio móvil unilateral en el cual usted promedio todos los valores para los años anteriores vale la pena de datos o una media móvil centrada en la que se utilizan valores antes y después de la hora actual. Para los datos trimestrales, por ejemplo, podríamos definir un valor suavizado para el tiempo t como (x t x t-1 x t-2 x t-3) / 4, el promedio de este tiempo y los 3 trimestres anteriores. En el código R, este será un filtro unilateral. Un promedio móvil centrado crea un poco de una dificultad cuando tenemos un número par de períodos de tiempo en el período de temporada (como solemos hacer). Para suavizar la estacionalidad en los datos trimestrales. Con el fin de identificar la tendencia, la convención habitual es utilizar el promedio móvil suavizado en el momento t es suavizar la estacionalidad en los datos mensuales. Es decir, se aplica el peso 1/24 a los valores a veces t6 y t6 y el peso 1/12 a todos los valores en todo momento entre t5 y T5. En el comando Filtro R, especifique bien un filtro de dos caras cuando desee utilizar valores que vienen tanto antes como después del tiempo para el cual fueron suavizados. Tenga en cuenta que en la página 71 de nuestro libro, los autores aplican pesos iguales a través de una media móvil estacional centrada. Eso está bien también. Por ejemplo, un tono trimestral más suave puede ser suavizado en el momento t es fraccionado x frac x frac x frac x frac x Un mensual más suave podría aplicar un peso de 1/13 a todos los valores de los tiempos t-6 a t6. El código que usan los autores en la página 72 se aprovecha de un comando rep que repite un valor un cierto número de veces. No utilizan el parámetro filter dentro del comando filter. Ejemplo 1 Producción trimestral de cerveza en Australia Tanto en la lección 1 como en la lección 4, examinamos una serie de producción trimestral de cerveza en Australia. El siguiente código R crea una serie suavizada que nos permite ver el patrón de tendencia y traza este patrón de tendencia en el mismo gráfico que la serie temporal. El segundo comando crea y almacena la serie suavizada en el objeto denominado trendpattern. Tenga en cuenta que dentro del comando filter, el parámetro named filter da los coeficientes para nuestro suavizado y sides 2 hace que se calcule un liso centrado. Beerprod (beerprod. dat) filtro de tendencia (beerprod, filtro c (1/8, 1/4, 1/4, 1/4, 1/8), sides2) parcela (beerprod, tipo b, ) Lines (trendpattern) Heres el resultado: Podemos restar el patrón de tendencia de los valores de datos para obtener una mejor mirada a la estacionalidad. El resultado sigue: Otra posibilidad para suavizar la serie para ver la tendencia es el filtro unilateral del filtro trendpattern2 (beerprod, filter c (1/4, 1/4, 1/4, 1/4), sides1) Con esto, el valor suavizado es el promedio del año pasado. \ Vskip1.000000 \ baselineskip Ejemplo 2 Desempleo Mensual de los Estados Unidos En la tarea de la semana 4 se examinó una serie mensual de desempleo estadounidense para 1948-1978. Heres un alisamiento hecho para mirar la tendencia. Trendunemployfilter (desempleo, filtroc (1 / 24,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12, 1 / 12,1 / 24), sides2) trendunemploy ts (trendunemploy, start c (1948,1), freq 12) parcela (trendunemploy, mainTrend en US Desempleo, 1948-1978, xlab Año) Sólo se traza la tendencia suavizada. El segundo comando identifica las características de tiempo de calendario de la serie. Eso hace que la trama tenga un eje más significativo. La trama sigue. Para las series no-estacionales, usted no está obligado a suavizar sobre cualquier período particular. Para suavizar, debe experimentar con medias móviles de diferentes tramos. Esos períodos de tiempo podrían ser relativamente cortos. El objetivo es eliminar los bordes ásperos para ver qué tendencia o patrón puede estar allí. Otros métodos de suavizado (Sección 2.4) La sección 2.4 describe varias alternativas sofisticadas y útiles para el suavizado promedio móvil. Los detalles pueden parecer incompletos, pero eso está bien porque no queremos quedar atascados en un montón de detalles para esos métodos. De los métodos alternativos descritos en la Sección 2.4, el lowess (regresión localmente ponderada) puede ser el más utilizado. Ejemplo 2 Continúa La siguiente gráfica es una línea de tendencia suavizada para la serie de desempleo de los Estados Unidos, encontrada usando un lowess más suave en el cual una cantidad sustancial (2/3) contribuyó a cada estimación suavizada. Tenga en cuenta que esto suavizado la serie más agresiva que el promedio móvil. Los comandos utilizados fueron los desempleados (desempleo, inicio c (1948,1), freq12) parcela (lowess (desempleo, f 2/3), suavizado principal Lowess de la Tendencia de Desempleo de los Estados Unidos) Suavizado Exponencial Único La ecuación básica de predicción para el suavizado exponencial simple Se pronostica que el valor de x en el tiempo t1 sea una combinación ponderada del valor observado en el tiempo t y el valor pronosticado en el tiempo t. Aunque el método se denomina método de suavizado, se utiliza principalmente para pronósticos a corto plazo. El valor de se llama constante de suavizado. Por cualquier razón, 0.2 es una popular opción por defecto de los programas. Esto pone un peso de 0,2 en la observación más reciente y un peso de 1,2,8 en la última previsión. Con un valor relativamente pequeño de, el alisado será relativamente más extenso. Con un valor relativamente grande de, el alisado es relativamente menos extenso ya que se pondrá más peso en el valor observado. Este es un simple método de previsión de un paso adelante que a primera vista parece no requerir un modelo para los datos. De hecho, este método es equivalente al uso de un modelo ARIMA (0,1,1) sin constante. El procedimiento óptimo consiste en ajustar un modelo ARIMA (0,1,1) al conjunto de datos observado y utilizar los resultados para determinar el valor de. Esto es óptimo en el sentido de crear lo mejor para los datos ya observados. Aunque el objetivo es suavizar y avanzar un paso adelante, la equivalencia con el modelo ARIMA (0,1,1) trae un buen punto. No debemos aplicar ciegamente el suavizado exponencial porque el proceso subyacente puede no estar bien modelado por un ARIMA (0,1,1). ARIMA (0,1,1) y Equivalencia exponencial de suavizado Considere un ARIMA (0,1,1) con media 0 para las primeras diferencias, xt - x t - 1: begin hat amp amp xt theta1 wt amp amp xt theta1 (xt - hat t) amp amp (1 theta1) xt - theta1que tienden. Si dejamos (1 1) y por lo tanto - (1) 1, vemos la equivalencia a la ecuación (1) anterior. Por qué se llama al método Suavizado exponencial Esto produce lo siguiente: comienza hat amplificador amp alfa xt (1-alfa) alfa x (1-alfa) hat amplificador alfa xt alfa (1-alfa) x (1-alfa) 2hat final Continuar De esta manera sustituyendo sucesivamente el valor previsto en el lado derecho de la ecuación. Esto conduce a: hat alpha xt alfa (1-alfa) x alfa (1-alfa) 2 x dots alfa (1-alfa) jx puntos alfa (1-alfa) x1 texto La ecuación 2 muestra que el valor pronosticado es un promedio ponderado De todos los valores pasados ​​de la serie, con pesos que cambian exponencialmente a medida que retrocedemos en la serie. Optimización del suavizado exponencial en R Básicamente, sólo ajustamos un ARIMA (0,1,1) a los datos y determinamos el coeficiente. Podemos examinar el ajuste del liso comparando los valores predichos con la serie real. El suavizado exponencial tiende a usarse más como una herramienta de pronóstico que como un verdadero más suave, por lo que buscamos ver si tenemos un buen ajuste. \ Vskip1.000000 \ baselineskip Ejemplo 3 N 100 observaciones mensuales del logaritmo de un índice de precios del petróleo en los Estados Unidos. La serie de datos es: Un ajuste de ARIMA (0,1,1) en R dio un coeficiente de MA (1) 0,3877. Ası, (1 1) 1.3877 y 1- -0.3877. La ecuación de predicción de suavizado exponencial es hat 1.3877xt - 0.3877hat t En el tiempo 100, el valor observado de la serie es x 100 0.86601. El valor previsto para la serie en ese momento es Así, el pronóstico para el tiempo 101 es el sombrero 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 A continuación se muestra qué tan bien el más suave se ajusta a la serie. Es un buen ajuste. Eso es una buena señal para la previsión, el principal objetivo de este suave. Aquí están los comandos usados ​​para generar la salida para este ejemplo: oilindex scan (oildata. dat) trazado (oilindex, tipo b, registro principal de la serie de índices de aceite) expsmoothfit arima (oilindex, order c (0,1,1)) expsmoothfit Para ver los resultados del arima predichos oilindex - expsmoothfitresiduals predited values ​​plot (oilindex, typeb, principal Alisamiento Exponencial de Log of Oil Index) líneas (predicteds) 1.3877oilindex100-0.3877predicteds100 pronóstico para el tiempo 101 Double Sponer Exponencial El doble suavizado exponencial podría ser utilizado cuando theres Tendencia (ya sea a largo plazo o corto plazo), pero sin estacionalidad. Esencialmente, el método crea un pronóstico combinando estimaciones exponencialmente suavizadas de la tendencia (pendiente de una recta) y el nivel (básicamente, la intersección de una recta). Dos pesos diferentes, o parámetros de suavizado, se utilizan para actualizar estos dos componentes en cada momento. El nivel suavizado es más o menos equivalente a un simple suavizado exponencial de los valores de los datos y la tendencia suavizada es más o menos equivalente a un simple suavizado exponencial de las primeras diferencias. El procedimiento es equivalente al montaje de un modelo ARIMA (0,2,2), sin constante puede realizarse con un ajuste ARIMA (0,2,2). (1 - B) 2 xt (1 theta1B theta2B2) wt. Navegación

No comments:

Post a Comment