Thursday, 5 October 2017

Var Media Móvil Ponderada Exponencialmente


Exploración de la media ponderada ponderada exponencial La volatilidad es la medida más común del riesgo, pero viene en varios sabores. En un artículo anterior, mostramos cómo calcular la volatilidad histórica simple. Utilizamos la volatilidad para medir el riesgo futuro. Utilizamos los datos reales de los precios de las acciones de Google para calcular la volatilidad diaria basada en 30 días de datos de existencias. En este artículo, mejoraremos la volatilidad simple y discutiremos el promedio móvil exponencialmente ponderado (EWMA). Vs histórico. Volatilidad implícita En primer lugar, permite poner esta métrica en un poco de perspectiva. Existen dos enfoques generales: volatilidad histórica e implícita (o implícita). El enfoque histórico supone que el pasado es un prólogo que medimos la historia con la esperanza de que sea predictivo. La volatilidad implícita, por el contrario, ignora la historia que resuelve por la volatilidad implícita en los precios de mercado. Espera que el mercado conozca mejor y que el precio de mercado contenga, aunque implícitamente, una estimación consensual de la volatilidad. Si nos centramos sólo en los tres enfoques históricos (a la izquierda de arriba), tienen dos pasos en común: Calcular la serie de retornos periódicos Aplicar un esquema de ponderación En primer lugar, Calcular el retorno periódico. Ésta es típicamente una serie de vueltas diarias donde cada vuelta se expresa en términos continuamente compuestos. Para cada día, tomamos el registro natural de la relación de precios de las acciones (es decir, el precio hoy dividido por el precio ayer, y así sucesivamente). Esto produce una serie de retornos diarios, de u i a u i-m. Dependiendo de cuántos días (m días) estamos midiendo. Eso nos lleva al segundo paso: aquí es donde los tres enfoques difieren. En el artículo anterior (Usando Volatilidad Para Calcular el Riesgo Futuro), mostramos que bajo un par de simplificaciones aceptables, la varianza simple es el promedio de los retornos cuadrados: Obsérvese que esto suma cada uno de los retornos periódicos, luego divide ese total por el Número de días u observaciones (m). Por lo tanto, su realmente sólo un promedio de los retornos cuadrados periódico. Dicho de otra manera, cada cuadrado de retorno se da un peso igual. Por lo tanto, si alfa (a) es un factor de ponderación (específicamente, 1 / m), entonces una variante simple se parece a esto: El EWMA mejora en la varianza simple La debilidad de este enfoque es que todas las ganancias ganan el mismo peso. El retorno de ayer (muy reciente) no tiene más influencia sobre la varianza que el retorno de los últimos meses. Este problema se fija mediante la media móvil ponderada exponencialmente (EWMA), en la cual los rendimientos más recientes tienen mayor peso sobre la varianza. La media móvil exponencialmente ponderada (EWMA) introduce lambda. Que se denomina parámetro de suavizado. Lambda debe ser menos de uno. Bajo esta condición, en lugar de iguales ponderaciones, cada cuadrado de retorno es ponderado por un multiplicador de la siguiente manera: Por ejemplo, RiskMetrics TM, una empresa de gestión de riesgos financieros, tiende a utilizar un lambda de 0,94 o 94. En este caso, el primero Más reciente) cuadrado es ponderado por (1-0.94) (. 94) 0 6. El próximo cuadrado de retorno es simplemente un lambda-múltiplo del peso anterior en este caso 6 multiplicado por 94 5.64. Y el tercer día anterior el peso es igual (1-0.94) (0.94) 2 5.30. Ese es el significado de exponencial en EWMA: cada peso es un multiplicador constante (es decir, lambda, que debe ser menor que uno) del peso de los días anteriores. Esto asegura una varianza que está ponderada o sesgada hacia datos más recientes. (Para obtener más información, consulte la hoja de cálculo de Excel para la volatilidad de Google.) A continuación se muestra la diferencia entre la volatilidad y EWMA para Google. La volatilidad simple pesa efectivamente cada vuelta periódica en 0.196 como se muestra en la columna O (teníamos dos años de datos de precios de acciones diarios, es decir, 509 devoluciones diarias y 1/509 0.196). Pero note que la Columna P asigna un peso de 6, luego 5.64, luego 5.3 y así sucesivamente. Esa es la única diferencia entre la varianza simple y EWMA. Recuerde: Después de sumar la serie completa (en la columna Q) tenemos la varianza, que es el cuadrado de la desviación estándar. Si queremos volatilidad, necesitamos recordar tomar la raíz cuadrada de esa varianza. ¿Cuál es la diferencia en la volatilidad diaria entre la varianza y EWMA en el caso de Googles? Su significativo: La variación simple nos dio una volatilidad diaria de 2,4 pero la EWMA dio una volatilidad diaria de sólo 1,4 (ver la hoja de cálculo para más detalles). Aparentemente, la volatilidad de Googles se estableció más recientemente, por lo tanto, una simple varianza podría ser artificialmente alta. La variación de hoy es una función de la variación de los días de Pior Usted notará que necesitábamos calcular una larga serie de pesos exponencialmente decrecientes. No haremos la matemática aquí, pero una de las mejores características de la EWMA es que toda la serie se reduce convenientemente a una fórmula recursiva: Recursiva significa que las referencias de la varianza de hoy (es decir, es una función de la variación de días anteriores). Esta fórmula también se encuentra en la hoja de cálculo, y produce exactamente el mismo resultado que el cálculo de longitud larga. Se dice: La varianza de hoy (bajo EWMA) equivale a la varianza de ayer (ponderada por lambda) más la vuelta al cuadrado de ayer (pesada por uno menos lambda). Nótese cómo estamos agregando dos términos juntos: la varianza ponderada de ayer y la de ponderación ponderada de ayer, al cuadrado. Aun así, lambda es nuestro parámetro de suavizado. Un lambda más alto (por ejemplo, como RiskMetrics 94) indica una disminución más lenta en la serie - en términos relativos, vamos a tener más puntos de datos en la serie y van a caer más lentamente. Por otro lado, si reducimos el lambda, indicamos una mayor decaimiento: los pesos se caen más rápidamente y, como resultado directo de la rápida decaimiento, se utilizan menos puntos de datos. (En la hoja de cálculo, lambda es una entrada, para que pueda experimentar con su sensibilidad). Resumen La volatilidad es la desviación estándar instantánea de un stock y la métrica de riesgo más común. Es también la raíz cuadrada de la varianza. Podemos medir la varianza históricamente o implícitamente (volatilidad implícita). Cuando se mide históricamente, el método más fácil es la varianza simple. Pero la debilidad con la varianza simple es que todas las ganancias obtienen el mismo peso. Así que enfrentamos un trade-off clásico: siempre queremos más datos, pero cuanto más datos tengamos, más nuestro cálculo se diluye por datos distantes (menos relevantes). La media móvil exponencialmente ponderada (EWMA) mejora la varianza simple asignando pesos a los retornos periódicos. Haciendo esto, podemos usar un tamaño de muestra grande pero también dar mayor peso a los retornos más recientes. Cálculo del valor en riesgo Ejemplo Cálculo del valor en riesgo Ejemplo Este caso de valor en riesgo (VaR) muestra cómo calcular el VaR en Excel utilizando dos métodos diferentes (covarianza de varianza y Simulación histórica) con datos disponibles públicamente. Lo que necesitará El recurso Value at Risk y la página de referencia. Datos para los precios spot Gold que se pueden descargar de Onlygold para el período 1-Jun-2011 hasta 29-Jun-2012 Datos para los precios al contado WTI Petróleo crudo que se pueden descargar de EIA. gov para el período 1-Jun-2011 A 29-Jun-2012 Ejemplo de Valor en Riesgo Cubrimos los métodos de Covarianza de Varianza (VCV) y Simulación Histórica (HS) para calcular el Valor en Riesgo (VaR). En la lista a continuación los primeros 6 ítems pertenecen al enfoque de VCV mientras que los 3 ítems finales se relacionan con el enfoque de Simulación Histórica. Dentro del enfoque de VCV, dos metodologías separadas para determinar la volatilidad subyacente de los retornos se consideran método del promedio móvil simple (SMA) y el método del promedio móvil ponderado exponencial (EWMA). El VaR utilizando la simulación Monte Carlo no está cubierto en este post. Vamos a mostrar los cálculos de: SMA volatilidad diaria SMA diario VaR J días de tenencia SMA VaR SMA VaR EWMA volatilidad diaria J días de tenencia EWMA VaR Simulación histórica diario VaR Simulación histórica J días de tenencia VaR 10 días de tenencia histórica simulación VaR Cantidad de pérdidas para un nivel de confianza 99 Valor en riesgo ejemplo 8211 contexto Nuestra cartera comprende de la exposición física a 100 onzas troy de oro y 1000 barriles de crudo WTI. El precio del oro (por onza troy) es 1.598,50 y el precio del WTI (por barril) es 85,04 el 29-Jun-2012. Datos Series de precios históricos Se han obtenido datos históricos de precios de oro y WTI para el período del 1-Jun-2011 al 29-Jun-2012 de onlygold y eia. gov, respectivamente. El período considerado en el cálculo del VaR se denomina período de retrocesión. Es el tiempo sobre el cual se va a evaluar el riesgo. La Figura 1 muestra un extracto de los datos de series de tiempo diarias: Figura 1: Datos de series temporales para Gold y WTI Las series de retorno El primer paso para cualquiera de los enfoques de VaR es la determinación de la serie de retorno. Esto se logra tomando el logaritmo natural de la relación de precios sucesivos como se muestra en la Figura 2: Figura 2: Datos de la serie de devolución para Gold y WTI Por ejemplo, se calcula la rentabilidad diaria de Gold en 2-Jun-2011 (Cell G17) Como LN (Cell C17 / Cell C16) ln (1539,50 / 1533,75) 0,37. Variance Covariance Promedio móvil simple (SMA) Se calcula la siguiente volatilidad diaria de SMA. La fórmula es la siguiente: Rt es la tasa de retorno en el tiempo t. E (R) es la media de la distribución de retorno que se puede obtener en EXCEL tomando la media de la serie de retorno, es decir, MEDIA (matriz de series de retorno). Suma las diferencias al cuadrado de Rt sobre E (R) en todos los puntos de datos y divide el resultado por el número de retornos en la serie menos uno para obtener la varianza. La raíz cuadrada del resultado es la desviación estándar o volatilidad SMA de la serie de retorno. Como se muestra en la Figura 3, la volatilidad puede calcularse directamente en EXCEL utilizando la función STDEV, como se muestra en la Figura 3. Figura 3: Datos de serie de retorno para Gold y WTI La volatilidad SMA diaria para Gold en Cell F18 se calcula como STDEV (Serie de series de retorno de oro). La volatilidad SMA diario para el oro es 1.4377 y para WTI es 1.9856. SMA daily VaR ¿Cuánto está dispuesto a perder, en un período de tenencia determinado y con una probabilidad dada VaR mide la pérdida de caso más grave que probablemente se registre en una cartera durante un período de tenencia con una probabilidad o nivel de confianza dado. Por ejemplo, suponiendo un nivel de confianza de 99, un VaR de USD 1 millón o un período de tenencia de diez días significa que sólo hay un uno por ciento de probabilidad de que las pérdidas excedan USD 1 en los próximos diez días. Los enfoques SMA y EWMA del VaR suponen que los retornos diarios siguen una distribución normal. El VaR diario asociado con un nivel de confianza dado se calcula como: VaR Diario Volatilidad o desviación estándar de la serie de retorno z - valor de la inversa de la función normal de distribución acumulativa normal (CDF) correspondiente a un nivel de confianza especificado. Ahora podemos responder a la siguiente pregunta: ¿Cuál es el VaR diaria de SMA para Gold y WTI con un nivel de confianza de 99. Esto se muestra en la Figura 4 a continuación: Figura 4: VaR Diario VaR diario para el oro calculado en la celda F16 es el producto de la La volatilidad SMA diaria (Cell F18) y el valor z de la inversa del CDF normal estándar para 99. En EXCEL, el puntaje z inverso al nivel de confianza 99 se calcula como NORMSINV (99) 2,326. Por lo tanto, el VaR diario para el oro y WTI en el nivel de confianza de 99 trabaja a 3.3446 y 4.6192 respectivamente. J-day holding SMA VaR Escenario 1 La definición de VaR mencionada anteriormente considera tres cosas, la pérdida máxima, la probabilidad y el período de tenencia. El período de tenencia es el tiempo que tomaría para liquidar el activo / cartera en el mercado. En Basilea II y Basilea III, un período de tenencia de diez días es un supuesto estándar. ¿Cómo se incorpora el período de tenencia a sus cálculos? ¿Cuál es la tenencia de SMA VaR para WTI amp Gold para un período de tenencia 10 días a un nivel de confianza de 99 Período de tenencia VaR Daily VaR SQRT (período de tenencia en días) Donde SQRT Función de raíz cuadrada EXCELs. Esto se demuestra para el WTI y Gold en la Figura 5 a continuación: Figura 5: Período de tenencia de 10 días VaR 99 nivel de confianza El VaR de tenencia de 10 días para el oro a 99 el nivel de confianza (Cell F15) se calcula multiplicando Daily VaR (Cell F17 ) Con la raíz cuadrada del período de tenencia (Célula F16). Esto resulta ser 10.5767 para el oro y 14.6073 para WTI. J-day holding SMA VaR Escenario 2 Vamos a considerar la siguiente pregunta: ¿Qué es la celebración de SMA VaR para el oro WTI amplitud para un período de celebración de 252 días a un nivel de confianza de 75 Tenga en cuenta que 252 días se toman para representar los días de negociación en un año. La metodología utilizada es la misma que se usó antes para calcular el VaR SMA de tenencia de 10 días a un nivel de confianza de 99, excepto que se cambia el nivel de confianza y el período de tenencia. Por lo tanto, determinamos primero el VaR diario al nivel de confianza de 75. Recordemos que el VaR diario es el producto de la volatilidad SMA diaria de los retornos subyacentes y la puntuación z inversa (aquí calculada para 75, es decir, NORMSINV (75) 0,6745). El VaR diario resultante se multiplica con la raíz cuadrada de 252 días para llegar al VaR de tenencia. Esto se ilustra en la Figura 6 a continuación: Figura 6: Período de retención de 252 días VaR 75 nivel de confianza 252 días VaR de retención a 75 para el oro (Cell F15) es el producto del VaR diario calculado a 75 nivel de confianza (Cell F17) La raíz cuadrada del período de tenencia (Célula F16). Es 15.3940 para el oro y 21.2603 para el WTI. El VaR diario a su vez es el producto de la volatilidad SMA diaria (Cell F19) y el z-score inverso asociado con el nivel de confianza (Cell F18). Cartera de SMA VaR Hasta ahora sólo hemos considerado el cálculo del VaR para los activos individuales. ¿Cómo extendemos el cálculo al VaR de cartera? ¿Cómo se correlacionan las correlaciones entre activos en la determinación del VaR de Cartera Consideremos la siguiente pregunta: ¿Cuál es el VaR de SMA de 10 días para una cartera de Gold y WTI con un nivel de confianza de 99 El primer paso en este cálculo es la determinación de pesos para Gold y WTI con respecto a la cartera. Vamos a revisar la información de la cartera mencionada al comienzo del estudio de caso: La cartera comprende 100 onzas troy de oro y 1000 barriles de crudo WTI. El precio del oro (por onza troy) es 1.598,50 y el precio del WTI (por barril) es 85,04 el 29-Jun-2012. El cálculo de los pesos se muestra en la Figura 7 a continuación: Figura 7: Pesos de los activos individuales en la cartera Los pesos se han evaluado en función del valor de mercado de la cartera el 29 de junio de 2012. Los valores de mercado de los activos se calculan multiplicando la cantidad de un activo dado en la cartera con su precio de mercado el 29-Jun-2012. Los pesos se calculan entonces como el valor de mercado del activo dividido por el valor de mercado de la cartera donde el valor de mercado de la cartera es la suma de los valores de mercado de todos los activos de la cartera. Luego determinamos un retorno promedio ponderado de la cartera para cada punto de datos (fecha). Esto se ilustra en la Figura 8 a continuación: Gráfico 8: Retornos de la cartera El rendimiento promedio ponderado de la cartera para una fecha determinada se calcula como la suma de todos los activos del producto de la declaración de activos para esa fecha y los pesos. Por ejemplo, para el 2-Jun-2011 el rendimiento de la cartera se calcula como (0.3765.27) (0.1134.73) 0.28. Esto se puede hacer en EXCEL utilizando la función SUMPRODUCT como se muestra en la barra de funciones de la Figura 8, aplicada a la fila de pesos (Celda C19 a Celda D19) y las filas de retorno (Celda Fxx a Celda Gxx) para cada fecha. Para mantener la fila de peso constante en la fórmula, cuando se copia y se pega en el intervalo de puntos de datos, se aplican signos de dólar a las referencias de celdas de fila de pesos (es decir, C19: D19). Para calcular la volatilidad, el VaR diario y el VaR del período de tenencia de la cartera aplican las mismas fórmulas utilizadas para los activos individuales. Es decir, la volatilidad diaria de la SMA para la cartera VDVD (cartera de rendimientos de la cartera) VAR diario SMA para la cartera Volatilidad diaria NORMSINV (X) y VaR de duración de la cartera VaRSQRT diario (período de tenencia). Ahora podemos responder a la pregunta: ¿Cuál es la tenencia de 10 días SMA VaR para una cartera de oro y WTI a un nivel de confianza de 99 Es 9.1976. Variance Covariance Approach 8211 Media móvil ponderada exponencialmente (EWMA) Ahora veremos cómo se calcula el VaR VCV de promedio móvil ponderado exponencialmente (EWMA). La diferencia entre los métodos SMA de EWMA y el enfoque VCV radica en el cálculo de la volatilidad subyacente de los rendimientos. Bajo SMA, la volatilidad () se determina (como se mencionó anteriormente) usando la siguiente fórmula: Sin embargo, bajo EWMA, la volatilidad de la distribución de retorno subyacente () se calcula de la siguiente manera: Mientras que el método SMA da igual importancia a los rendimientos de la serie, EWMA pone mayor énfasis en los rendimientos de fechas y períodos de tiempo más recientes como la información tiende a ser menos relevante en el tiempo. Esto se logra especificando un parámetro lambda (), donde 0lt lt1, y poniendo ponderaciones exponencialmente decrecientes en los datos históricos. Los. Value determina el peso-edad de los datos en la fórmula de modo que cuanto menor sea el valor de. Más rápido el peso decae. Si la gerencia espera que la volatilidad sea muy inestable, entonces dará mucho peso a las observaciones recientes, mientras que si espera que la volatilidad sea estable, daría pesos más iguales a las observaciones más antiguas. La Figura 9 muestra cómo los pesos utilizados para determinar la volatilidad de EWMA se calculan en EXCEL: Figura 9: Pesos utilizados en el cálculo de la volatilidad de EWMA Hay 270 resultados en nuestra serie de retorno. Hemos utilizado un lambda de 0,94, un estándar de la industria. Veamos primero la columna M en la Figura 9 anterior. El último retorno de la serie (para el 29-Jun-2012) se asigna t-10, el retorno de 28-Jun-2012 se asignará t-11 y así sucesivamente, por lo que el primer retorno en nuestra serie de tiempo 2-Jun - 2011 tiene t-1 269. El peso es un producto de dos ítem 1-lambda (columna K) y lambda elevado a la potencia de t-1 (columna L). Por ejemplo, el peso del 2-Jun-2011 (Cell N25) será Cell K25 Cell L25. Pesos escalados Como la suma de los pesos no es igual a 1, es necesario escalarlos para que su suma sea igual a la unidad. Esto se hace dividiendo los pesos calculados anteriormente por 1 - n, donde n es el número de retornos en la serie. Figura 10: Pesos escalados utilizados en el cálculo de la volatilidad EWMA EWMA Varianza EWMA La varianza es simplemente la suma a través de todos los puntos de datos de la multiplicación de retornos cuadrados y los pesos escalados. Puede ver cómo el producto de los retornos cuadrados y los pesos escalados se calcula en la barra de funciones de la figura 11 a continuación: Figura 11: Serie de retorno cuadrada ponderada utilizada para determinar la varianza EWMA Una vez que haya obtenido esta serie de pesos de cuadrados, Suma toda la serie para obtener la varianza (véase la figura 12). Figura 12: Variación de EWMA Volatilidad EWMA diaria La volatilidad diaria de EWMA para Gold, WTI amp y la cartera se obtiene tomando el cuadrado Raíz de la varianza determinada anteriormente. Esto se muestra en la barra de funciones de la Figura 13 a continuación para el oro: Figura 13: Volatilidad EWMA diaria EWMA diario VaR EWMA diario VaR Volatilidad EWMA diaria Valor z de CDF normal estándar inverso. Este es el mismo proceso utilizado para determinar el VaR diario de SMA después de obtener la volatilidad diaria de SMA. La Figura 14 muestra el cálculo del VaR diario de EWMA al nivel de confianza de 99: Figura 14: VaR Diario EWMA J-Día Holding EWMA VaR Holding EWMA VaR Diario EWMA VaR SQRT (Periodo de tenencia) que es el mismo proceso usado para determinar SMA VaR Obteniendo el VaR diario de SMA. Esto se ilustra para el VaR EWMA de retención de 10 días en la Figura 15 a continuación: Figura 15: Retención del VaR VaR de EWMA Método de simulación histórica Retornos ordenados A diferencia del enfoque VCV del VaR, no se hace ninguna suposición sobre la distribución de retorno subyacente en el enfoque de simulación histórica. VaR se basa en la distribución de retorno real que a su vez se basa en el conjunto de datos utilizados en los cálculos. El punto de partida para el cálculo del VaR para nosotros es la serie de retorno derivada anteriormente. Nuestra primera tarea es reordenar la serie en orden ascendente, desde el menor retorno hasta el mayor retorno. A cada retorno ordenado se le asigna un valor de índice. Esto se ilustra en la Figura 16 a continuación: Figura 16: Devoluciones diarias ordenadas VaR diario de simulación histórica Hay 270 retornos en la serie. En el nivel de confianza 99, el VaR diario bajo este método es igual al retorno correspondiente al número de índice calculado como sigue: (1-nivel de confianza) Número de retornos donde el resultado se redondea al entero más cercano. Este número entero representa el número de índice para un retorno dado, como se muestra en la Figura 17: Figura 17: Determinación del número de índice correspondiente al nivel de confianza El retorno correspondiente a ese número de índice es el VaR histórico de simulación histórica. Figura 18: VaR de simulación histórica diaria La función VLOOKUP busca la devolución al valor de índice correspondiente del conjunto de datos de devolución de órdenes. Tenga en cuenta que la fórmula toma el valor absoluto del resultado. Por ejemplo, en el nivel de confianza de 99, el número entero funciona a 2. Para el oro esto corresponde con el retorno de -5.5384 o 5.5384 en términos absolutos, es decir, hay una probabilidad de que el precio del oro caerá en más de 5.5384 en un Período de mantenimiento de 1 día. Retención de 10 días VaR de simulación histórica En cuanto al enfoque de VCV, el VaR de tenencia es igual al VaR diario de la raíz cuadrada del período de tenencia. Para el oro esto funciona a 5.5384SQRT (10) 17.5139. Por lo tanto, ¿cuál es la cantidad de pérdida de peor caso para el oro durante un período de tenencia de 10 días que sólo se excederá 1 día en 100 días (es decir, 99 de nivel de confianza) calculado utilizando el enfoque de simulación histórica Peor caso de pérdida de oro 99 durante un período de tenencia de 10 días Valor de mercado del oro 10 días VaR (1598.50100) 17.5139 USD 27.996. Hay una probabilidad de que el valor del oro en la cartera pierda una cantidad superior a USD 27.996 durante un período de tenencia de 10 días. La Figura 19 resume esto a continuación: Figura 19: Período de retención de VaR a 10 días a 99 niveles de confianza Temas relacionados: Modelos de media móvil y suavización exponencial Como primer paso para ir más allá de los modelos de media, aleatoria y lineal, Y las tendencias pueden extrapolarse utilizando un modelo de media móvil o de suavizado. La suposición básica detrás de los modelos de promedio y suavizado es que la serie temporal es localmente estacionaria con una media que varía lentamente. Por lo tanto, tomamos un promedio móvil (local) para estimar el valor actual de la media y luego usarlo como pronóstico para el futuro cercano. Esto puede considerarse como un compromiso entre el modelo medio y el modelo aleatorio-paseo-sin-deriva. La misma estrategia se puede utilizar para estimar y extrapolar una tendencia local. Una media móvil se denomina a menudo una versión quotomoldeada de la serie original porque el promedio de corto plazo tiene el efecto de suavizar los golpes en la serie original. Al ajustar el grado de suavizado (el ancho de la media móvil), podemos esperar encontrar algún tipo de equilibrio óptimo entre el rendimiento de la media y los modelos de caminata aleatoria. El tipo más simple de modelo de promediación es el. Promedio móvil simple (igualmente ponderado): El pronóstico para el valor de Y en el tiempo t1 que se hace en el tiempo t es igual al promedio simple de las observaciones m más recientes: (Aquí y en otro lugar usaré el símbolo 8220Y-hat8221 para permanecer Para un pronóstico de la serie de tiempo Y hecho a la fecha más temprana posible posible por un modelo dado). Este promedio se centra en el período t (m1) / 2, lo que implica que la estimación de la media local tiende a quedar rezagada detrás del Valor real de la media local de aproximadamente (m1) / 2 periodos. Por lo tanto, decimos que la edad media de los datos en el promedio móvil simple es (m1) / 2 en relación con el período para el cual se calcula el pronóstico: es la cantidad de tiempo que las previsiones tienden a rezagarse detrás de los puntos de inflexión en el datos. Por ejemplo, si está promediando los últimos 5 valores, las previsiones serán de aproximadamente 3 períodos tarde en la respuesta a los puntos de inflexión. Tenga en cuenta que si m1, el modelo de media móvil simple (SMA) es equivalente al modelo de caminata aleatoria (sin crecimiento). Si m es muy grande (comparable a la longitud del período de estimación), el modelo SMA es equivalente al modelo medio. Como con cualquier parámetro de un modelo de pronóstico, es habitual ajustar el valor de k para obtener el mejor valor de los datos, es decir, los errores de predicción más pequeños en promedio. He aquí un ejemplo de una serie que parece presentar fluctuaciones aleatorias alrededor de una media de variación lenta. En primer lugar, vamos a tratar de encajar con un modelo de caminata al azar, que es equivalente a una media móvil simple de un término: El modelo de caminata aleatoria responde muy rápidamente a los cambios en la serie, pero al hacerlo, recoge gran parte del quotnoisequot en el Los datos (las fluctuaciones aleatorias), así como el quotsignalquot (la media local). Si en lugar de eso intentamos una media móvil simple de 5 términos, obtendremos un conjunto de previsiones más suaves: El promedio móvil simple a 5 terminos produce errores significativamente menores que el modelo de caminata aleatoria en este caso. La edad promedio de los datos de esta previsión es de 3 ((51) / 2), de manera que tiende a quedar a la zaga de los puntos de inflexión en aproximadamente tres períodos. (Por ejemplo, parece haber ocurrido una recesión en el período 21, pero las previsiones no giran hasta varios periodos más tarde). Obsérvese que los pronósticos a largo plazo del modelo SMA son una línea recta horizontal, al igual que en la caminata aleatoria modelo. Por lo tanto, el modelo SMA asume que no hay tendencia en los datos. Sin embargo, mientras que las previsiones del modelo de caminata aleatoria son simplemente iguales al último valor observado, las previsiones del modelo SMA son iguales a un promedio ponderado de valores recientes. Los límites de confianza calculados por Statgraphics para los pronósticos a largo plazo de la media móvil simple no se amplían a medida que aumenta el horizonte de pronóstico. Esto obviamente no es correcto Desafortunadamente, no hay una teoría estadística subyacente que nos diga cómo los intervalos de confianza deberían ampliarse para este modelo. Sin embargo, no es demasiado difícil calcular estimaciones empíricas de los límites de confianza para las previsiones a más largo plazo. Por ejemplo, podría configurar una hoja de cálculo en la que el modelo SMA se utilizaría para pronosticar dos pasos adelante, tres pasos adelante, etc. dentro de la muestra de datos históricos. A continuación, podría calcular las desviaciones estándar de los errores en cada horizonte de pronóstico y, a continuación, construir intervalos de confianza para pronósticos a más largo plazo sumando y restando múltiplos de la desviación estándar apropiada. Si intentamos una media móvil sencilla de 9 términos, obtendremos pronósticos aún más suaves y más de un efecto rezagado: La edad promedio es ahora de 5 períodos ((91) / 2). Si tomamos una media móvil de 19 términos, la edad promedio aumenta a 10: Obsérvese que, de hecho, las previsiones están ahora rezagadas detrás de los puntos de inflexión en aproximadamente 10 períodos. Qué cantidad de suavizado es la mejor para esta serie Aquí hay una tabla que compara sus estadísticas de error, incluyendo también un promedio de 3 términos: El modelo C, la media móvil de 5 términos, produce el valor más bajo de RMSE por un pequeño margen sobre los 3 A término y 9 promedios, y sus otras estadísticas son casi idénticas. Por lo tanto, entre los modelos con estadísticas de error muy similares, podemos elegir si preferiríamos un poco más de capacidad de respuesta o un poco más de suavidad en las previsiones. El modelo de media móvil simple descrito anteriormente tiene la propiedad indeseable de que trata las últimas k observaciones por igual e ignora por completo todas las observaciones precedentes. (Volver al principio de la página.) Browns Simple Exponential Smoothing Intuitivamente, los datos pasados ​​deben ser descontados de una manera más gradual - por ejemplo, la observación más reciente debería tener un poco más de peso que la segunda más reciente, y la segunda más reciente debería tener un poco más de peso que la tercera más reciente, y pronto. El modelo de suavizado exponencial simple (SES) lo logra. Sea 945 una constante quotsmoothingquot (un número entre 0 y 1). Una forma de escribir el modelo es definir una serie L que represente el nivel actual (es decir, el valor medio local) de la serie, tal como se estimó a partir de los datos hasta el presente. El valor de L en el tiempo t se calcula recursivamente a partir de su propio valor anterior como este: Así, el valor suavizado actual es una interpolación entre el valor suavizado anterior y la observación actual, donde 945 controla la proximidad del valor interpolado al valor más reciente observación. El pronóstico para el siguiente período es simplemente el valor suavizado actual: Equivalentemente, podemos expresar el próximo pronóstico directamente en términos de previsiones anteriores y observaciones previas, en cualquiera de las siguientes versiones equivalentes. En la primera versión, la previsión es una interpolación entre la previsión anterior y la observación anterior: En la segunda versión, la siguiente previsión se obtiene ajustando la previsión anterior en la dirección del error anterior por una cantidad fraccionada de 945. es el error hecho en Tiempo t En la tercera versión, el pronóstico es una media móvil exponencialmente ponderada (es decir, descontada) con factor de descuento 1-945: La versión de interpolación de la fórmula de pronóstico es la más simple de usar si está implementando el modelo en una hoja de cálculo: se ajusta en un Célula única y contiene referencias de celdas que apuntan a la previsión anterior, la observación anterior y la celda donde se almacena el valor de 945. Tenga en cuenta que si 945 1, el modelo SES es equivalente a un modelo de caminata aleatoria (sin crecimiento). Si 945 0, el modelo SES es equivalente al modelo medio, asumiendo que el primer valor suavizado se establece igual a la media. La edad promedio de los datos en el pronóstico de suavización exponencial simple es de 1/945 en relación con el período para el cual se calcula la predicción. (Esto no se supone que sea obvio, pero se puede demostrar fácilmente mediante la evaluación de una serie infinita.) Por lo tanto, el pronóstico promedio móvil simple tiende a quedar rezagado detrás de puntos de inflexión en aproximadamente 1/945 períodos. Por ejemplo, cuando 945 0.5 el retraso es 2 períodos cuando 945 0.2 el retraso es 5 períodos cuando 945 0.1 el retraso es 10 períodos, y así sucesivamente. Para una edad media dada (es decir, la cantidad de retraso), el simple suavizado exponencial (SES) pronosticado es algo superior al pronóstico de la media móvil simple (SMA) porque coloca relativamente más peso en la observación más reciente - i. e. Es un poco más sensible a los cambios ocurridos en el pasado reciente. Por ejemplo, un modelo SMA con 9 términos y un modelo SES con 945 0.2 tienen una edad promedio de 5 para los datos de sus pronósticos, pero el modelo SES pone más peso en los 3 últimos valores que el modelo SMA y en el modelo SMA. Otra ventaja importante del modelo SES sobre el modelo SMA es que el modelo SES utiliza un parámetro de suavizado que es variable continuamente, por lo que puede optimizarse fácilmente Utilizando un algoritmo quotsolverquot para minimizar el error cuadrático medio. El valor óptimo de 945 en el modelo SES para esta serie resulta ser 0.2961, como se muestra aquí: La edad promedio de los datos de esta previsión es de 1 / 0.2961 3.4 períodos, que es similar a la de un 6-término de movimiento simple promedio. Los pronósticos a largo plazo del modelo SES son una línea recta horizontal. Como en el modelo SMA y el modelo de caminata aleatoria sin crecimiento. Sin embargo, tenga en cuenta que los intervalos de confianza calculados por Statgraphics ahora divergen de manera razonable y que son sustancialmente más estrechos que los intervalos de confianza para el modelo de caminata aleatoria. El modelo SES asume que la serie es algo más predecible que el modelo de caminata aleatoria. Un modelo SES es en realidad un caso especial de un modelo ARIMA. Por lo que la teoría estadística de los modelos ARIMA proporciona una base sólida para el cálculo de los intervalos de confianza para el modelo SES. En particular, un modelo SES es un modelo ARIMA con una diferencia no estacional, un término MA (1) y ningún término constante. Conocido también como modelo quotARIMA (0,1,1) sin constantequot. El coeficiente MA (1) en el modelo ARIMA corresponde a la cantidad 1-945 en el modelo SES. Por ejemplo, si se ajusta un modelo ARIMA (0,1,1) sin constante a la serie analizada aquí, el coeficiente MA estimado (1) resulta ser 0.7029, que es casi exactamente un menos 0.2961. Es posible añadir la suposición de una tendencia lineal constante no nula a un modelo SES. Para ello, basta con especificar un modelo ARIMA con una diferencia no estacional y un término MA (1) con una constante, es decir, un modelo ARIMA (0,1,1) con constante. Las previsiones a largo plazo tendrán entonces una tendencia que es igual a la tendencia media observada durante todo el período de estimación. No puede hacerlo junto con el ajuste estacional, ya que las opciones de ajuste estacional están deshabilitadas cuando el tipo de modelo está ajustado a ARIMA. Sin embargo, puede agregar una tendencia exponencial a largo plazo constante a un modelo de suavización exponencial simple (con o sin ajuste estacional) utilizando la opción de ajuste de inflación en el procedimiento de previsión. La tasa apropiada de inflación (crecimiento porcentual) por período puede estimarse como el coeficiente de pendiente en un modelo de tendencia lineal ajustado a los datos en conjunción con una transformación de logaritmo natural o puede basarse en otra información independiente sobre las perspectivas de crecimiento a largo plazo . (Regreso al inicio de la página.) Browns Linear (es decir, doble) Suavizado exponencial Los modelos SMA y SES suponen que no hay ninguna tendencia de ningún tipo en los datos (que normalmente está bien o al menos no es demasiado malo para 1- Avance anticipado cuando los datos son relativamente ruidosos), y se pueden modificar para incorporar una tendencia lineal constante como se muestra arriba. ¿Qué pasa con las tendencias a corto plazo? Si una serie muestra una tasa de crecimiento variable o un patrón cíclico que se destaca claramente contra el ruido, y si hay una necesidad de pronosticar más de un período, la estimación de una tendencia local también podría ser un problema. El modelo de suavizado exponencial simple puede ser generalizado para obtener un modelo lineal de suavizado exponencial (LES) que calcula las estimaciones locales de nivel y tendencia. El modelo de tendencia más simple que varía en función del tiempo es el modelo lineal de suavizado exponencial de Browns, que utiliza dos series suavizadas diferentes centradas en diferentes momentos del tiempo. La fórmula de predicción se basa en una extrapolación de una línea a través de los dos centros. (Una versión más sofisticada de este modelo, Holt8217s, se discute a continuación). La forma algebraica del modelo de suavizado exponencial lineal de Brown8217s, como la del modelo de suavizado exponencial simple, puede expresarse en un número de formas diferentes pero equivalentes. La forma estándar de este modelo se expresa usualmente de la siguiente manera: Sea S la serie de suavizado simple obtenida aplicando el suavizado exponencial simple a la serie Y. Es decir, el valor de S en el periodo t está dado por: (Recuérdese que, Exponencial, esto sería la previsión para Y en el período t1). Entonces, vamos a Squot denotar la serie doblemente suavizada obtenida aplicando el suavizado exponencial simple (usando el mismo 945) a la serie S: Finalmente, la previsión para Y tk. Para cualquier kgt1, viene dado por: Esto produce e 1 0 (es decir, trucar un poco y dejar que el primer pronóstico sea igual a la primera observación real), y e 2 Y 2 8211 Y 1. Después de lo cual las previsiones se generan usando la ecuación anterior. Esto produce los mismos valores ajustados que la fórmula basada en S y S si estos últimos se iniciaron usando S 1 S 1 Y 1. Esta versión del modelo se utiliza en la página siguiente que ilustra una combinación de suavizado exponencial con ajuste estacional. Holt8217s Linear Exponential Smoothing Brown8217s El modelo LES calcula las estimaciones locales de nivel y tendencia al suavizar los datos recientes, pero el hecho de que lo haga con un solo parámetro de suavizado impone una restricción en los patrones de datos que puede encajar: el nivel y la tendencia No se les permite variar a tasas independientes. El modelo LES de Holt8217s aborda esta cuestión incluyendo dos constantes de suavizado, una para el nivel y otra para la tendencia. En cualquier momento t, como en el modelo Brown8217s, existe una estimación L t del nivel local y una estimación T t de la tendencia local. Aquí se calculan recursivamente a partir del valor de Y observado en el instante t y de las estimaciones previas del nivel y de la tendencia por dos ecuaciones que les aplican el suavizado exponencial separadamente. Si el nivel estimado y la tendencia en el tiempo t-1 son L t82091 y T t-1. Respectivamente, entonces la previsión de Y tshy que habría sido hecha en el tiempo t-1 es igual a L t-1 T t-1. Cuando se observa el valor real, la estimación actualizada del nivel se calcula recursivamente interpolando entre Y tshy y su pronóstico, L t-1 T t-1, utilizando pesos de 945 y 1-945. El cambio en el nivel estimado, Es decir L t 8209 L t82091. Puede interpretarse como una medición ruidosa de la tendencia en el tiempo t. La estimación actualizada de la tendencia se calcula recursivamente mediante la interpolación entre L t 8209 L t82091 y la estimación anterior de la tendencia, T t-1. Utilizando los pesos de 946 y 1-946: La interpretación de la constante de suavizado de tendencia 946 es análoga a la de la constante de suavizado de nivel 945. Los modelos con valores pequeños de 946 asumen que la tendencia cambia muy lentamente con el tiempo, mientras que los modelos con 946 más grandes suponen que está cambiando más rápidamente. Un modelo con una gran 946 cree que el futuro lejano es muy incierto, porque los errores en la estimación de la tendencia son muy importantes cuando se pronostica más de un período por delante. Las constantes de suavizado 945 y 946 se pueden estimar de la manera habitual minimizando el error cuadrático medio de los pronósticos de 1 paso adelante. Cuando esto se hace en Statgraphics, las estimaciones resultan ser 945 0,3048 y 946 0,008. El valor muy pequeño de 946 significa que el modelo supone muy poco cambio en la tendencia de un período al siguiente, por lo que básicamente este modelo está tratando de estimar una tendencia a largo plazo. Por analogía con la noción de la edad media de los datos que se utilizan para estimar el nivel local de la serie, la edad media de los datos que se utilizan para estimar la tendencia local es proporcional a 1/946, aunque no exactamente igual a eso. En este caso, resulta ser 1 / 0.006 125. Esto no es un número muy preciso en la medida en que la precisión de la estimación de 946 es realmente de 3 decimales, pero es del mismo orden general de magnitud que el tamaño de la muestra de 100 , Por lo que este modelo está promediando bastante historia en la estimación de la tendencia. La gráfica de pronóstico siguiente muestra que el modelo LES calcula una tendencia local ligeramente mayor al final de la serie que la tendencia constante estimada en el modelo SEStrend. Además, el valor estimado de 945 es casi idéntico al obtenido ajustando el modelo SES con o sin tendencia, por lo que este es casi el mismo modelo. Ahora, ¿se ven como pronósticos razonables para un modelo que se supone que está estimando una tendencia local? Si observas esta gráfica, parece que la tendencia local se ha vuelto hacia abajo al final de la serie. Lo que ha sucedido Los parámetros de este modelo Se han estimado minimizando el error al cuadrado de las previsiones de un paso adelante, y no las previsiones a largo plazo, en cuyo caso la tendencia no hace mucha diferencia. Si todo lo que usted está mirando son errores de un paso adelante, no está viendo la imagen más grande de las tendencias sobre (digamos) 10 o 20 períodos. Con el fin de obtener este modelo más en sintonía con la extrapolación de nuestro ojo de los datos, podemos ajustar manualmente la tendencia de suavizado constante de modo que utiliza una base más corta para la estimación de tendencia. Por ejemplo, si elegimos establecer 946 0.1, la edad promedio de los datos utilizados para estimar la tendencia local es de 10 períodos, lo que significa que estamos promediando la tendencia en los últimos 20 períodos aproximadamente. Here8217s lo que el pronóstico gráfico parece si fijamos 946 0.1 mientras que mantener 945 0.3. Esto parece intuitivamente razonable para esta serie, aunque probablemente sea peligroso extrapolar esta tendencia en más de 10 periodos en el futuro. ¿Qué pasa con las estadísticas de errores? Aquí hay una comparación de modelos para los dos modelos mostrados arriba, así como tres modelos SES. El valor óptimo de 945 para el modelo SES es de aproximadamente 0,3, pero se obtienen resultados similares (con un poco más o menos de capacidad de respuesta, respectivamente) con 0,5 y 0,2. (A) Holts lineal exp. Alisamiento con alfa 0.3048 y beta 0.008 (B) Holts linear exp. Alisamiento con alfa 0.3 y beta 0.1 (C) Suavizado exponencial simple con alfa 0.5 (D) Alisamiento exponencial simple con alfa 0.3 (E) Suavizado exponencial simple con alfa 0.2 Sus estadísticas son casi idénticas, por lo que realmente no podemos hacer la elección sobre la base De errores de pronóstico de un paso adelante en la muestra de datos. Tenemos que recurrir a otras consideraciones. Si creemos firmemente que tiene sentido basar la estimación de tendencia actual en lo que ha ocurrido durante los últimos 20 períodos, podemos hacer un caso para el modelo LES con 945 0.3 y 946 0.1. Si queremos ser agnósticos acerca de si hay una tendencia local, entonces uno de los modelos SES podría ser más fácil de explicar y también daría más pronósticos intermedios para los próximos 5 o 10 períodos. (Volver al principio de la página.) Qué tipo de tendencia-extrapolación es la mejor: horizontal o lineal La evidencia empírica sugiere que, si los datos ya han sido ajustados (si es necesario) para la inflación, puede ser imprudente extrapolar lineal a corto plazo Tendencias en el futuro. Las tendencias evidentes hoy en día pueden desacelerarse en el futuro debido a diversas causas, como la obsolescencia de los productos, el aumento de la competencia y las caídas o repuntes cíclicos en una industria. Por esta razón, el suavizado exponencial simple a menudo realiza mejor fuera de la muestra de lo que de otra manera podría esperarse, a pesar de su extrapolación horizontal de tendencia horizontal. Las modificaciones de la tendencia amortiguada del modelo de suavizado exponencial lineal también se usan a menudo en la práctica para introducir una nota de conservadurismo en sus proyecciones de tendencia. El modelo LES con tendencia amortiguada se puede implementar como un caso especial de un modelo ARIMA, en particular, un modelo ARIMA (1,1,2). Es posible calcular intervalos de confianza en torno a los pronósticos a largo plazo producidos por modelos de suavizado exponencial, al considerarlos como casos especiales de modelos ARIMA. El ancho de los intervalos de confianza depende de (i) el error RMS del modelo, (ii) el tipo de suavizado (simple o lineal) (iii) el valor (S) de la (s) constante (s) de suavizado y (iv) el número de periodos por delante que está pronosticando. En general, los intervalos se extienden más rápido a medida que 945 se hace más grande en el modelo SES y se extienden mucho más rápido cuando se usa lineal en lugar de simple suavizado. Este tema se discute más adelante en la sección de modelos de ARIMA de las notas. (Volver al inicio de la página.)

No comments:

Post a Comment