Pronosticar la próxima década en el mercado de valores utilizando modelos de series temporales (2023)

[Este artículo fue publicado por primera vez elInversión basada en datos, y amablemente contribuyó aR-bloggers]. (Puede informar problemas sobre el contenido de esta páginaaquí)

¿Quieres compartir tu contenido en R-bloggers?haga clic aquísi tienes un blog, oaquísi no lo haces

Esta publicación presentará una forma de pronosticar los rendimientos del índice bursátil en el mercado estadounidense. Por lo general, se han utilizado medidas únicas como CAPE para hacer esto, pero carecen de precisión en comparación con el uso de muchas variables y también pueden tener diferentes relaciones con los rendimientos en diferentes mercados. Además, es posible entrenar diferentes tipos de modelos y combinarlos para aumentar aún más la precisión, como se hace en este post.

Usaremos una variedad de modelos de series de tiempo, con el objetivo de pronosticar rendimientos futuros para el S&P 500.La variable a pronosticar es la rentabilidad futura anual a diez años, y todos los modelos utilizados excepto el ETS son dinámicos, es decir, también utilizan algunos regresores como los múltiplos de valoración, que en su mayoría son los mismos que enestecorreo. También usaremos las mismas fuentes de datos que en la publicación mencionada, que recomiendo mucho antes de leer esta.

La forma en que se construirán los modelos es que la muestra, que consta de observaciones entre los años 1948 y 2010, se dividirá usando una división 65/35 en conjuntos de entrenamiento y prueba. Estos valores se eligieron para garantizar que el conjunto de prueba tenga valores bajos y altos de los rendimientos futuros de diez años para que el modelo pueda evaluarse adecuadamente. Se podría haber utilizado la validación cruzada de series de tiempo para obtener métricas de precisión más precisas, pero para nuestro propósito, una simple división de entrenamiento/prueba es lo suficientemente buena.

Debido al valor a pronosticar que representa elfuturorendimientos de diez años, tenemos que dividir aún más el conjunto de prueba, separando los primeros diez años del resto. Esto se hace para evitar la fuga de datos o, más exactamente, el sesgo de anticipación. Esto se debe a que no podemos pronosticar rendimientos futuros a diez años utilizando los rendimientos futuros a diez años del mes pasado debido a que no los conocemos en el momento de la previsión, pero podemos pronosticarlos utilizando los rendimientos futuros a diez años de hace diez años, que corresponden a los rendimientos de los últimos diez años. En los gráficos, la línea vertical gris se usa para separar el conjunto de prueba del conjunto de entrenamiento, y la línea vertical roja se usa para separar el conjunto de prueba sin sesgo de anticipación,que es también el conjunto con el que se calculan las medidas de precisión.

Usaremos cinco modelos diferentes más un modelo combinado, que es el promedio de estos modelos. Además, también incluiremos un modelo ETS que no está incluido en el modelo combinado, solo para ver cómo usando el retorno de los últimos diez años como punto de referencia,que es algo que la gente hace, Puede ser peligroso. También se incluye para mostrar que no hay patrones claros en los datos, como estacionalidades o tendencias que se puedan usar para hacer los pronósticos. Algunos de los modelos son bastante complicados, por lo que no entraremos en demasiados detalles en esta publicación, pero todos operan con la misma idea de que la información sobre los valores futuros de la variable a pronosticar existe en los regresores, pero también en el valores pasados ​​de dicha variable.

Ajustemos los modelos y veamos los resultados:

(Video) Predicción de Series Temporales

Haga clic para ampliar las imágenes

Pronosticar la próxima década en el mercado de valores utilizando modelos de series temporales (1)


El modelo Prophet de Facebook, el nnetar basado en redes neuronales y el TSLM que tiene en cuenta solo los regresores y la estacionalidad y la tendencia, parecen ser los modelos más inexactos si excluimos el modelo ETS. El modelo nnetar tiene los intervalos de predicción más estrechos que, sin embargo, son bastante inexactos, quizás debido al hecho de que los modelos de redes neuronales suelen requerir muchos más datos. Por el contrario, los modelos Vector Autoregression y ARIMA parecen ser bastante precisos pero tienen intervalos de predicción realistas. De estos dos, el modelo Vector Autoregression parece tener más confianza en sus predicciones, probablemente porque el modelo es más complicado que ARIMA. Tenga en cuenta que el pronóstico de combinación aún no se ha trazado junto con los otros modelos.

El modelo ETS muestra que la previsión basada en el rendimiento de los últimos diez años habría sido terriblemente incorrecta. El pronóstico se hizo cuando el rendimiento de diez años estaba casi en su punto más alto, sin embargo, el primer rendimiento real de diez años estuvo muy cerca de su punto más bajo de todos los tiempos. El uso del rendimiento promedio de diez años en lugar del más reciente habría resultado en pronósticos más precisos debido a la reversión a la media en el rendimiento de diez años.

Luego, echemos un vistazo a las medidas de precisión de todos los modelos en el conjunto de prueba no sesgado, ordenados de mayor a menor precisión en función del error absoluto medio:

Modelo A MÍ RMSE MAE MPE MAPA MASA R-cuadrado
Combinación -0.0033158 0.0183 0.0129 -0.3281969 1.24 0.679 0.896
ARIMA 0.0114286 0.0363 0.0176 0.9895734 1.6 0.926 0.739
ERA 0.0009312 0.0282 0.0234 0.0740454 2.23 1.23 0.768
nnetar 0.0241653 0.0417 0.0389 2.1628762 3.64 2.05 0.744
Profeta -0.0380064 0.0474 0.0417 -3.5044745 3.87 2.19 0.661
TSLM -0.0150980 0.0609 0.0443 -1.3630049 4.17 2.33 0.458
ETS -0.1346834 0.142 0.135 -12.9110549 12.9 7.09 ESO


El pronóstico combinado fue el más preciso, lo que no es sorprendente considerando que algunos de los modelos estaban sesgados hacia arriba y otros hacia abajo de los valores reales. La magnitud y la dirección del sesgo se pueden ver en el error medio. El MAE nos dice directamente cuántos puntos porcentuales se desvió el pronóstico en promedio. Entonces, si el rendimiento real de diez años hubiera sido del diez por ciento, el pronóstico habría sido en promedio solo 1.29 puntos porcentuales, que es casi el doble de la precisión alcanzada por un modelo de conjunto de aprendizaje automático que se introdujo enla publicación anterior.El pronóstico combinado también tiene menos valores atípicos, como lo demuestra el RMSE considerablemente más bajo en comparación con otros modelos. También tiene una correlación mucho más alta con los valores reales, como lo muestra el R-cuadrado.

(Video) PROYECCIÓN DE TENDENCIA📈(SERIES DE TIEMPO🕑)|EJERCICIO RESUELTO

Sería posible aumentar aún más la precisión del modelo de combinación combinándolo con modelos de aprendizaje automático puro como XGBoost, que se probaron en la publicación mencionada anteriormente. Otra forma sería no incluir todos los modelos, sino alguna combinación de ellos, como los que tienen las mayores precisiones y sesgos opuestos. Sin embargo, esto requeriría una mayor división de los datos y está más allá del alcance de esta publicación.

Por último, pronosticaremos los rendimientos futuros usando todos los modelos, pero solo representaremos los resultados del modelo combinado. Los modelos ahora se entrenarán con los datos completos (conjuntos de entrenamiento + prueba) para que podamos obtener resultados tan precisos como sea posible.Dado que los datos no están completos para todos los predictores de los últimos meses, también tendremos que completar los valores más recientes usando datos de multpl y FRED, e imputar los valores faltantes entre medio usando la imputación spline. Los resultados son los siguientes:

Pronosticar la próxima década en el mercado de valores utilizando modelos de series temporales (2)


La parte ampliada incluye el conjunto de prueba sin sesgo entrenado solo en el conjunto de entrenamiento y los pronósticos futuros en azul. Durante los últimos años, la rentabilidad esperada según el modelo ha aumentado del cinco por ciento a más del ocho por ciento. La parte que nos interesa especialmente es la última previsión, que es la previsión para los próximos diez años a partir de este momento. Estas previsiones para los diferentes modelos se muestran en la siguiente tabla, ordenadas de menor a mayor:

Modelo Pronóstico CAGR de 10 años
ERA 2,41%
Profeta 7,08%
nnetar 7,68%
Combinación 8,35%
TSLM 10,75%
ETS 13,50%
ARIMA 13,82%


El modelo Vector Autoregression hace el pronóstico más bajo, mientras que el modelo ARIMA tiene el pronóstico más alto. Esto es especialmente interesante ya que estos fueron los dos modelos más precisos basados ​​en el conjunto de prueba, sin embargo, hacen pronósticos muy diferentes. El pronóstico combinado está aproximadamente tres puntos porcentuales por debajo del rendimiento histórico del S&P 500, que no es tan malo considerando todo.

Es importante tener en cuenta que los pronósticos futuros probablemente serán menos precisos debido a que algunos de los predictores, como la tasa de desempleo y las tasas de interés, se encuentran fuera de sus rangos históricos. Esta incertidumbre también es visible en los intervalos de predicción del modelo individual que no se representan aquí. Sin embargo, en comparación con los modelos de aprendizaje automático puro que sufren el mismo problema, los modelos de series temporales probablemente sean más precisos y más resistentes a este tipo de cambios estructurales.



Si te ha gustado este post, no olvides seguirme enGorjeopara actualizaciones sobre nuevas publicaciones de blog como esta!

El código R utilizado en el análisis se puede encontraraquí, junto con el código para los modelos de aprendizaje automático de la publicación anterior.

(Video) Predicción de series temporales con machine learning

Los predictores PE y TR_CAPE han sido excluidos de todos los demás modelos excepto ARIMA ya que parecía reaccionar a la multicolinealidad causada por ellos mejor que los otros modelos. Se usaron todos los demás predictores como en la última publicación.

Dado que nnetar y Prophet realizan pronósticos de distribución diferentes al resto de los modelos, no podemos calcular los intervalos de predicción tan fácilmente para el modelo combinado, por lo que se han dejado fuera del gráfico con el pronóstico combinado.


(Video) Tema 5. Series temporales

Relacionado

ADeja un comentariopara el autor, siga el enlace y comente en su blog:Inversión basada en datos.

R-bloggers.comofertasactualizaciones diarias por correo electrónicoacerca deRnoticias y tutoriales sobreaprendiendo ry muchos otros temas.Haga clic aquí si está buscando publicar o encontrar un trabajo de R/ciencia de datos.

¿Quieres compartir tu contenido en R-bloggers?haga clic aquísi tienes un blog, oaquísi no lo haces

FAQs

¿Qué es un modelo de pronósticos de series de tiempo? ›

Los pronósticos son un método que se utiliza ampliamente en el análisis de las series de tiempo para predecir una variable de respuesta, como ganancias mensuales, comportamiento de acciones o cifras de desempleo, para un período de tiempo determinado. Los pronósticos se basan en patrones de datos existentes.

¿Qué es la previsión de series temporales en el mercado de valores? ›

Los modelos de pronóstico de series de tiempo son los modelos que son capaces de predecir valores futuros basados ​​en valores observados previamente . El pronóstico de series de tiempo se usa ampliamente para datos no estacionarios.

¿Cuándo es conveniente usar series de tiempo para proyecciones? ›

Típicamente los pronósticos de series de tiempo se usan para estimar demanda y así determinar niveles óptimos de inventario, producción, precio, entre otros.

¿Qué es el análisis de series temporales? ›

El análisis de series temporales es una técnica estadística que se ocupa de los datos de series temporales y el análisis de tendencias. Los datos de series temporales siguen intervalos de tiempo periódicos que se midieron en intervalos de tiempo regulares o se recopilaron en intervalos de tiempo particulares.

¿Por qué pronosticar series de tiempo? ›

La previsión de series temporales se produce cuando realiza predicciones científicas basadas en datos históricos con marca de tiempo. Implica construir modelos a través del análisis histórico y usarlos para hacer observaciones e impulsar la toma de decisiones estratégicas futuras .

¿Cuántos tipos de series temporales hay? ›

Los datos de series temporales se pueden clasificar en dos tipos : Medidas recopiladas en intervalos de tiempo regulares (métricas) Medidas recopiladas en intervalos de tiempo irregulares (eventos)

¿Cómo se predicen las tendencias del mercado de valores? ›

Si estudia los precios durante un largo período de tiempo, podrá ver los tres tipos de tendencias en el mismo gráfico. Observe la pendiente: la pendiente de una tendencia indica cuánto debe moverse el precio cada día . Las líneas empinadas, que se mueven hacia arriba o hacia abajo, indican una determinada tendencia.

¿Qué es una serie temporal en economía? ›

Periodo de tiempo durante el cual el inversor está dispuesto a mantener invertido su capital, sin que se prevea necesitarlo para otros fines.

¿Cuáles son las 4 variables de pronóstico? ›

Si bien existe una amplia gama de herramientas de pronóstico de presupuesto cuantitativas de uso frecuente, en este artículo nos enfocamos en cuatro métodos principales: (1) línea recta, (2) promedio móvil, (3) regresión lineal simple y (4) regresión lineal múltiple .

¿Cuáles son los 4 métodos para el análisis de series de tiempo? ›

Las cuatro variaciones de las series temporales son (1) Variaciones estacionales (2) Variaciones de tendencia (3) Variaciones cíclicas y (4) Variaciones aleatorias . El análisis de series temporales se usa para determinar un buen modelo que se puede usar para pronosticar métricas comerciales, como el precio del mercado de valores, las ventas, la facturación y más.

¿Cuáles son los metodos para estimar la tendencia? ›

Entre los métodos que permiten determinar la tendencia se pueden citar: - Método de los puntos medios. - Método de las medias móviles. - Método analítico de los mínimos cuadrados.

¿Cuál de los siguientes se utiliza para la predicción de tendencias? ›

El análisis de tendencias trata de predecir una tendencia, como un mercado alcista, y seguir esa tendencia hasta que los datos sugieran un cambio de tendencia, como un mercado alcista a bajista.

¿Cómo saber si el mercado subirá o bajará? ›

La fórmula se muestra arriba ( P/E x EPS = Precio ). De acuerdo con esta fórmula, si podemos predecir con precisión el P/E y el EPS futuros de una acción, sabremos su precio futuro exacto. Usamos esta fórmula día tras día para calcular las razones financieras de las acciones. Pero en lugar del precio futuro, lo usamos para el precio actual.

¿Es posible predecir el mercado de valores utilizando el aprendizaje automático? ›

El aprendizaje automático (ML) está desempeñando un papel cada vez más importante en el comercio de acciones. Predecir las fluctuaciones del mercado, estudiar el comportamiento del consumidor y analizar la dinámica del precio de las acciones son ejemplos de cómo las empresas de inversión pueden utilizar el aprendizaje automático para el comercio de acciones .

¿Cómo se utilizan las series de tiempo en economía? ›

Una serie temporal es una colección de observaciones de elementos de datos bien definidos obtenidos a través de mediciones repetidas a lo largo del tiempo. Por ejemplo, medir el valor de las ventas minoristas cada mes del año comprendería una serie de tiempo .

¿Cómo se clasifican los modelos de pronóstico? ›

Los métodos de elaboración de pronósticos se clasifican como cuantitativos o cualitativos. – es razonable suponer que el patrón del pasado seguirá ocurriendo en el futuro. En estos casos puede elaborarse un pronóstico con un método de series de tiempo o un método causal.

¿Cómo saber cuál es el mejor método de pronóstico? ›

Cómo elegir el método de pronóstico adecuado
  1. El contexto del pronóstico.
  2. La relevancia y disponibilidad de datos históricos.
  3. El grado de exactitud deseado.
  4. El periodo de tiempo que se va a pronosticar.
  5. El análisis de costo-beneficio del pronóstico.
  6. El punto del ciclo de vida en que se encuentra el producto.

¿Cuál es el factor pronóstico más importante? ›

El factor pronóstico más importante en todos los cánceres humanos es la etapa de presentación , que es la extensión anatómica de la enfermedad.

¿Los datos del mercado de valores son datos de series temporales? ›

Los ejemplos comunes de datos de series de tiempo en nuestra vida cotidiana incluyen: Medición de temperaturas climáticas. Medición del número de viajes en taxi por mes. Predecir los precios de las acciones de una empresa para el día siguiente.

¿Qué es una serie de tiempo y cuáles son sus elementos principales? ›

Una serie tiempo es una secuencia de observaciones, medidos en determinados momentos del tiempo, ordenados cronológicamente y, espaciados entre sí de manera uniforme, así los datos usualmente son dependientes entre sí. El principal objetivo de una serie de tiempo , donde es su análisis para hacer pronóstico.

¿Cuáles son los 4 componentes de las series de tiempo? ›

Estas cuatro componentes son: Tendencia secular, variación estacional, variación cíclica y variación irregular.

¿Qué indicadores de la calidad de un pronóstico de series de tiempo apunta a medir la dispersión? ›

Estándar (σ) son indicadores de calidad que apuntan a medir la dispersión.

¿Qué papel juega el análisis de series temporales en el mercado actual de ciencia de datos con respecto a las demás técnicas? ›

Entre las principales ventajas, cabe destacar que las Series Temporales permiten un análisis bastante amplio de datos cuantitativos acumulados a lo largo de un determinado periodo de tiempo, además de hacer pronósticos muy útiles que permiten una mejor planificación de las ventas e incorporar mejoras en el plan de ...

Videos

1. Análisis multivariado de series de tiempo con python
(David Zambrano)
2. Pronóstico en Series de Tiempo. Ejemplo práctico.
(Victor A.Rico)
3. Pronóstico de Series de Tiempo con #Python
(Naren Castellon)
4. Cómo generar múltiples pronósticos series temporales con r
(BETAMETRICA)
5. Series Temporales en Python
(TIC UTMACH)
6. ¿Huir si recortan dividendo? con Loco del Dividendo y Gregorio Hernández Jímenez
(Rompiendo el Mercado | Podcast)
Top Articles
Latest Posts
Article information

Author: Ms. Lucile Johns

Last Updated: 06/15/2023

Views: 5267

Rating: 4 / 5 (61 voted)

Reviews: 84% of readers found this page helpful

Author information

Name: Ms. Lucile Johns

Birthday: 1999-11-16

Address: Suite 237 56046 Walsh Coves, West Enid, VT 46557

Phone: +59115435987187

Job: Education Supervisor

Hobby: Genealogy, Stone skipping, Skydiving, Nordic skating, Couponing, Coloring, Gardening

Introduction: My name is Ms. Lucile Johns, I am a successful, friendly, friendly, homely, adventurous, handsome, delightful person who loves writing and wants to share my knowledge and understanding with you.