El desvío de supervivientes es uno de los problemas más comunes que enfrentan los inversores, y muchos saben de su existencia, pero pocos toman en cuenta sus efectos. En la revisión, tendemos a usar solo las empresas existentes, lo que significa que eliminamos los efectos de las empresas que se retiraron por quiebra, reestructuración o salida al mercado.
Cuando se ajustan los datos históricos, se eliminan periódicamente algunas acciones que se han declarado insolventes, retiradas del mercado o que no han tenido un buen desempeño. Y estas acciones eliminadas no aparecen en el grupo de acciones de su estrategia, es decir, cuando se revisa el pasado, se utiliza solo la información de las acciones componentes actuales, eliminando el impacto de aquellas acciones de las acciones componentes que se eliminan en el futuro debido a un mal desempeño o un mal desempeño de las acciones. La siguiente gráfica muestra el peso de las acciones componentes del índice europeo de MSCI como un portafolio en el pasado. La línea azul es la correcta y la línea roja es la combinación de resultados de los sobrevivientes.
Figura 1
El desvío de supervivientes es uno de los problemas más comunes que enfrentan los inversores, y muchos saben de su existencia, pero pocos toman en cuenta sus efectos. En la revisión, tendemos a usar solo las empresas existentes, lo que significa que eliminamos los efectos de las empresas que se retiraron por quiebra, reestructuración o salida al mercado.
Cuando se ajustan los datos históricos, se eliminan periódicamente algunas acciones que se han declarado insolventes, retiradas del mercado o que no han tenido un buen desempeño. Y estas acciones eliminadas no aparecen en el grupo de acciones de su estrategia, es decir, cuando se revisa el pasado, se utiliza solo la información de las acciones componentes actuales, eliminando el impacto de aquellas acciones de las acciones componentes que se eliminan en el futuro debido a un mal desempeño o un mal desempeño de las acciones. La siguiente gráfica muestra el peso de las acciones componentes del índice europeo de MSCI como un portafolio en el pasado. La línea azul es la correcta y la línea roja es la combinación de resultados de los sobrevivientes.
Figura 2
Es decir, cuando revisamos las compañías que han tenido el mejor desempeño en los últimos 30 años, incluso si algunas compañías tenían un alto riesgo de crédito en ese momento, cuando se sabe quién sobrevivirá, se compra cuando el riesgo de crédito es alto o cuando se encuentra en problemas, y se obtiene un rendimiento muy alto. Cuando se consideran las acciones que se declaran en quiebra, que salen del mercado o que no funcionan bien, se llega a la conclusión opuesta: los rendimientos a largo plazo de las empresas con alto riesgo de crédito son mucho más bajos que los de las empresas con buen crédito.
Hay muchos otros factores que dan el resultado opuesto cuando se considera la desviación de los sobrevivientes.
Figura 3
Figura 4
La desviación de los supervivientes, que es una de las siete culpas de la desviación de los supervivientes, es la imposibilidad de predecir qué compañías sobrevivirían en el tiempo pasado y que siguen siendo los componentes del índice hoy, mientras que la desviación de los supervivientes es solo un ejemplo de desviación prospectiva. La desviación prospectiva se refiere a la retroevaluación en la que se utilizan datos que no estaban disponibles o no se habían publicado en ese momento, y este es el error más común en la retroevaluación.
Un ejemplo evidente de la desviación de prospección se refleja en los datos financieros, en los que las correcciones a los datos financieros son más propensas a causar errores difíciles de detectar. En general, los datos financieros de cada compañía se publican en diferentes momentos y a menudo hay retrasos.
Sin embargo, cuando los datos puntuales (datos PIT) no están disponibles, los supuestos de retraso de los informes financieros son a menudo erróneos. La siguiente figura confirma las diferencias entre los datos PIT y los datos no PIT. Al mismo tiempo, los resultados finales que generalmente obtenemos al descargar datos macroscópicos históricos son modificados, pero muchos datos del PIB de los países desarrollados se publican dos veces después de que se realicen los ajustes, y las revisiones de los resultados de las grandes empresas también se realizan con frecuencia.
Figura 5
Figura 6
Algunas personas prefieren comenzar a contar historias sin ningún tipo de datos, mientras que las personas que realizan cuantificaciones prefieren contar historias con datos y resultados. Hay muchas similitudes entre las dos situaciones. Las personas que son buenas en contar historias o las que son buenas en interpretar los resultados de los datos a menudo tienen un guión establecido en su corazón antes de obtener los datos.
Mirando hacia atrás en los dos períodos 1997-2000 y 2000-2002 en las acciones de la tecnología estadounidense y en el índice Russell 3000, podemos llegar a una conclusión muy opuesta. Desde el punto de vista de las acciones de la tecnología estadounidense entre 1997-2000 la tasa de ganancia es un factor bueno, y los resultados de la retrospección son muy creíbles, sin embargo, si se extiende el intervalo de tiempo hasta el año 2002, podemos encontrar que el indicador de la tasa de ganancia ya no es un factor bueno.
Figura 7
Sin embargo, a partir del desempeño del mercado del índice Russell 3000, llegamos a la conclusión contraria: el índice de rentabilidad sigue siendo un factor efectivo, y se puede ver que la duración de la selección y revalorización de un grupo de acciones tiene un gran impacto en el juicio de la eficacia del factor. Por lo tanto, los narradores no pueden llegar a la conclusión correcta.
Figura 8
Cada día se descubren nuevos factores positivos y positivos en el mercado, en busca de un motor eterno. Las estrategias que se pueden lanzar son buenas para el retroceso. Aunque las interpretaciones de los narradores de la historia son muy interesantes, sus predicciones sobre el futuro son poco útiles. En la economía financiera, la correlación y la causalidad a menudo son difíciles de entender, por lo que es mejor no ser un narrador cuando hacemos resultados que contradicen el sentido común o concuerdan con los juicios originales.
Figura 9
La minería de datos es un campo de gran interés en la actualidad, basado en grandes cantidades de datos con el apoyo de computadoras, con el objetivo de obtener un factor de beneficio imperceptible. Sin embargo, los datos financieros originales aún no son tan grandes y los datos de transacciones no cumplen con los requisitos de datos con un nivel de ruido bajo.
A veces, la extracción de datos es casi ineficaz. Por ejemplo, el S&P 500 se modela con dos algoritmos de ponderación por factores diferentes y se seleccionan los datos de 2009 a 2014 para la revisión. Los resultados muestran que los resultados de la revisión con los 6 factores de mejor desempeño de los datos de 2009 a 2014 se seleccionan con gran perfección, mientras que los resultados de la revisión con una muestra de datos históricos son una línea recta.
Figura 10
Por lo tanto, todos debemos tener una lógica y una motivación claras cuando construimos estrategias o buscamos buenos factores para mejorar, y el análisis cuantitativo es solo una herramienta para verificar nuestra lógica o motivación, no para buscar un atajo lógico. En general, nuestra motivación para construir estrategias o buscar factores proviene de conocimientos teóricos básicos de finanzas, eficacia de mercados, finanzas conductuales y otros campos. Por supuesto, tampoco negamos el valor de las aplicaciones de la minería de datos en el campo de la cantidad.
Figura 11
La disminución de la señal se refiere a la capacidad de predicción de la rentabilidad futura de las acciones durante un largo período de tiempo después de la aparición de un factor. En general, la tasa de cambio alta y la disminución de la señal están relacionadas. Los diferentes factores de selección de acciones a menudo tienen diferentes características de disminución de la información. La disminución de la señal más rápida a menudo requiere una tasa de cambio más alta para obtener ganancias. Sin embargo, una tasa de cambio más alta a menudo también significa un costo de transacción más alto.
Entonces, ¿cómo determinar la frecuencia de ajuste óptima? Necesitamos tener en cuenta que la restricción de la tasa de cambio más apretada no significa una reducción de la frecuencia de ajuste. Por ejemplo, a menudo escuchamos cosas similares. Somos inversionistas de valor a largo plazo y esperamos tener acciones durante 3-5 años. Por lo tanto, podemos ajustar una vez al año.
Figura 12
Cuando al cierre del día se compran las 100 acciones que han tenido el peor desempeño del día, se vende la tenencia pasada, se mantiene la negociación diaria, la rentabilidad es muy alta. El error aquí también es el desvío prospectivo, y aún no se ha cerrado, no sabemos qué acciones han tenido el peor desempeño del día, es decir, no se puede usar la negociación programada.
El resultado es el siguiente:
Las técnicas tradicionales de control de las anomalías incluyen principalmente la winsorization y la truncation. La estandarización de los datos también puede considerarse como una de las formas de control de anomalías, y la estandarización puede tener un impacto significativo en el rendimiento del modelo. Por ejemplo, la rentabilidad de las acciones de los componentes del S&P BMI Korea en el siguiente gráfico, con una gran variación en los resultados de métodos como promedios, eliminando el 1% o el 2% de los extremos.
Figura 14
Aunque los valores de las anomalías pueden contener información útil, en la mayoría de los casos no la contienen; por supuesto, es la excepción para los factores de movilidad de precios. Como se muestra en el gráfico siguiente, la línea azul es la combinación de representaciones después de eliminar los valores de las anomalías, y la línea roja es la información primaria. Podemos ver que la estrategia de movilidad de los datos primarios es mucho mejor que la estrategia después de eliminar los valores de las anomalías. Es decir, los valores de las anomalías contienen una gran parte de la información, y si eliminamos los valores de las anomalías en la estandarización, equivaldríamos a perder una gran parte de la información. Por lo tanto, el mejor enfoque es agregar los datos a un nivel microscópico y luego calcular los indicadores generales.
Figura 15
Figura 16
En general, la estrategia más común para hacer una estrategia multifactor es la estrategia de múltiples espacios, es decir, hacer muchas acciones buenas y hacer malas acciones al mismo tiempo. Lamentablemente, no todos los factores son iguales, y la asimetría de las características de rendimiento de múltiples espacios de la mayoría de los factores, además de los posibles costos y la viabilidad real de hacer malas acciones, también causa una gran dificultad para la cuantificación de las inversiones. La siguiente figura muestra las características de rendimiento de múltiples espacios de los factores, ordenadas por tamaño de diferencia.
Figura 17
Fuente: Paseo por Wall Street