Computación Estadística para Traders: Series Temporales, Estacionariedad y Estadísticas Honestas

Computación Estadística para Traders: Series Temporales, Estacionariedad y Estadísticas Honestas

La mayoría de la "investigación" en trading no muere por una mala idea, sino por una mala estadística. La computación estadística —usar herramientas como R o Python para analizar datos de mercado con rigor— es lo que separa una estrategia en la que puedes confiar de una curva con la que te engañaste a ti mismo. Este es un recorrido práctico por los conceptos que importan y por los errores que arruinan los resultados en silencio.

Las herramientas

R está hecho por estadísticos para estadísticos. Para series temporales, contraste de hipótesis y gráficos limpios, paquetes como xts, quantmod, forecast y PerformanceAnalytics son difíciles de superar.
Python gana en integración y escala: pandas, NumPy, statsmodels y scikit-learn cubren el mismo terreno y se enchufan directamente a los sistemas de ejecución y de machine learning.

Usa aquel en el que vayas a ser realmente disciplinado. La estadística es idéntica; solo cambia la sintaxis.

Estacionariedad: el concepto que rompe la mayoría de los backtests
Una serie de precios es no estacionaria — su media y su varianza vagan con el tiempo. La mayoría de los métodos estadísticos asumen lo contrario. Haz una regresión o una correlación sobre precios en bruto y encontrarás relaciones impresionantes que son pura correlación espuria: dos series no relacionadas que suben parecen "cointegradas" simplemente porque ambas tienen tendencia alcista.

Diferencia o usa rendimientos en lugar de niveles de precio para obtener algo más cercano a estacionario.
Compruébalo con un test de Dickey-Fuller aumentado (ADF) o KPSS antes de confiar en cualquier modelo construido sobre la serie.
Para el trading de pares, comprueba la cointegración real (p. ej. Engle-Granger / Johansen), no solo la correlación.

Herramientas de series temporales que conviene conocer

ARIMA para la estructura de autocorrelación lineal.
GARCH para la agrupación de volatilidad — los periodos de calma y de tormenta se agrupan, y modelar eso suele ser más fiable que predecir la dirección.
Gráficos de autocorrelación/autocorrelación parcial para ver qué estructura existe realmente antes de modelarla.

Estadísticas de backtest honestas
Una sola curva de capital no te dice casi nada. Exige las cifras que revelan la fragilidad:

Sharpe y Sortino para el retorno ajustado al riesgo; informa del tamaño de muestra que los respalda.
Drawdown máximo y tiempo de recuperación — el dolor que debes sobrevivir.
Número de operaciones y significancia estadística — 20 trades no sostienen afirmaciones fuertes.
Intervalos de confianza / bootstrapping. Remuestrea tus rendimientos para preguntar: ¿cuánto de esto pudo ser suerte?

Los asesinos silenciosos

Sesgo de pruebas múltiples. Prueba 200 ideas y unas cuantas parecerán brillantes por azar. Cuanto más pruebas, más alto debe ser tu listón de significancia.
Sesgo de supervivencia. Hacer backtest solo con las acciones que hoy sobreviven ignora todo lo que fue a cero — halagador y falso.
Sesgo de anticipación. Usar datos que no estaban disponibles en el momento de decidir. El error más común y más embarazoso.
Data snooping. Retocar hasta que el backtest se vea bien es sobreajuste con pasos extra.

En resumen
La computación estadística no es decoración académica — es tu defensa contra engañarte a ti mismo. Haz estacionarias las series antes de modelarlas, prefiere la cointegración a la correlación, informa de las métricas ajustadas al riesgo con su tamaño de muestra y trata todo resultado impresionante como culpable hasta que se demuestre robusto fuera de muestra. El mercado es el revisor más duro que existe.

¿Cómo es tu lista de comprobación estadística antes de poner una estrategia en real? Comparte tus tests imprescindibles.