Más Allá del Sentimiento: Extracción de Eventos de Earnings Calls e Informes

Más Allá del Sentimiento: Extracción de Eventos de Earnings Calls e Informes

El sentimiento de titulares — "¿este artículo es alcista o bajista?" — es la tarea de NLP de nivel inicial para traders, y es genuinamente útil. Pero una única puntuación positivo/negativo tira a la basura casi toda la información de un documento. El trabajo más valioso, y más difícil, es la extracción de eventos: sacar los hechos concretos y estructurados que de verdad mueven los precios. Este post va de ese siguiente escalón.

El sentimiento te dice el ánimo; los eventos te dicen qué pasó
Un modelo de sentimiento podría puntuar una nota de resultados como ligeramente positiva. La extracción de eventos, en cambio, la lee como un conjunto de hechos: guía elevada, dividendo recortado, dimisión del CFO, recompra anunciada. Eso es operable, comparable y mucho más específico que un estado de ánimo. Dos informes con el mismo sentimiento pueden cargar eventos opuestos.

Qué estás extrayendo en realidad

Entidades. Empresas, tickers, personas, productos, lugares — mediante Reconocimiento de Entidades Nombradas (NER). El primer problema duro es el enlazado de entidades: mapear "la compañía", "Apple" y "AAPL" a un único identificador canónico.
Eventos. Los sucesos estructurados: fusiones y adquisiciones, cambios de guía, litigios, cambios en la dirección, lanzamientos de producto, acciones regulatorias.
Argumentos / roles. Quién le hizo qué a quién, y por cuánto: qué empresa es la compradora, cuál es la nueva cifra de guía, cuándo entra en vigor.

El pipeline, a grandes rasgos

Origen y limpieza. Transcripciones de earnings calls, informes 8-K / 10-Q, feeds regulatorios. Quita el texto repetitivo, segmenta en frases y conserva la marca de tiempo — importa más que el propio texto (mira más abajo).
Etiquetado. Pasa un NER y un clasificador (o, cada vez más, un transformer afinado como FinBERT o un LLM general) para etiquetar entidades y eventos candidatos.
Enlaza y estructura. Resuelve las entidades a tickers, adjunta los argumentos del evento y emite un registro estructurado: {ticker, tipo_evento, valor, timestamp, fuente}.
Conviértelo en una feature. Agrega esos registros en señales: sorpresa del evento frente a lo esperado, frecuencia de eventos o una bandera direccional intradía.

La trampa que lo arruina todo en silencio: las marcas de tiempo
Este es el sesgo de look-ahead del mundo del NLP. Si entrenas o backtesteas sobre un informe usando la fecha en que lo descargaste en vez del momento en que se hizo público, estás operando con información del futuro. Las earnings calls, las horas de aceptación de los informes y los timestamps de los teletipos deben registrarse al minuto, y tu backtest solo puede usar un documento después de su verdadera hora de disponibilidad pública. Equivócate en esto y construirás una estrategia espectacular que no se puede operar.

Los LLM ayudan — pero verifica
Los grandes modelos de lenguaje son excelentes leyendo una transcripción caótica y devolviendo un JSON estructurado de eventos. También son seguros de sí mismos cuando se equivocan: alucinarán un recorte de dividendo que nunca se anunció. Para cualquier cosa que dispare una orden, restringe el modelo a extraer solo lo que está en el texto, valida la salida contra un esquema y revísala contra la fuente. Una extracción errónea es peor que ninguna extracción.

En resumen
El sentimiento es un termómetro; la extracción de eventos es un estetoscopio. Da más trabajo — enlazado de entidades, diseño del esquema e higiene obsesiva de las marcas de tiempo — pero produce hechos concretos, comparables y operables en lugar de un ánimo vago. Empieza con un único tipo de evento que te importe, deja los timestamps demostrablemente correctos y solo entonces amplía la red.

¿Qué texto financiero estás parseando y cómo garantizas que tus marcas de tiempo son honestas? Comparte tu pipeline abajo.