x-forecast · paper portfolio
Research · Beta · 4 个模型

Model Cards · 模型说明卡

HuggingFace 风的每个 forecasting / decision 模型说明卡. 每张卡列输入 / 输出 / 训练数据 / 适用边界 / 失败模式.

ARIMAX · US Core PCE

v3.2 上次重训: 2026-05-01

ARIMAX 时间序列模型 · 美国核心 PCE 月频预测

用在哪

economic-forecasting.com (上游) → x-forecast /track-record

输出
1-month-ahead point forecast + 80% CI
输入
  • Core PCE 月度同比 (FRED PCEPILFE), 自 1990-01
  • 外生: oil price (WTI), wage (ECI), housing CPI 子项
训练数据

1990-01 to t-12, walk-forward 重训

方法
ARIMAX(p, d, q) 用 BIC 选阶, p ≤ 3, d ∈ {0,1}, q ≤ 2.
外生变量先做 ADF 平稳性测试.
指标目标

1m-ahead MAE ≤ 0.08% (历史 baseline 0.12%)

已知局限
  • 不适合: 政策冲击月 (e.g. 2020-03), 大宗商品危机月
  • 不解释: 结构性通胀范式转换 (1980 / 2008 / 2022 这种)
  • 依赖: FRED 数据发布时间表; FRED 延迟会让 forecast 延迟
已记录的失败案例
  • 1980s 高通胀 → 模型严重低估 (sample 之外)
  • 2020 COVID → 4 月 forecast 离实际 1.5σ (全样本)
  • 2022 通胀冲击 → 持续 6 个月低估

Transformer · US Nonfarm Payrolls

v2.4 上次重训: 2026-05-01

Transformer encoder · 美国 NFP 月频预测

用在哪

economic-forecasting.com

输出
1-month-ahead point forecast + uncertainty estimate
输入
  • NFP series (FRED PAYEMS), 自 1990
  • 外生: ADP, JOLTS, jobless claims (4w avg)
  • 时序长度: 60 个月 lookback window
训练数据

1990-01 to t-12, weekly retrain

方法
Transformer encoder, 6 层, head=8, d_model=128.
输入: standardised time series + categorical month embedding.
Loss: Huber.
指标目标

1m-ahead MAE ≤ 30k jobs

已知局限
  • 深度学习 overfit 风险: 全样本只有 ~400 月
  • 对 Census 修正不敏感 (训练数据是 unrevised vintage)
  • 对策略转向 (Sahm Rule trigger) 反应慢
已记录的失败案例
  • 2020-04: 模型预测 -2M, 实际 -20M, 完全失败
  • Strike 月份 (auto strikes / Hollywood) 模型不知

TabPFN · Initial Jobless Claims

TabPFN v2 上次重训: n/a (pretrained)

TabPFN (pretrained tabular foundation model) · 美国周频初请失业金预测

用在哪

economic-forecasting.com

输出
1-week-ahead point forecast
输入
  • Jobless claims (FRED ICSA), 4w lookback
  • Continuing claims (CCSA), state-level aggregates
训练数据

TabPFN 是 pretrained, 无 task-specific 训练; in-context learning

方法
TabPFN inference: 把过去 4 周作为 prompt, 让模型推下一周.
不微调.
指标目标

1w-ahead MAE ≤ 8k claims

已知局限
  • TabPFN 只支持 ≤ 10 个特征, 数据维度受限
  • 1000 样本 cap, 长历史用不上
  • 不解释; 黑盒
已记录的失败案例
  • Holiday week (Thanksgiving / Christmas) 季节性失效
  • Hurricane season 区域脉冲不抓

x-forecast view synthesis · monthly

v1.0 上次重训: 2026-05-26 (跟 whitepaper v1.0 同步)

本站每月 view 合成: 多模型 + 人工 + regime overlay → 三组权重

用在哪

x-forecast 主站 monthly rebalance

输出
data/rebalances/YYYY-MM.yaml:
  - groups.base / bull / bear weight vectors
  - macro_view (一段说明)
  - falsification (3-6 条)
输入
  • 上游 7 个 forecasts (来自 economic-forecasting.com)
  • Regime quadrant 位置 (data/regime.yaml)
  • 上月 verdict (data/decisions/)
  • macro_view 文本 (人工)
训练数据

n/a — rule-based + 人工决策, 不是 ML 模型

方法
1. 上游 forecasts → 给每个资产打 view score (-2 to +2)
2. Score → tilted weights (Base 微调, Bull 加权, Bear 反向加权)
3. constraints layer: 单仓 30% / 单类 50% / 现金 5% 下限
4. 人工最终调整 + 写 macro_view 解释
指标目标

n/a — 用 decision log verdict 判定 (whitepaper §4.3)

已知局限
  • 完全依赖上游 forecast 质量
  • Regime overlay 1 月 1 个数据点, 短期信号噪比低
  • 人工最终调整层难复现 (这是 feature, 不是 bug — 见 whitepaper §5.3)
已记录的失败案例
  • 上游 forecast 大错 → 这层放大错误
  • Regime 跨象限切换月 → 决策被 stale 数据拖累
Schema: 每张卡回答 HuggingFace Model Card v2 的问题 (输入 / 输出 / 训练数据 / 局限 / 失败模式). 写"什么时候这个模型不该被信"的纪律, 是抵抗"盲信预测"的最强过滤器.