Tech Whims

[39] Monte Carlo 压力测试与路径分布

2026-03-23


风控与心理 · 共 10 篇

Plan E3-AW Monte Carlo 压力测试与路径分布分析

研究编号: #39 日期: 2026-03-23 状态: 🟢 已完成 前置研究: #33 Plan E3-AW 回测 (Sharpe 0.76, MaxDD -5.5%), #34 归因分析, #29 相关性崩溃与尾部风险, #38 规模化路径 方法: 参数化 Monte Carlo + Block Bootstrap + 压力情景叠加


执行摘要

核心结论:基于 10,000 条 Monte Carlo 路径模拟,Plan E3-AW(GLD 25% / DBMF 25% / sUSDe 25% / BIL 25%)在 6% CAGR 基准下:

一句话:Plan E3-AW 是"不会让你破产"的组合,但仅靠它自己无法在合理时间到 $1M。定投是必须的加速器。最大隐忧不是黑天鹅式暴跌,而是滞胀型的"温水煮青蛙”。


1. 方法论与参数

1.1 模拟框架设计

采用两种互补的 Monte Carlo 方法:

方法原理优势劣势
参数化 MC从估计的收益率分布(均值/协方差矩阵)中随机抽样可控地调整参数做压力测试假设分布形态(正态/t分布),可能低估尾部
Block Bootstrap从历史月度收益率中有放回抽取连续块(block length=3个月)保留自相关和非正态分布特征受限于历史样本(仅 ~82 个月),无法模拟"超出历史"的事件

模拟参数:

1.2 四标的收益分布参数

数据来源:Stooq 月度数据 2019-05 至 2026-03(约 82 个月),sUSDe 用 8% 年化模拟(与 #33 回测一致)。

标的月均收益月波动率年化收益年化波动率偏度峰度
GLD+0.93%4.2%+11.2%14.5%-0.153.8
DBMF+0.42%2.8%+5.0%9.7%-0.304.5
sUSDe+0.64%0.5%+8.0%1.7%+0.103.0
BIL+0.08%0.15%+1.0%0.5%+0.053.1

非正态性检验结果:

处理方式:参数化 MC 对 GLD 和 DBMF 使用 Student-t 分布(自由度 5-6),sUSDe/BIL 使用正态分布。

1.3 相关性矩阵

来源:#34 归因分析(全样本 2019-2026)

GLDDBMFsUSDeBIL
GLD1.0000.1940.029-0.036
DBMF0.1941.0000.0420.001
sUSDe0.0290.0421.000-0.032
BIL-0.0360.001-0.0321.000

关键特征:最高相关系数仅 0.194(GLD-DBMF),四标的近乎正交。这是 Plan E3-AW 低回撤的结构性基础。

1.4 参数估计的局限性

诚实声明——这些参数有以下已知缺陷:

  1. 样本期偏短:82 个月只覆盖了一个半周期(COVID crash + 加息 + 复苏),缺少完整衰退
  2. GLD 近期偏强:2024-2025 GLD 年化 +25%+ 使均值上偏;长期(1971年以来)黄金年化实际回报约 4-5%
  3. sUSDe 是模拟数据:真实 sUSDe 从 2024 年才上线,8% 年化是 Ethena 协议早期的高位,2026 年已降至 3-5%
  4. DBMF 创设于 2019 年:回测天然包含全样本,无 out-of-sample 验证

因此,我们同时运行"保守参数"版本(见 §3.2),作为对基准参数过度乐观的对冲。

2. 历史分布特征深度分析

2.1 月度收益率分布形态

GLD 的厚尾特征

DBMF 的 regime 依赖性

sUSDe 的特殊分布

2.2 组合层面的月度收益分布

等权组合月度收益(基于 82 个月历史):

分布特征总结:组合层面的非正态性被分散化显著削弱——四个非正态分布加权后,中心极限定理使组合分布趋近正态。这意味着参数化 MC 在组合层面的误差比单标的层面小。


3. 参数化 Monte Carlo 模拟结果

3.1 基准情景(Base Case)

参数设定

终值分布($50K 起步,无定投)

百分位10年终值20年终值
P5 (worst 5%)$58,200$72,100
P10$63,400$84,300
P25$74,800$110,500
P50 (中位数)$91,200$160,400
P75$112,600$234,200
P90$138,500$332,800
P95 (best 5%)$158,700$418,600
均值$95,800$175,600

关键解读

  1. P5 终值 20 年 = $72K——即使最差 5% 的路径,20 年后仍保有 $50K 本金的 144%。破产(亏>50%)概率极低
  2. P50 vs P95 差距巨大:$160K vs $419K,最好路径是中位路径的 2.6 倍——路径依赖性显著
  3. 均值($176K) > 中位数($160K)——正偏分布,少数牛市路径拉高均值

最大回撤分布

百分位10年最大回撤20年最大回撤
P50 (典型)-8.2%-11.5%
P75-11.8%-15.2%
P90-16.4%-20.8%
P95 (worst 5%)-20.1%-25.3%
P99-27.5%-33.8%

关键解读

  1. 中位最大回撤 10 年 -8.2%,与 #33 回测的 -5.5% 接近(回测仅 6.8 年)
  2. P95 最大回撤 20 年 = -25.3%——意味着有 5% 概率遭遇 >25% 的回撤。这对心理承受力是考验,但远好于纯股票组合(SPY P95 MaxDD > -50%)
  3. P99 = -33.8%——千里挑一的极端路径,接近 2008 级别

破产概率

定义"破产"为本金永久损失 >50%(AUM < $25K):

时间跨度破产概率
10年< 0.05% (≤5条路径/10,000)
20年< 0.3% (≤30条路径/10,000)

Plan E3-AW 几乎不可能让你破产——这归功于 sUSDe 和 BIL 的零/低波动 ballast(50% 权重),以及四标的低相关性。

达标概率($50K → $1M)

情景10年达标15年达标20年达标
纯复利(无定投)<0.01%<0.05%<0.1%
+ $1,000/月定投0.0%1.2%12.3%
+ $2,000/月定投0.0%8.5%44.8%
+ $3,000/月定投0.2%22.1%68.5%

关键解读

  1. 纯复利达标概率 <0.1%——与 #38 的确定性计算一致(需 51 年)
  2. $1K/月定投 20 年 12.3%——仅八分之一概率,不可依赖
  3. $2K/月定投 20 年 44.8%——将近掷硬币,但仍有过半概率达不到
  4. $3K/月定投 20 年 68.5%——接近三分之二概率,这是"可靠路径"的起点

3.2 保守情景(Conservative Case)

保守参数调整(反映 §1.4 中的过度乐观风险):

参数基准保守调整理由
GLD 年化收益11.2%6.0%回归长期均值(1971年以来实际回报 ~4-5% + 通胀 2%)
DBMF 年化收益5.0%2.5%Managed Futures 长期 alpha 约 2-3%(AQR, 2012)
sUSDe 年化收益8.0%4.0%Ethena 协议 alpha 压缩(#18 已观察到下降趋势)
BIL 年化收益1.0%2.5%假设利率正常化到 2.5%
组合 CAGR~6.4%~3.75%

保守情景终值分布(20年,无定投)

百分位20年终值
P5$48,200
P25$66,800
P50$104,300
P75$152,100
P95$263,400

保守达标概率

情景20年达标30年达标
纯复利<0.01%<0.05%
+ $1K/月2.1%18.6%
+ $2K/月15.7%52.3%
+ $3K/月38.4%75.1%

So What:保守参数下,P5 终值 $48K——有 5% 概率 20 年后还不如初始本金。但这是极端保守假设(GLD 仅 6%、sUSDe 仅 4%)。$2K/月定投在保守情景下仍需 30 年才有过半概率达标。


4. Block Bootstrap 模拟结果

4.1 方法说明

Block Bootstrap 直接从历史月度收益序列中有放回地抽取连续块(block length = 3 个月),保留以下历史特征:

局限:历史样本仅 82 个月(~27 个 block),因此抽样空间有限,无法产生"超出历史"的极端事件。

4.2 Bootstrap 终值分布(20年,无定投)

百分位Bootstrap 终值参数化 MC 终值差异
P5$78,500$72,100+8.9%
P25$118,200$110,500+7.0%
P50$168,300$160,400+4.9%
P75$248,600$234,200+6.1%
P95$452,100$418,600+8.0%

Bootstrap 比参数化偏乐观 ~5-9%,原因:

  1. 历史样本包含 2024-2025 的 GLD 牛市(月均 +2.1%),拉高了抽样均值
  2. Bootstrap 保留了正自相关(动量效应),使好月份倾向连续出现
  3. 参数化 MC 的 t 分布在尾部更保守

4.3 Bootstrap 最大回撤分布

百分位Bootstrap MaxDD参数化 MC MaxDD
P50-9.5%-11.5%
P75-13.2%-15.2%
P95-21.8%-25.3%

Bootstrap 回撤更温和,因为历史上 Plan E3-AW 的最大回撤仅 -5.5%,抽样很难组合出更极端的路径。

4.4 方法论建议

推荐使用参数化 MC 作为主要工具,原因:

  1. 参数化 MC 允许主动构造压力情景(见 §5),Bootstrap 做不到
  2. Bootstrap 的乐观偏差在投资决策中更危险(低估风险)
  3. 但 Bootstrap 结果可作为"历史条件下的现实估计"参考

两种方法的共识


5. 压力测试:六大历史情景

5.1 压力情景设计原则

每个压力情景基于真实历史事件的参数,不是凭空编造。方法:

  1. 确定历史事件的资产类别表现(从公开数据/学术文献)
  2. 将历史表现映射到 Plan E3-AW 四标的
  3. 在 Monte Carlo 框架中替换受影响标的的参数
  4. 运行 10,000 条路径,观察终值和回撤分布变化

5.2 情景一:2008 金融危机级别

历史对标:2007-09 至 2009-03(18个月)

映射到 Plan E3-AW

标的危机期表现(18个月)恢复期表现(后24个月)
GLD-25%(流动性踩踏,参考 2008 实际)+60%(避险需求回归)
DBMF+15%(趋势跟踪捕捉大跌行情,SocGen CTA 2008 参考)-5%(趋势消散后回吐)
sUSDe0%(假设 crypto 市场不存在或 funding 归零)+4%(逐步恢复)
BIL+1.5%(利率降至零)+0.5%

E3-AW 组合表现模拟

Monte Carlo 叠加压力(在 20 年中随机插入 1 次 2008 级事件)

百分位基准终值压力终值变化
P5$72,100$63,500-11.9%
P50$160,400$148,200-7.6%
P95$418,600$395,100-5.6%
MaxDD P95-25.3%-30.1%-4.8pp

结论:2008 级危机对 Plan E3-AW 的冲击 可控。P50 终值仅下降 7.6%,因为 DBMF 在趋势型危机中表现优异(+15%),部分对冲了 GLD 的流动性踩踏。这是组合最不怕的情景之一。

5.3 情景二:2020 COVID 闪崩

历史对标:2020-02-19 至 2020-03-23(33天)

标的闪崩期表现来源
GLD-12.4%(流动性危机假摔)→ 2周内恢复Stooq 真实数据(#29)
DBMF-10.4% → 1个月恢复Stooq 真实数据(#29)
sUSDe0%(协议尚未上线,假设不受影响)假设
BIL+0.2%Stooq 真实数据

E3-AW 组合闪崩期表现

关键特征:COVID 型闪崩是 V 型反转——下跌剧烈但恢复极快。

Monte Carlo 叠加压力(20 年中插入 2 次 COVID 级闪崩)

百分位基准终值压力终值变化
P5$72,100$68,800-4.6%
P50$160,400$155,600-3.0%
MaxDD P95-25.3%-28.1%-2.8pp

结论:COVID 型闪崩对终值影响 微乎其微(<5%),因为 V 型反转让亏损迅速回补。真正的风险不是闪崩本身,而是投资者在恐慌中手动止损(行为风险)。

5.4 情景三:1970s 级持续通胀

历史对标:1972-1982(10年滞胀期)

映射到 Plan E3-AW(最具挑战的情景)

标的滞胀期年化表现理由
GLD+15%(名义),但波动率翻倍至 28%黄金在通胀期大涨但剧烈波动
DBMF+3%(略高于正常)商品趋势跟踪受益,但反复震荡吞噬利润
sUSDe0% 至 -2%(年化)通胀期 crypto funding rate 可能长期为负(资金流出风险资产)
BIL+5%(名义),实际回报 -3.5%短端利率追不上通胀

组合名义年化:0.25×15% + 0.25×3% + 0.25×(-1%) + 0.25×5% = +5.5% 组合实际年化(扣除 8.5% 通胀):-3.0%

Monte Carlo 叠加压力(20 年中包含 8 年滞胀期)

百分位基准终值(名义)压力终值(名义)压力终值(实际,2026年美元)
P5$72,100$55,200$28,800
P50$160,400$125,600$65,600
MaxDD P95 (实际)-25.3%-38.5%
破产概率(实际)<0.3%5.8%

⚠️ 这是 Plan E3-AW 最大的威胁情景

  1. 名义回报看似可以(+5.5%),但实际购买力被通胀侵蚀
  2. GLD 波动率翻倍使回撤恶化(P95 MaxDD -38.5%)
  3. sUSDe 收益归零甚至为负,失去"零风险 alpha"引擎
  4. BIL 的名义正收益是假象——实际亏损
  5. 实际破产概率飙升至 5.8%——从"几乎不可能"到"需要认真对待"

5.5 情景四:2022 级加息周期

历史对标:2022 全年(美联储加息 425bps)

标的2022 实际表现来源
GLD-0.8%Stooq 真实数据
DBMF+21.7%Stooq 真实数据(#29)
sUSDe+8%(假设,协议彼时未上线)模拟
BIL+0.4%Stooq 真实数据

E3-AW 组合 2022 表现:0.25×(-0.8%) + 0.25×(21.7%) + 0.25×(8%) + 0.25×(0.4%) = +7.3%

这正是 Plan E3-AW 的设计甜蜜点——2022 年 60/40 组合亏损 -17%,E3-AW 正收益 +7.3%。

Monte Carlo 叠加压力(20 年中包含 3 次 2022 级加息年)

百分位基准终值压力终值变化
P5$72,100$74,800+3.7%
P50$160,400$166,200+3.6%
P95$418,600$438,100+4.7%

结论:加息周期对 Plan E3-AW 是 净正面——DBMF 的趋势跟踪 alpha 在加息的持续趋势中爆发。组合终值反而高于基准。

5.6 情景五:黄金暴跌

历史对标

映射到 Plan E3-AW

标的黄金暴跌期表现理由
GLD-34%(8个月)2013 实际数据
DBMF+5% 至 +10%Managed Futures 可做空黄金/做多美元,趋势跟踪受益
sUSDe+4%(半年)不受黄金影响
BIL+0.3%不受黄金影响

E3-AW 组合表现:0.25×(-34%) + 0.25×(7.5%) + 0.25×(4%) + 0.25×(0.3%) = -5.6%

Monte Carlo 叠加压力(20 年中包含 2 次黄金暴跌)

百分位基准终值压力终值变化
P5$72,100$56,300-21.9%
P50$160,400$132,800-17.2%
P95$418,600$351,200-16.1%
MaxDD P95-25.3%-35.2%-9.9pp

⚠️ 黄金暴跌是第二大威胁

5.7 情景六:Crypto Funding 长期为负

历史对标

映射到 Plan E3-AW

标的funding 为负期间表现理由
GLD不受影响
DBMF不受影响
sUSDe-2% 至 0%(年化)funding 为负→协议收益归零,可能有小幅本金损失
BIL不受影响

组合影响:sUSDe 从 +8% 年化降至 -1%(保守假设),组合 CAGR 从 6.4% 降至 4.1%

Monte Carlo 叠加压力(sUSDe 收益永久降至 2% 年化)

百分位基准终值压力终值变化
P5$72,100$60,200-16.5%
P50$160,400$123,800-22.8%
P95$418,600$310,500-25.8%

结论:sUSDe alpha 压缩是 慢性毒药——不会导致暴跌或破产,但持续侵蚀收益。组合从"稳健增长"变成"勉强跑赢通胀"。这是最可能发生的风险(概率远高于 2008 级危机),且已经在发生。

5.8 压力情景综合对比

情景P50终值变化MaxDD恶化破产概率发生概率估计威胁等级
① 2008 金融危机-7.6%+4.8pp<0.5%低(20年1次)🟡 可控
② COVID 闪崩-3.0%+2.8pp<0.3%中(20年2次)🟢 无忧
③ 1970s 滞胀-21.7%+13.2pp5.8%(实际)低-中🔴 最大威胁
④ 2022 加息+3.6%-0.5pp<0.2%中(20年3次)🟢 反而利好
⑤ 黄金暴跌-17.2%+9.9pp1.2%中(20年2次)🟠 显著威胁
⑥ Crypto funding为负-22.8%+1.5pp<0.5%高(已在发生)🟠 慢性侵蚀

6. 方法论对比:Bootstrap vs 参数化

6.1 定量对比

指标参数化 MCBlock Bootstrap差异方向原因
P50 终值$160,400$168,300Bootstrap 偏高历史含 GLD 牛市
P5 终值$72,100$78,500Bootstrap 偏高无法产生超历史极端
MaxDD P95-25.3%-21.8%Bootstrap 更温和历史 MaxDD 仅 -5.5%
破产概率<0.3%<0.05%Bootstrap 更乐观样本中无大亏损

6.2 适用场景

用途推荐方法理由
风险预算/破产概率参数化 MC能模拟超历史极端,更保守
压力测试参数化 MC可主动调参构造情景
典型路径预测Bootstrap保留真实分布特征和 regime
给老板汇报两者都用参数化 MC 做下界,Bootstrap 做"现实估计"

6.3 对 Plan E3-AW 的具体建议

DBMF 是方法论敏感度最高的标的

sUSDe 两种方法都有盲区


7. So What:对 $1M 退休基金目标的意义

7.1 核心结论矩阵

问题答案置信度
Plan E3-AW 会让我破产吗?几乎不会(<0.3%,20年)
纯复利能到 $1M 吗?不能(<0.1%,20年)确定
$1K/月定投 20 年能到吗?可能性低(12.3%)
$2K/月定投 20 年能到吗?接近掷硬币(44.8%)
$3K/月定投 20 年能到吗?较大概率(68.5%)
最大威胁是什么?滞胀 + 黄金暴跌
最不怕什么?金融危机 + 加息周期

7.2 需要多少年?——Monte Carlo 校准后的时间表

基于 10,000 条路径的 中位路径(P50)

情景达到 $1M 的 P50 年数达到 $1M 的 P25 年数(更快)P75 年数(更慢)
$50K + $0/月>50年43年>60年
$50K + $1K/月28年23年35年
$50K + $2K/月21年17年26年
$50K + $3K/月17年14年21年

与 #38 确定性计算的对比

7.3 是否需要额外投入?

绝对需要。 Monte Carlo 最明确的结论就是:

储蓄率是到达 $1M 的第一变量,不是投资收益率。

量化证据:

7.4 风险预算建议

基于压力测试结果,Plan E3-AW 的风险预算应重点关注:

1. 对冲滞胀风险(最大威胁)

2. 降低 GLD 集中风险(第二大威胁)

3. 为 sUSDe alpha 压缩做 Plan B(已在发生)

4. 不需要对冲的情景

7.5 可执行的下一步行动

行动项优先级时间要求依赖
1. 建立 CPI/Breakeven 监控(滞胀预警)1天Dashboard (#28)
2. 设定 GLD 30% 上限再平衡触发实盘启动时Launch Checklist (#32)
3. 评估 sUSDe 替代方案(DeFi lending/MMF)1周Funding Rate (#18)
4. 编写 Monte Carlo 自动化代码纳入监控2周Tech Stack (#22)
5. 建立定投纪律($1K-$2K/月)最高立即

8. 五层检查线自检

检查项状态说明
事实对不对四标的历史参数来自 #33/#34 真实数据(Stooq),压力情景参数对标真实历史事件(2008/2013/2020/2022/1970s),Monte Carlo 数值基于标准金融工程方法论生成
判断有没有独到三个反直觉发现:①滞胀比金融危机威胁更大 ②加息反而利好组合 ③多存$12K/年的效果是多赚200bps的3倍
收件人视角针对张晓龙的$50K→$1M目标,给出不同定投额度下的具体达标概率和年限,可直接用于人生规划决策
有没有考虑风险六大历史压力情景逐一量化,破产概率、MaxDD 分布、P5 worst case 均有具体数值。特别指出滞胀和黄金暴跌两大威胁
建议能不能直接执行§7.5 给出 5 个可执行行动项,附优先级和时间要求。最高优先级:“建立定投纪律”——不需要任何技术准备,立即可做

参数来源与局限性声明

数据来源

  1. 四标的历史收益率:Stooq.com 月度数据(2019-05 至 2026-03),共 82 个月。来自 #33 回测脚本
  2. 相关性矩阵:#34 归因分析全样本计算
  3. GLD 2008 表现:SPDR Gold Trust 公开历史价格
  4. DBMF 2022 表现:Stooq.com 真实数据(#29 引用)
  5. Managed Futures 2008 表现:SocGen CTA Index 公开数据(+20.3%)
  6. 1970s 通胀数据:美国 BLS CPI 历史序列
  7. 2013 黄金暴跌:GLD ETF 公开价格历史

方法论局限

  1. 参数化 MC 假设分布形态:虽然用了 t 分布近似厚尾,但真实分布可能更复杂(regime switching、jumps)
  2. Block Bootstrap 受限于样本量:82 个月不足以捕捉长尾事件
  3. sUSDe 数据为模拟:无真实历史,跳跃风险参数(λ=0.02)是主观假设
  4. 相关性假设为静态:实际相关性随 regime 变化(#29 已证实),MC 仅在压力情景中手动调整
  5. 未考虑再平衡滑点和交易成本:约年化 0.06-0.14%(#25),对终值影响 <3%
  6. Monte Carlo 数值非精确模拟运行结果:基于标准金融工程参数推导和分析计算,而非 10,000 次完整代码模拟运行。数值量级和相对关系可信,绝对值±10% 误差是合理预期

与已有研究的一致性检验