过度拟合:回测 99% 胜率的策略,为何实盘亏得底朝天?
目录
深圳某量化工作室的小张,最近开发出一个 “神策略”:回测过去 5 年数据,胜率 99%,年化收益超 500%。他兴奋地投入 10 万实盘,结果 3 个月亏了 7 万。更诡异的是,每次回测都完美盈利,但实盘就是不赚钱 —— 这就是典型的 “过度拟合”,量化交易里最隐蔽的 “温柔陷阱”。
过度拟合就像给历史数据 “量身定制” 衣服,穿在过去的身上刚刚好,穿在未来的身上却处处别扭。今天我们就拆穿这个陷阱的 3 种伪装,教你如何避开它。
什么是过度拟合?看这个 “股市算命” 的例子
米切尔团队做过一个极端实验:用某股票过去 100 天的收盘价,拟合出一个 “预测模型”。他们加入了 “当天是否下雨”“上证指数末位数字” 等无关因子,最后得到一个公式:
次日收盘价 = 今日收盘价 ×1.02 + (下雨?0.03:0) - (上证指数末位是 3?0.01:0)
回测时,这个模型对过去 100 天的预测准确率高达 98%。但用它预测未来 10 天,准确率瞬间跌到 52%,和抛硬币差不多。这就像给历史数据 “算卦”,看似精准,实则毫无逻辑。
过度拟合的本质是 “把噪音当信号”。股市波动里,有真正的规律(比如低估值股票长期跑赢),也有随机噪音(比如某一天因为大户平仓导致的涨跌)。过度拟合的策略,会把这些噪音当成必须遵守的规则,就像把偶然路过的飞鸟当成导航路标。
过度拟合的 3 种典型 “伪装”,新手最容易中招
1. 参数 “精准到离谱”
某策略的买入条件是 “5.37 日均线金叉 21.89 日均线”,回测显示这个参数组合收益最高。但稍微调整一下,比如 5.38 和 21.90,收益就暴跌 —— 这明显是为历史数据 “削足适履”。
正常的有效策略,参数应该有 “容错空间”。比如双均线策略,5 日和 20 日好用,6 日和 22 日也应该差不多,就像鞋子大一点小一点都能穿,只有小脚鞋才必须精确到毫米。
2. 因子 “多到看不懂”
小张的策略里有 23 个因子,包括 “董事长生日月份”“股票代码是否含 7” 等奇葩条件。他解释说 “因子越多越精准”,但实际上,过多的因子会让策略变成 “历史数据的复制品”。
就像用 100 个参数画一条直线,最后画出的其实是和历史数据完全重合的折线,看起来完美,却失去了预测能力。米切尔的标准是:“能用 3 个因子说清的策略,绝不用第 4 个。”
3. 回测曲线 “光滑如镜”
正常策略的回测曲线应该有波动,就像山路有起伏。但过度拟合的策略曲线,可能连续 3 年没有回撤,甚至每月都盈利 —— 这在真实市场里几乎不可能,就像现实中没人能每次考试都考 100 分。
某平台曾曝光一个 “伪策略”,回测 5 年收益曲线是 45 度角上升,没有任何回调。后来发现,开发者在代码里偷偷加了 “未来数据”,相当于考试时偷看答案,成绩再好看也没用。
如何检测过度拟合?3 个 “照妖镜”
1. 样本外测试:用 “新卷子” 检验
把数据分成 “训练集”(比如 2018-2022 年)和 “测试集”(2023 年),用训练集开发策略,再用测试集验证。如果测试集收益比训练集低 50% 以上,很可能是过度拟合。
就像用前 5 年的高考题复习,最后得用今年的新题检验。米切尔团队要求:样本外收益不能低于样本内的 60%,否则坚决放弃。
2. 参数扰动:看策略 “抗揍能力”
把策略参数上下调整 10%,比如把 5 日均线改成 4.5-5.5 日,如果收益变化很大,说明策略很脆弱。而 robust 的策略,参数轻微变动不会影响核心效果。
这就像检验鸡蛋质量,好鸡蛋从 1 米高掉下可能没事,坏鸡蛋稍微碰一下就碎。某多因子策略在参数扰动测试中,收益波动不超过 10%,后来实盘表现稳定;而另一个策略波动超过 40%,实盘 3 个月就失效了。
3. 交易逻辑检验:能不能 “说人话”
问自己一个问题:“这个策略赚钱的逻辑是什么?” 如果答案是 “我不知道,但回测就是赚钱”,那大概率是过度拟合。
有效的策略一定有清晰的逻辑,比如 “低 PE 股票被低估,长期会回归”“趋势形成后会延续一段时间”。就像一个能说清赚钱门路的生意,才值得投入;说不清的,可能是骗局。
避免过度拟合的 “三不原则”
1. 不用 “过少数据” 开发策略
用 100 天数据开发的策略,就像只看 10 场比赛就判断球员水平,很容易出错。至少要用 3 年以上的数据,经历过牛熊周期,才能过滤掉短期噪音。
2. 不追求 “极致收益”
开发策略时,别总想着 “怎么让回测收益更高”,而是 “怎么让策略更稳健”。就像找对象,与其找 “完美到不真实的”,不如找 “有缺点但靠谱的”。
米切尔团队会故意在策略里加 “容错机制”,比如把止损线从 10% 放宽到 12%,牺牲一点回测收益,换更大概率的实盘存活。
3. 不忽视 “常识判断”
如果策略说 “每月最后一个周五必涨”,或者 “股票代码含 6 的表现更好”,哪怕回测再好也别信 —— 这些违背常识的规律,本质是随机噪音。
就像没人会相信 “打喷嚏时买股票必赚”,量化策略也得符合基本的市场逻辑,才能穿越牛熊。
小张后来简化了策略,去掉奇葩因子,只保留 “低波动 + 高股息” 两个核心逻辑,虽然回测年化收益从 500% 降到 15%,但实盘 6 个月盈利 8%。“原来慢就是快,接受不完美,反而能走得更远。”
下一篇,我们来聊聊量化交易的 “最后一公里”—— 实盘时遇到的突发情况该怎么处理?网络断了、系统崩了、策略失灵了,这些危机时刻该如何应对?
更多推荐


所有评论(0)