高低频因子融合 vs. 动态市场环境:从叠加到门控策略

因子的有效性，取决于它和当前市场的“相位关系”。

高频反转因子在单边趋势中不断磨损，趋势因子在震荡区间里持续回撤。

因子没有失效，只是被放错了环境。一个常见的模式是：当高频信号变得杂乱无章，趋势往往在酝酿；当趋势流畅时，高频反转信号却很难赚钱。

换句话说，高频和中低频不是在竞争，而是在轮流“值班”。市场只在某些时候适合高频逻辑，在另一些时候适合中低频逻辑。如果用静态权重去应对动态切换，结果两头不讨好。

那么，为什么简单叠加总是效果不好？有没有比叠加更合理的思路？

因子的“主场”与“客场”

先问一个更基本的问题：每个因子到底在赚什么钱？它又怕什么？

我们可以把市场环境大致看成一条连续谱的两端。一端是噪音主导：流动性充裕，方向模糊，价格来回摆动；另一端是趋势主导：知情交易者持续发力，订单流单向，价格走出趋势。高频因子和中低频因子在这两种环境下的表现，往往截然相反。

从几个经典的高频量价因子来看：

订单簿不平衡：买一挂单减卖一挂单除以总和。数值为正表示买方阻力小，价格短期向上。赚的是做市商来不及调整报价时的瞬时错价。这种因子的逻辑清晰，IR 高，但容量小。一旦市场进入流畅单边趋势，买单源源不断，失衡始终为正，反转不会发生，信号被持续碾压。
短期反转：过去几分钟涨多就空，跌多就多。赚的是流动性冲击后的价格回复。这种因子，胜率高，回撤短，但在趋势行情里，每次反转信号都是逆势的，容易被反复止损。
量价相关系数：单位涨幅需要多少成交量来推动。当成交量异常放大而涨幅有限，说明卖方意愿强，未来容易跌。该因子与纯价格的因子相关性低，但市场微观结构一变（比如手续费调整），就需要重新校准。
开盘成交占比：前10分钟成交额占全天比例。背后的直觉是“聪明资金喜欢在开盘交易”。但实际交易中，容易方向不稳定，有时正有时负。

（常见高频量价因子）

中低频因子方面，常见的几个如下：

时间序列动量：过去20日收益率延续。赚的是信息缓慢扩散和处置效应。策略容量大，单边市表现好，但震荡市会被反复打脸，回撤期长，可达数月。
期限结构：近月减远月。贴水往往反映现货供需偏紧，做多近月空远月，等贴水收敛。策略的逻辑强，不易过拟合，但宏观政策切换（如利率曲线平移）时，可能整体失效。
仓单/库存变化：交易所仓单增加，意味着现货压力大，期货承压。它独立于量价，但数据频率低，有明显滞后。

（常见中低频因子）

不难看出，高频因子在噪音主导的环境里更容易赚钱，这类市场的流动性充裕、方向混沌、价格来回摆；而中低频因子在趋势主导的环境里表现更好，市场中知情交易者主导、订单流持续、逻辑连续。

（不同频率因子对比）

两种环境很少同时存在。市场更像一个双稳态系统，在它们之间切换。

如果我们用固定权重把两类因子叠在一起，噪音期中低频拖后腿，趋势期高频拖后腿。这不是分散，是相互抵消。

更麻烦的是，两类因子的失效期往往重叠——在市场状态切换的临界点（如从震荡转向趋势的初期），它们会一起表现不佳。这就是“双重失效区间”，也是大多数叠加策略最大回撤的来源。

高频的定位：识别环境，而非赚钱

很多新手对高频因子的期待可能是“每天稳定赚一点”。但这个期待值得商榷。高频数据真正擅长的，不是预测价格方向，而是感知当前是谁在推动价格。

Easley等人的PIN模型（知情交易概率模型）为我们提供了视角：订单流的持续性和不平衡程度，实际上在代理知情交易活动的强度。当订单流方向一致且持续，往往是知情交易者在行动；当订单流随机反转、买卖价差扩大，则噪音交易者在主导。也就是说，高频数据回答的并非“涨还是跌”，而是：现在这个市场，是聪明钱在动，还是散户在乱冲？

Lo和MacKinlay (1988) 提出的方差比检验也能指向类似判断。他们发现短期收益的自相关结构在不同时间尺度下显著不同。当短期收益呈现负自相关时，市场处于均值回复主导的状态，这正是高频因子的舒适区；当正自相关出现时，市场处于趋势主导状态。而短期收益的自相关性，用几分钟的高频数据就能实时计算。

不过我们不一定非要用某个具体的高频因子做环境分类。高频因子是环境特征的某种映射，但更直接的做法是用高频数据计算环境指标。高频数据的价值在于能实时反映微观结构。

因此，高频因子的最佳定位，并非独立赚 alpha，而是帮助判断当前环境。一个高频因子可能本身赚钱能力一般，但如果能告诉我们“现在是噪音还是趋势”，那它对整个策略的价值可能远超它的夏普——它能让中低频因子只在适合的环境里重仓。

想通这点，很多困惑就自然化解了：

❝

简单叠加不奏效，是因为静态权重无法适应环境切换；

高频因子衰减，不一定是被市场学会了，是它在趋势期本就该失效；

趋势因子回撤期长，问题在于我们从没在噪音期降低过它的暴露。

从叠加到门控

分析了原因，接下来我们看看具体怎么做。

等权混合、波动率倒数加权、按时序切分（开盘用高频、收盘用中低频）——这些常见的叠加方法，都假设因子载荷是常数，用不变的权重去应对时变的环境。但实际上，因子载荷依赖市场环境。

借用条件CAPM的思想：资产的 beta 可以随市场状态变化。相应地，预期收益中高频信号和中低频信号的贡献权重，应该根据当前市场环境动态调整。噪音期高频权重大、趋势权重小，趋势期反之。

换句话说，高频层判断“该不该动”，中低频层决定“往哪个方向动”。因此可以设计一种门控机制——用高频信号作开关，控制中低频信号的仓位。

具体来看，先算环境指标。

指标一：日内噪音强度。过去20个交易日，日内5分钟对数收益率的标准差除以隔夜对数收益率的标准差。比值越高，市场越可能处于噪音主导状态。
指标二：订单流持续性。1分钟窗口的订单流不平衡率（主动买卖差/总成交量）的一阶自相关系数。值越接近1，订单流方向越持续，越可能是趋势主导状态。

然后设定判定规则。

当指标一偏高且指标二偏低，判定为噪音主导：降低趋势因子仓位，可启用高频反转因子。
当指标一偏低且指标二偏高，判定为趋势主导：恢复趋势因子仓位，降低或关闭高频反转因子权重。
其他情况视为混合状态：降低总仓位。

需要注意的是，混合状态是容易被忽略的区间。事实上，当两个环境指标给出矛盾信号时，市场往往处于切换过程中，此时任何方向性策略的风险都偏高。在这种状态下，我们可以将总风险敞口降低。

关于阈值和仓位调整幅度的设定，需要根据品种和时段调整。可以用过去12个月的滚动分位数（如前20%和后20%）来动态校准。

此外，即使不做完整的门控，高频数据也可以用来优化中低频订单的执行。比如当高频信号显示短期会出现反向波动时，把市价单改成限价单，挂在一个更有利的价格；当订单流持续单边时，加快完成速度避免踏空。很多团队把这一层叫做“smart execution layer”，它不产生独立 alpha，但能显著降低交易成本。