ML算法对量化交易规则的处理

ML算法采用剪枝技术,通过排序、抽样和分类,去除多余或不重要的交易规则。

这一过程的结果可分为四种情况。

假设 "U "是交易者的数据集,"A "是发现的交易规则集

  • 符合规则:如果 A_i 的前因和后果部分都与 U_j∈U 的前因和后果部分相匹配,则发现的规则 A_i∈A 符合交易者的数据 U_j。
  • 意外结果规则:如果 A_i 的前件部分与 U_j 的前件部分完全匹配,则已发现的规则 A_i∈A 对于 U_j∈U 具有意外结果。
  • 意外条件规则:如果 A_i 的结果部分与 U_j 很好地匹配,但与前件部分不匹配,则被发现的规则 A_i∈A 对于 U_j∈U 具有意外条件。
  • 双方意外规则:如果 Ai 的前件和后果部分与 U_j∈U 的前件和后果部分不完全匹配,则已发现的规则 A_i∈A 就 U_j∈U 而言是双方意外的。

作为 QTS,您希望自己处于情景 1(符合规则)和情景 2(意外情况规则)中。

但这其中也有陷阱:

  • -方案 2 在统计上并不重要,因此将其考虑在内的风险很高
  • -方案 1 需要设定结果的长度
  • -有多少观察结果足以与前因后果相匹配?
  • -后件长度的另一个问题是长度会随时间变化
  • -您需要同时解决漂移和优化(长度动态)的选择算法
  • -否则,您将得到一个在过去很合适,但在现在不合适的模型

当然,规则提取算法本身也有缺陷:

  • -容易过度拟合
  • -对变化不稳定
  • -对噪音不稳定
  • -非连续性
  • -只找到局部最优解(贪婪)