ML算法对量化交易规则的处理

ML算法采用剪枝技术，通过排序、抽样和分类，去除多余或不重要的交易规则。

这一过程的结果可分为四种情况。

假设 "U "是交易者的数据集，"A "是发现的交易规则集：

符合规则：如果 A_i 的前因和后果部分都与 U_j∈U 的前因和后果部分相匹配，则发现的规则 A_i∈A 符合交易者的数据 U_j。
意外结果规则：如果 A_i 的前件部分与 U_j 的前件部分完全匹配，则已发现的规则 A_i∈A 对于 U_j∈U 具有意外结果。
意外条件规则：如果 A_i 的结果部分与 U_j 很好地匹配，但与前件部分不匹配，则被发现的规则 A_i∈A 对于 U_j∈U 具有意外条件。
双方意外规则：如果 Ai 的前件和后果部分与 U_j∈U 的前件和后果部分不完全匹配，则已发现的规则 A_i∈A 就 U_j∈U 而言是双方意外的。

作为 QTS，您希望自己处于情景 1（符合规则）和情景 2（意外情况规则）中。

但这其中也有陷阱：

-方案 2 在统计上并不重要，因此将其考虑在内的风险很高
-方案 1 需要设定结果的长度
-有多少观察结果足以与前因后果相匹配？
-后件长度的另一个问题是长度会随时间变化
-您需要同时解决漂移和优化（长度动态）的选择算法
-否则，您将得到一个在过去很合适，但在现在不合适的模型

当然，规则提取算法本身也有缺陷：

-容易过度拟合
-对变化不稳定
-对噪音不稳定
-非连续性
-只找到局部最优解（贪婪）