ML算法对量化交易规则的处理
ML算法采用剪枝技术,通过排序、抽样和分类,去除多余或不重要的交易规则。
这一过程的结果可分为四种情况。
假设 "U "是交易者的数据集,"A "是发现的交易规则集:
- 符合规则:如果 A_i 的前因和后果部分都与 U_j∈U 的前因和后果部分相匹配,则发现的规则 A_i∈A 符合交易者的数据 U_j。
- 意外结果规则:如果 A_i 的前件部分与 U_j 的前件部分完全匹配,则已发现的规则 A_i∈A 对于 U_j∈U 具有意外结果。
- 意外条件规则:如果 A_i 的结果部分与 U_j 很好地匹配,但与前件部分不匹配,则被发现的规则 A_i∈A 对于 U_j∈U 具有意外条件。
- 双方意外规则:如果 Ai 的前件和后果部分与 U_j∈U 的前件和后果部分不完全匹配,则已发现的规则 A_i∈A 就 U_j∈U 而言是双方意外的。
作为 QTS,您希望自己处于情景 1(符合规则)和情景 2(意外情况规则)中。
但这其中也有陷阱:
- -方案 2 在统计上并不重要,因此将其考虑在内的风险很高
- -方案 1 需要设定结果的长度
- -有多少观察结果足以与前因后果相匹配?
- -后件长度的另一个问题是长度会随时间变化
- -您需要同时解决漂移和优化(长度动态)的选择算法
- -否则,您将得到一个在过去很合适,但在现在不合适的模型
当然,规则提取算法本身也有缺陷:
- -容易过度拟合
- -对变化不稳定
- -对噪音不稳定
- -非连续性
- -只找到局部最优解(贪婪)