由微软推出的基于AI人工智能的量化投资平台:Qlib框架


Qlib是一个面向AI的量化投资平台,旨在实现潜力,增强研究能力并创造AI技术在量化投资中的价值。
借助Qlib,您可以轻松尝试您的想法,以创建更好的量化投资策略。
有关更多详细信息,请参阅论文“ Qlib:面向AI的量化投资平台”

量化投资的目的是在一系列金融工具上的连续交易期间内最大化回报,并将风险降至最低。最近,受AI技术的快速发展和巨大潜力的启发,AO技术在量化投资方面产生了显着的创新,因此越来越多地采用AI驱动的工作流进行量化研究和实际投资。在丰富量化投资方法的同时,人工智能技术对量化投资系统提出了新的挑战。特别是,用于量化投资的新学习范例要求对基础设施进行升级,以适应更新后的工作流程;此外,人工智能技术的数据驱动特性确实表明对具有更强大性能的基础架构的需求。另外,应用AI技术解决财务场景中的不同任务存在一些独特的挑战。为了应对这些挑战并弥合AI技术与定量投资之间的差距,我们设计和开发了Qlib,旨在实现潜力,增强研究能力并创造AI技术在定量投资中的价值。


在模块级别,Qlib是一个由以上组件组成的平台。这些组件被设计为松耦合模块,每个组件可以独立使用。

  • Data layer

DataServer致力于为用户提供高性能基础架构,以管理和检索原始数据。DataEnhancement将对数据进行预处理,并提供最佳数据集以供输入模型。
  • Interday Model

Interday model专注于产生预测分数(又名alpha)。模型由训练Model Creator和管理Model Manager。用户可以选择一个或多个模型进行预测。多个模型可以与Ensemble模块组合。
  • Interday Strategy

Portfolio Generator 将采用预测得分作为输入,并根据当前头寸输出订单以实现目标投资组合。
  • Intraday Trading

Order Executor负责执行订单输出Interday Strategy并返回执行结果。
  • Analysis

用户可以在本部分中获得有关预测信号和投资组合的详细分析报告。
 
Qlib数据服务器的性能
数据处理的性能对于像AI技术这样的数据驱动方法很重要。作为一个面向AI的平台,Qlib为数据存储和数据处理提供了一个解决方案。为了演示Qlib数据服务器的性能,我们将其与其他几种数据存储解决方案进行了比较。

HDF5    MySQL    MongoDB   InfluxDB   Qlib-E-D   Qlib+E-D   Qlib+E+D
184.4±3.7 365.3±7.5 253.6±6.7 368.2±3.6  147.0±8.8  47.6±1.0  7.4±0.3

大多数通用数据库在加载数据上花费太多时间。在研究了基础实现之后,我们发现数据在通用数据库解决方案中经过了太多的接口层和不必要的格式转换。这样的开销极大地减慢了数据加载过程。Qlib数据以紧凑格式存储,可以有效地组合成数组以进行科学计算。