规则引擎与ML模型的比较 - xLaszlo

22-02-21 banq

“基于规则的系统”通常是作为ML项目的良好起点。
  

数据科学的重点是提出问题
数据科学家的工作是通过统计工具回答问题。有时一些答案可以模型的形式表现出来,但这不是必需的。
数据科学家首先关注的是问题而不是答案。这要求他们构建一个框架(使用代码和数据),以便验证后续答案。
 
 

构建一个基于规则的系统很简单?
建立规则听起来很简单,不是吗?

  1. 先从 "价格>1000美元,则为真,否则为假 "这样的内容开始;
  2. 然后你添加逻辑运算符,如AND、OR和NOT;
  3. 然后,你调整常数,进行演示;
  4. 然后你添加循环和分支来简化逻辑表达式。

这就是基于规则的系统吗?好像很简单,但发展到最后,你可能希望将该项目委托给软件工程团队;他们更擅长编写代码,然后数据科学家通过DSL输入业务规则。
后来,你会发现规则引擎+DSL并不能满足你....
  

建立人工智能模型很难吗?
假设您准备并构建了一个可以验证模型的框架:
从零开始实施新的机器学习模型确实很难。但最近该领域最大的进步是:已经存在大量易于使用的高质量模型。
您可以从 spacy、huggingface 或 imagenet 等预训练的模型开始解决标准任务。
您拥有结构化数据的 *BOOST 模型,使用 sklearn 的 LogReg 构建基线模型则没有任何问题。
在像机器学习这样快速发展的领域中,您不仅需要更新自己的技能,还需要更新您对所接受的合理首次尝试的信念。
 

1
猜你喜欢