统计学与业务建模以及机器学习的关系 - hemansnation


统计学是机器学习的四大支柱之一,另外三个是线性代数、微积分和概率。要在机器学习或数据科学方面表现出色,你应该掌握的一件事是统计学。
在这里,我用例子写了常用术语。
统计分为两部分,分别是:

  1. 描述性统计:探索数据(尚无观点)。了解我们拥有什么类型的数据,我们拥有多少样本,是定性的还是定量的。
  2. 推论统计:建立假设并对其进行检验。一旦您使用描述性统计工具描述了您的数据,现在是时候进一步使用推论统计了。一旦您接受或拒绝您的假设,您就可以设置:

 
两种模型产生方式:
  • 基于规则的学习模型:您可以根据数据和发现的关系制定业务规则。这些规则通常由主题专家制定。这可能有点危险,因为存在太多确定性的风险。如果您是制定规则的专家,您会发现即使有其他解释也很难拒绝。这就是机器学习模型比基于规则的学习模型强大得多的原因。
  • 机器学习模型:构建随数据变化的模型。

 banq注:虽然机器学习能够构建随数据变化的模型,但是经常会碰到面临训练数据很好,到了真实生产数据却完全不行的问题,这里由:大数据、厚数据和富数据的区别