数据科学家会被机器学习工程师取代吗? - KDnuggets


在大多数数据驱动的组织中,只需要基本的数据科学技能即可解决问题。这个角色可以很容易地被机器学习工程师取代——一个具有数据科学算法基本知识的人,他还拥有部署 ML 模型的知识。
数据科学家的角色将被 AutoML 等工具取代,而另一些人则将数据科学称为“垂死的领域”,很快就会被数据工程和 ML 运维等角色超越。
 
大多数组织中的数据科学工作流程非常相似。许多公司聘请数据科学家来解决类似的业务问题。大多数构建的模型不需要您提出新颖的解决方案。
您将在这些组织中解决数据驱动问题的大多数方法很可能以前已经使用过,您可以从在线可用资源的海洋中汲取灵感。
此外,AutoML 和 DataRobot 等自动化工具的兴起使预测建模变得更加容易。
我将 DataRobot 用于一些业务用例,它是一个很棒的工具。它迭代许多值并为您的模型选择最佳参数,以确保您最终获得最高精度的模型。
因此,如果预测建模随着时间的推移变得更加容易,为什么公司仍然需要数据科学家?他们为什么不直接使用自动化工具和 ML 工程师的组合来管理他们的整个数据科学工作流程?
答案很简单:

  • 首先,数据科学从来都不是重新发明轮子或构建高度复杂的算法。 数据科学家的角色是为拥有数据的组织增加价值。在大多数公司中,其中只有很小一部分涉及构建 ML 算法。
  • 其次,总会有自动化工具无法解决的问题。这些工具有一组固定的算法可供您选择,如果您确实发现需要结合多种方法来解决的问题,您将需要手动完成。 
    尽管这种情况并不经常发生,但它仍然会发生——作为一个组织,你需要雇佣足够熟练的人来做到这一点。此外,像 DataRobot 这样的工具无法进行数据预处理或模型构建之前的任何繁重工作。 

数据科学家为组织提供的价值在于他们将数据应用于实际用例的能力。无论是构建细分模型、推荐系统还是评估客户潜力,除非结果是可解释的,否则对组织没有真正的好处。 
只要数据科学家能够在数据的帮助下解决问题并弥合技术和业务技能之间的差距,这个角色就会继续存在。