编程已死?数据胜出!


过去,程序代码一直是构建软件时的主要重点。但是机器学习系统改变了范式:代码仅扮演次要角色,而“数据”成为主要角色。了解如何产生、收集、管理和解释数据的个人将拥有未来。 - svpino
 
网友讨论:
模型解释在不久的将来将是一件大事!随着数据科学的广泛采用,它们将影响重要的决策。仅仅说“该模型的准确率达90%以上”是不够的。数据科学家将不得不解释他们的模型。医疗保健行业就是一个很好的例子。您必须解释什么对预测患者患有癌症的模型有贡献。一个简单的黑匣子解决方案是不够的。
 
数据是向工业革命进行数字化转型的动力
  
在编写一行代码之前,需要了解数据。代码模式将变得标准化,但数据将始终是唯一的。
 
代码将继续被打包到标准框架中,我们都可以一次又一次地重复使用它们。更好的代码将使我们的收益递减。
 
长期以来数据结构在很大程度上是软件应用程序的一个功能。现在需要使数据成为独立于应用程序生命周期成为一流公民。
 
数据是未来,但即使对于ML系统,如果您打算将其投入生产并对其进行长期维护,那么软件工程将是必不可少的。除了辅助项目之外,任何其他事情都需要您编写简洁的代码...,但是所有这些工作最终都会变得重复并且容易被任何人设置。
 
机器学习已经向我们展示了没有数据的代码是毫无意义的。有些人可能没有意识到这一直是事实。
 
数据可能是噪音,没有经过适当的预处理。验证数据,增强数据并使其有用是一项艰巨的任务。假设数据对做出业务决策有用且一致,这是一个冒险的竞标。即使格式正确,也可能导致错误的结果。
 
软件是一个神秘的实体。面向对象的编程就是隐藏数据,将我们与数据隔离以及将行为视为头等公民,而现在,数据似乎已经处于领先地位。
 
收集,管理和解释数据主要是通过编码来完成的,代码创建了一些软件来帮助我们完成上述所有工作。我认为编程还第一等公民。但是数据(好的,干净的和标记良好的)仍然是主要对象。