机器学习算法更像“黑暗艺术而不是科学”?

21-09-08 banq

来自biztechmagazine报道:麻省理工学院电气工程和计算机科学教授 Sam Madden 指出,机器学习算法通常更像是“黑暗艺术而不是科学”。搅动数据的算法通常是不透明的,而且事情可能会出错,但是今天的数据科学家正在开发下一代方法,使机器学习变得更加平易近人。

围绕机器学习的问题之一是,当算法偏离轨道时,普通 IT 专家无法修复它们,而且许多公司(甚至是大公司)都没有数据科学家。

为了解决这个问题,麻省理工学院创建了SystemsThatLearn@CSAIL,这是一项旨在构建更易于理解的下一代机器学习算法的计划,为 IT 专家(不仅仅是数据科学家)提供查明和解决问题的能力。

然而,来自企业工业界的一些专家并不认为算法需要重组。这是更好的数据标签:所谓的训练数据的标签问题。一个算法,无论多么复杂,只有在人类提供训练数据的情况下才能学习。对于自动驾驶汽车,该数据将包括标记图像,因此汽车会知道它是看到灯柱还是人类。如果汽车不断混淆灯柱和人,人类需要更好地标记数据。

CrowdFlower 对数据科学家进行了一项调查,看看他们认为哪个更重要:训练数据或算法。训练数据轻松获胜,52% 的数据科学家表示,他们宁愿不小心删除他们的机器学习代码,也不愿删除他们的训练数据。

关键是确保这些算法获得准确的训练数据,人工智能嵌入在应用程序中。但你需要训练人工智能。

1
猜你喜欢