不久我们将不用计算机编程,只需像狗一样训练它们

         
banq 16-05-25

这是一篇有关人的大脑与人工智能之间关系的思考文章,虽然标题有点忽悠,但是涉及的一些观点和知识还是值得一看。

计算机发明之前,大多数实验心理学家认为大脑是一个不可知的黑盒子,可以分析出对象的行为比如狗听到响铃流口水等此类条件反射现象,但是对于记忆情绪等却很模糊难以测量,这些超出了科学的范畴,因此这些自称行为主义者一直在进行刺激反应 反馈和强化等条件反射的研究工作,他们放弃试图了解头脑的内部运作原理的努力,这种方式统治了四十年之久。

然而,在50年代中期,一群叛逆的心理学家、语言学家和信息理论家和早期人工智能研究人员提出了关于大脑的不同概念,他们认为大脑不只是条件反射的集合,它们会吸取信息、处理信息,然后根据处理结果采取行动,它们会有系统的写入存储和调用记忆,它们会通过逻辑和形式语法进行操作,大脑不是什么都没有的黑盒子,它更像是一台电脑。

这就是所谓的认知革命,随着计算机在心理学实验室成为标准设备,它获得了广泛的认可,到了70年代后期,认知心理学推翻了行为主义,并以一个全新的语言体系谈论精神生活。

随着数字革命渗透到我们生活每个部分,在早期科学启蒙时代,牛顿和笛卡尔启发人们将宇宙作为一个精心制作的时钟来思考,而在工业时代,它是一个带有活塞的有能量的机器(心理学大师弗洛伊德的思路就是从蒸汽机的热力学借鉴而来),现在大脑被看成是一台电脑,而整个世界都是依靠人脑去认识的,那么人脑是一台电脑,那么整个世界就是可以被编码的。

代码必须是合乎逻辑,代码也会被破解,代码就是命运,这是数字时代的核心原则,Facebook的扎克伯格认为:在人类关系的表象下面是底层的数学法则左右着人与他们关心的事情, 2013年Craig Venter宣布在人类基因破解后的十年将允许人类创造人造生命,这个星球上生命是DNA软件驱动的生物机器,你可以修改你自己的源代码,对你的生活热爱 睡眠习惯和消费习惯重新编程。

在这个世界上,写代码的能力已经不只是一个理想的职业技能,变成权力的杠杆,如果你控制了代码,你就控制了世界。

但是,过去几年,谷歌等人工智能公司寻求一种机器学习的新方法,在传统的编程中,工程师必须明确地写明一道道指令,计算机严格遵循执行,随着机器学习发展,编码人员不需要这么明确指令对计算机命令了,反而是他们训练它们,如果你想教神经网络识别猫,那么,你不是告诉它来寻找胡子 耳朵 皮毛和眼睛,你只需要展示给它看成千上万个猫的照片即可,如果它将狐狸错误划分为猫,你不必重新编写代码,你只要继续保持训练即可。

这种做法不新鲜,已经存在了几十年,最近变得更加强大,归功于深层神经网络的兴起,它是模仿大脑神经元多层连接大规模分布的计算机系统,Facebook使用它来决定哪些新闻信息显示给你看,谷歌用它来识别人脸,微软Skype用来实时翻译不同语言,自动驾驶汽车使用机器学习避免意外,即时谷歌的搜索引擎,这么多人编写了如同高耸大楼的规则系统,也已经开始依赖这些深层神经网络,该公司已发起重大计划使用新技术再培训这些工程师,通过建立学习制度,今年秋天,谷歌将不必再人工编写这些搜索引擎规则了。

问题是,随着机器学习发展,工程师却从来不知道电脑是如何完成其任务的,神经网络的运作很大程度上是不透明,是莫测的,换言之,它就是一个黑盒子,随着这些黑盒子承担更多日常数字化任务,它不仅会改变我们的技术,还会改变我们如何看待自己,以及它里面的我们的世界,我们身处何方?

如果说,旧时代的程序员像神,创造和支配计算机系统的规则法律,现在他们需要像父母或训狗师,人与电脑之间这样一个更加神秘的关系即将出现。

安迪·鲁宾是安卓系统的共同创造者,他说:我进入计算机科学时候很年轻,我喜欢它,因为我可以投身并忘我地消失在计算机世界中,它是一个干净石板,一个空白的画布,我可以从头开始创建任何东西,很多年这给了我完整的控制感。

现在这个世界即将结束,鲁宾投身于新的机器学习公司,因为机器学习将改变一个软件工程师的定义。鲁宾说:比如一个神经网络学会语言识别,程序员总不能进去看看这种识别是如何发生的?就像你不能劈开你的大脑看看你在想什么一样,当更多软件工程师进入了深层次神经网络,他们看到的是数字的海洋,一个个巨大的多层次的微积分问题,不断在数十亿数据关系点之间进行推导,产生对世界的猜测。

几年前,主流的AI研究人员还认为人工智能不应该以这种方式工作,他们认为应该创造智慧,灌输机器以正确的逻辑,编写足够的规则,最终我们会创造出足够复杂能够了解世界的系统,他们蔑视现在的这种机器学习为数据绞肉机,由于电脑没有强大到足以真正证明这两种方法的优劣,所以这成为哲学争论之一,大部分这种争论是基于对世界是如何组织以及大脑如何工作的分歧之上的,创造了谷歌自动驾驶 前斯坦福大学人工智能教授塞巴斯蒂安史朗说:神经网络没有符合和规则,只有数字。它对人类并不友好,是不合群的。

一个不可分析的机器语言的意义不只是对哲学符号学等研究的冲击,而且对人才就业体系也形成冲击,过去孩子家长将他们送到专业计算机院校学习就能找到可靠的就业,但是机器学习使得老的编程技能变得没有用,程序员会很快自己感觉到一个什么样滋味的。

但是,O'Reilly 的技术大师Tim 说:传统编程不会消失,我们仍然很长时间需要编程,正如牛顿定理不会被量子理论取代一样,两者会共存。

当然,人类需要训练这些人工智能系统,这是一个很少有的技能,这个工作需要高层次的数学把握和实践中的直觉意识,这几乎就像一种艺术形式,如果你想获得这些系统的最佳表现,领导谷歌DeepMind AI的Demis Hassabis说,世界上目前只有几百人能够非常好地做到这点。但是,即使这么微小的数字足以在短短几年改变整个技术行业。

不管如何,这种转变在文化上的后果将更大,如机器学习可能会违抗人类分析运行自己的代码,目前谷歌正面临在欧洲指责其搜索结果施加不当影响的控诉,但是因为公司自己的工程师都不能说明有些内容为什么会跑到首页或首位上,它内部是如何工作的都无法说清,因为是依靠深层次神经网络自己的迭代学习导致的。

这种不确定性已经不是什么新闻,即使简单的算法可以产生不可预知的突发行为,这可以追溯到混沌理论和随机数发生器等。在过去几年中,随着网络变得更加交织,越来越复杂,代码似乎变成一个异己力量,像个鬼一样变得难以捉摸和难以统治。

逻辑上的确定性和对自然的控制,这是一个世纪之久的年代的信仰,现在将结束,转移到纠缠的年代,与我们是创造的主人正好相反,我们需要学会与他们讨价还价,哄骗和引导它们,我们已经建立了自己的丛林,它们有自己的生命。

这一切是相当可怕的,以前编码者至少是人,但是现在是这些科技精英也已经对自己的作品的驾驭能力减弱,去年夏天,谷歌进行快速道歉,因为其照片识别引擎把黑人照片分类为大猩猩类别。

但是不用害怕,我们只是要学会和新技术如何打交道,目前,工程师们正在寻求将深度学习系统引擎里面的机制进行视觉化形象化的工作,即使我们永远不能完全理解这些新机器是怎么想的,不意味着我们在他们面前无能为力。在未来,我们将尽可能多地探究它们行为的深层根源,我们将专注于学习行为本身,这些比我们用来训练它的数据和代码更重要。

事实上,培养了机器学习算法的过程中经常被比作20世纪初的伟大行为主义实验。 类似巴甫洛夫不断训练狗的条件反射一样,我们只要通过一遍又一遍重复事件的数据序列提供给机器学习,并训练它们。

对于了解计算机历史的人来说,过去我们一直采取由内而外的视角,首先,我们编写代码,让机器运行表述它,这种世界暗示着是有可塑性的,也表明了它是一种基于规则决定的世界,从某种意义上说,底层本质是指令,而机器学习正好相反,这种代码是从外而内的视角,机器学习不只是决定行为,而且决定代码。

最终,我们将在手工编写代码和机器学习算法这两种力量之间进行权衡设计。生物学家们已经开始搞清楚这一点了,基因编辑技术类似CRISPR,给了这些生物学家一种传统软件编程的代码控制力量,但是在遗传学领域的发现表明:遗传物质其实也不是不可变的指令集,而是动态根据其宿主所在环境和经历进行动态调整一些开关的,细胞被认为是一种DNS软件驱动DNA-software-driven机器,但也有人认为:一个细胞就是一个将经验转为生物的机器。

80年以前图灵第一次勾画了一个解决问题的机器,现在今天计算机已经成为一个将经验转为技术的机器,几个世纪以来我们寻求安全的代码,能够解释,能调整,能优化我们的体验,但是现在机器再也不是这样工作了,我们面对更加复杂但是更值得关注的技术关系,我们从命令我们的设备转变到做它们的父母。

Soon We Won’t Program Computers. We’ll Train Them


[该贴被banq于2016-05-25 14:45修改过]

2
banq
2016-06-10 12:24

过去我们训练狗,听到敲盆就流口水,闻到毒品味道就拼命找,现在我们训练机器看到某个特征就`狂吠`,这些都是通过训练完成,而不是基因编码实现。

人工智能走向生物训练化,生物走向基因编程化,这种双向融合是今天世界上最创新的最有前途的两个科技领域。

神经网络最基本形式感知器的入门教程
[该贴被banq于2016-06-12 12:09修改过]