在思想、语言和机器上的思考:人与动物区别是人能以递归形式表达思想 - 0x0f0f0f


贝里克和乔姆斯基的精彩文章“ 为什么只有我们:语言与进化”认为:人类语言首先作为一种对所感知的事物进行内部理解的工具而兴起,然后逐渐外部化为对世界理解的一种交换工具。乔姆斯基还绘制了一张非常有趣的概念图,描绘了整个自然界中存在的各种语言:
尽管黑猩猩有语言,但它们是线性的,简单的并且像鸣鸟一样,它们缺乏以递归方式表达思想的能力。
在过去的几十年中,我们能够从生物大脑内部发生的某些过程中启发自己,并得益于强大的计算能力,从而模仿了许多有趣的学习现象(俗称人工智能或机器学习)。在计算机体系结构和计算并行化方面取得了指数级的进步。
最近的发现告诉我们,我们的新皮层神经元可以计算出我们认为的更多信息,尤其是单个锥体神经元能够对线性不可分离的输入进行分类,而传统上认为这需要整个神经网络。这可能会告诉我们更多有关生物学差异的信息,这些差异使我们的大脑具备了这种复杂的语言能力。
进一步了解生物神经元与大脑区域之间连接体的知识,对于将来对自己的理解,因此对语言和更智能的人工系统的理解至关重要。
今年,也就是2020年1月,Google AI和HMMI的Janelia研究园区的研究人员发表了一篇突破性的研究文章。已经制作并详细研究了果蝇大脑(果蝇)区域的整个连接体结构,称为“ hemibrain”。
神经连接体成像(neural connectome imaging)的发展必将带来巨大的进步,帮助我们了解大脑的哪些区域在人类复杂、分层和递归语言的产生中特别发挥了作用。模拟大脑的人工模型将取得巨大进展。与过去一样,这些模型将提供对自然语言本质的深刻见解。

语言的哲学意义
语言是概念和感知之间关系的基础。

  • 概念是形成或理解思想或抽象成符号的能力、功能或过程。
  • 感知是感觉信息的组织、识别和解释,以表示和理解所呈现的信息或环境。所有感知都涉及通过神经系统的信号,而这些信号又是由于感觉系统受到物理或化学刺激而产生的。

语言是一种内部处理和理解自己以及周围宇宙的工具。使我们的大脑对我们感知到的视觉/听觉刺激有了内部解释。这是概念和感知之间的桥梁。
语言是正确发挥想象力的基础,而提出自己的问题的能力对于好奇心的产生至关重要:我们对自己提出的问题越复杂,通过寻找我们正在寻找的东西,我们找到的答案就越惊人。
这是本书中我最喜欢的名言之一道格拉斯·霍夫施塔特(Douglas Hofstadter)撰写的Gödel,Escher和Bach完美地概括了难以理解的递归的感觉:
所谓陷阱(递归)思考是:在您理解任何一条信息之前,您必须首先有一条信息告诉您如何理解这条信息。

形式系统在理解自然中的作用
形式系统不要与语言学中的形式语义相混淆,它是由形式语言和演绎组成。形式语言是书面语言的极其简化的子集,其字符串根据非常严格的规则集实现格式的正确。演绎系统可能由一组转换规则(推理规则)和一组公理组成。
从推论和推论规则得出的格式正确的字符串称为定理。要确定格式正确的字符串是否实际上是公理系统的定理,必须遵循称为证明的过程。
形式证明或推导是格式良好的公式(可以解释为句子或命题)的有限序列,每个公式都是公理或根据推论规则从序列中的先前公式得出。
形式的公理系统虽然对所有科学都是基础性的,但其固有的局限性几乎是自相矛盾的。这些结果称为Gödel哥德尔不完备定理:如果正确地解释,就不可能找到一套完整而一致的公理来表示。形式系统无法证明系统本身是一致的(假设它确实是一致的)。
不完备性定理表明,可证明性是有限度的:如果正式的公理体系是人类语言衍生的最强大的工具之一,是所有逻辑和推论的基础,那么令人难以置信的是,它们将永远是固有的不完备且无法让我们对宇宙有一个完整的认识 。这种不完整性可能不仅与依赖更严格的推导规则的刚性数学系统有关。
一旦掌握了哥德尔的两个不完全性定理,就可以轻松想象公理系统语言中的定理与自然,内在思维和语言领域之间的双向映射。(banq注:形式逻辑是一条线,多条线才能组成面,一条线代表一个角度,一个角度的思考问题是无法全面认识问题,盲人摸象中每个盲人都是片面的)。
尽管形式系统已被证明是理解现实的基本工具,但客观上令人恐惧的思考是,即使我们生活在科学进步呈指数增长的时代,我们仍然距离真正的理解还很远。 “ 万物理论 ”的碎片,或者甚至在思考自然本身的本质时可能会问自己的最基本的问题。

语言和机器
编程语言和机器是一种非常重要的工具,可以将概念,感知以确定性、递归和自动化的方法联系起来,计算机语言是建立在连接概念:感知(通过人机交互外围设备)以及演绎和公理推理的非常聪明的方法之上的。
编程语言是:充满惊喜,但不完整,简单但难以理解,递归无穷无尽,而且非常容易解决。

遗传密码:我们不拥有的语言
关于DNA和RNA(生物生命的基础)是否是语言,存在许多相反的科学观点。就像我们可以用ASCII码,Unicode或书面文字对普通英语进行编码一样,可以在DNA中编码自然的人类语言。但是,这种对应不是一成不变的:可悲的是,我们细胞中的DNA无法产生我们可以直接解读的自然人类语言解释。
最近计算机编程和算法作为帮助我们进行此类科学研究的工具而开始了他们的旅程。计算机科学的一个完整分支叫做“生物信息学”已经迅速出现,专门用于处理计算机辅助的生物数据(主要是遗传代码)的处理。
生物信息学包括使用计算机编程作为方法学一部分的生物学研究,以及重复使用的特定分析“管道”,特别是在基因组学领域。
分子生物学家,生物化学家和生物信息学研究人员对DNA和遗传密码进行的许多计算机化操作在算法上都类似于计算机科学中普遍存在的许多字符串处理程序。
令人惊奇的是,遗传密码不仅表示每个生物的特征,而且还描​​述了非生命生物(如病毒)携带的遗传信息。

结论:概念和感知的不相容
我们使用复杂的符号交换信息是一个事实,这样事实并不意味着我们比其他任何物种都要好。给我们带来了我们最大的缺陷之一:怀疑,不确定性和使用自相矛盾的能力来表达无法表达的东西。
世界是一个令人着迷的混乱之地,语言的恩赐不仅使我们能够通过构想来分析与之互动的环境,而且还使我们能够将我们所感知的事物外化关于我们自己和世界其他地方的信息。
至少对我来说,当与世界互动时,在概念和感知连接发生一些事情,我感到脊椎发凉,我感到自己与宇宙之间可能没有任何区别。我们越努力地以口头形式刻画这种感觉,就越失去其本质

以上为大意简介,原文点击标题进入。
(banq注:神经系统负责感知,大脑负责概念,语言是两者之间桥梁,形式语言是语言中唯一有效手段,催生了计算机编程语言、人工智能等,DNA也是一种语言。)