物理学在更高的维度上指引人工智能发展方向 - quantamagazine

20-01-10 banq

物理和机器学习具有基本的相似性,两个领域都涉及进行观测,然后建立模型来预测未来。这两个领域都寻求的模型并不局限于单个事物(banq注:类似面向对象建模中,根据个别对象特征建模为整个类class)。

摘录几个要点,原文点击标题进入:

等方差(或“协方差”,物理学家偏爱的术语)是自爱因斯坦以来依靠物理学家推广其模型的假设。。就像爱因斯坦本人在1916年所说的那样:“自然的一般定律应由对所有坐标系都适用的方程式表示。”描述世界的物理理论表现出一种称为“规范等方差”的性质,这意味着世界上的数量及其关系不依赖于任意的参照系(或“测量工具或观察者”),无论观察者是移动还是静止不动,无论测量工具上的数字有多大,它们都保持一致。

例如,假设测量一个足球场的长度(以尺为单位),然后再次以米为单位进行测量,测量的结果数字将改变,但是以可预测的方式。同样,两位摄影师从两个不同的有利位置拍摄对象的照片会产生不同的图像,但是这些图像可以彼此关联。(banq注:虽然视角不同,但是同一个事物,盲人摸象摸的部位不同,但是摸的是同一头大象)。

量规等方差可确保物理学家的现实模型保持一致,无论他们的观点或测量单位如何。规范卷积神经网络CNN对数据也是做出了相同的假设。

神经网络在2D图像识别方面如此有效。此过程称为“卷积”,它使用神经网络中一层对输入数据的执行数学运算,然后将结果传递到神经网络中的下一层。可以将卷积视为滑动窗口,卷积神经网络将许多这些“窗口”滑动到数据上,像一种滤镜,每一个滤镜都旨在检测数据中的某种模式,如果是猫照片,经过训练的CNN可能会使用滤镜来检测原始输入像素中的低级特征,例如边缘形状。这些特征将传递到网络中的其他层,其他卷积会提取其他更高层的特征,例如眼睛,尾巴或三角形的耳朵。接受过识别猫的CNN最终将使用这些分层卷积的结果为整个图像分配标签:这是猫或不是猫(banq注:将盲人摸得耳朵 鼻子 尾巴拼图在一起)。

但是这种方法只适合平面数据,当被分析得表面不是平面,数据变成弯曲时就会遇到麻烦。

在曲面上进行卷积(在几何学上称为流形),就像在地球仪前面拿着一小块半透明的方格纸,然后试图准确地追踪某个大陆的海岸线。前提是不能在让纸张起皱的情况下将正方形纸按在这块高低不平的大陆上,因为,如果纸张变皱后测量到了的大陆海岸线,在纸张再次被放平时,通过这张纸测量的图形将会变形。

Bronstein和他的合作者在2015年找到了解决非欧氏流形上的卷积问题的一种解决方案,方法是将滑动窗口重新想象成更像是圆形蜘蛛网而不是一张平面方格纸的形状,这样您就可以将其压向地球(或任何弯曲的表面),而不会使窗口测量工具本身起皱、弯曲、拉伸或撕裂。

以这种方式改变滑动滤波器的属性使CNN更好地“理解”某些几何关系。例如,网络可以自动识别出弯曲成两个不同姿势的3D形状是同一对象的两个实例,而不是两个完全不同类型的对象。这一变化也使神经网络的学习效率大大提高。

衡量机器学习算法好坏的标准是训练神经网络所需的数据示例越少越好,数据效率,如何用比通常需要的数千或数百万个更少的示例来训练神经网络。深度学习方法是非常缓慢的学习者,如果您正在训练CNN来识别猫(互联网提供了有无数的猫图像),那么这几乎没有问题。但是,如果您希望网络检测到更重要的内容(例如肺组织图像中的癌性结节),则必须找到足够的训练数据。

提高神经网络数据效率的一种方法是预先为数据设定某些假设前提,例如,即使肺肿瘤在内部旋转或反射,它仍然是肺肿瘤。卷积网络必须通过在不同方向上训练相同模​​式的许多示例来从头开始学习此信息。

2016年,Cohen和Welling合著了一篇论文,定义了如何将其中的一些假设编码为几何对称的神经网络。这种方法行之有效,以至于到2018年,Cohen和合著者Marysia Winkels进一步推广了该方法,证明了令人鼓舞的结果 CT扫描中识别肺癌的方法:他们的神经网络仅使用训练其他网络所用数据的十分之一即可识别出该疾病的视觉证据。

阿姆斯特丹的研究人员不断推广这种几何对称的假设,这就是他们找到测量等方差的方式。(banq注:不管以米单位测量还是用以尺为单位测量,每个刻度之间距离是一样的,几何上对称的。)

更多点击标题进入。

 

                   

1
猜你喜欢