基于神经网络的Alpha Fold改变了生物世界

21-12-20 banq

使用深度学习和神经网络,称为 Alpha Fold 的算法有望彻底改变生物化学领域。

在过去的 50 年中,蛋白质折叠问题一直是一个持续的障碍。它首次出现在 1972 年:一个新理论提出,了解蛋白质的氨基酸序列应该可以让您完全预测其结构。

但是,单个蛋白质可以由多达 2,000 个氨基酸组成。确定它们所有可能的结构可能需要比整个宇宙的年龄更长的时间。这相当于大约 10³⁰⁰ 的可能性,这意味着一个能够预测蛋白质如何折叠的系统必须使用比简单的蛮力更优雅和精确的东西。

自从 1994 年称为蛋白质结构预测关键评估 (CASP) 的竞赛开始以来,没有任何参赛团队能够做出准确的预测。

去年,DeepMind 的 Alpha Fold 算法成为第一个做出越来越准确预测的算法。Alpha Fold 的预测在 2020 年的平均准确率超过 90%。该算法取得了惊人的进步,以至于对许多研究人员来说,蛋白质折叠问题基本上已经得到解决。

如同像 80 年代和 90 年代的计算机程序一样,Alpha Fold 的第一次迭代并不是很成功。其 2018 年对 CASP 的准确率低于 60%。直到 Alpha Fold 的第二次迭代,才在深度学习的帮助下取得了真正的进步。深度学习是一种模仿人类大脑可能行为方式的机器学习,使机器能够以比传统机器学习所需的少得多的人类输入进行学习。

由节点组成的神经网络构成了深度学习的支柱。神经网络中至少有 3 层节点:输入层、输出层和中间的隐藏层。数据在神经网络中的节点之间共享,然后机器做出预测,并可以对照数据集进行检查。训练数据有助于机器改进其预测。在 Alpha Fold 的深度学习网络的情况下,训练数据由来自蛋白质数据库的折叠蛋白质组成。此外,Alpha Fold 不是只有 1 个神经网络,而是有 2 个网络,它们相互协作以折叠蛋白质、渲染 3D 模型并在最后调整它们的氨基酸比对。

最终,Alpha Fold 解决蛋白质折叠问题的方法是使用机器来理解机器——毕竟,蛋白质只不过是被编程用来输送氧气、消化食物以及介于两者之间的一切的微型机器。这是对人工智能力量的惊人展示。

尽管目前尚不清楚有多少突破实际上会源于 Alpha Fold 算法的发布。它可能需要几十年的时间才能充分发挥其潜力,以许多意想不到的方式改变世界。

原文点击标题

 

banq个人观点:深度学习和神经网络来自于模拟大脑,不是真正数学模型,属于“仿生学”。 神经网络算法最初来自日本一位生物学家的业余爱好。

猜你喜欢