长寿入门 :表观遗传时钟


表观遗传时钟与长寿有着奇怪的关联。对于许多人来说,这是他们第一次接触衰老领域——也许是偶然发现许多公司提供试剂盒来发现你的“真实生物年龄”。

在本文中,我将深入探讨史蒂夫·霍瓦斯 (Steve Horvath) 于 2013 年完成的人体组织和细胞类型的 DNA 甲基化年龄研究,因为这是迄今为止该领域最著名的研究。这项研究并没有描述第一个衰老时钟,甚至也不是第一个表观遗传时钟,但它为之后的每一项衰老生物标志物研究定下了基调。它涉及衰老、癌症、猴子、干细胞、表观遗传学、突变等诸多领域。 

表观遗传时钟是什么?
这里需要了解两个概念——表观遗传学和机器学习。

表观遗传学是细胞用来判断哪些 DNA 应该转化为 RNA 的信息层。

  • DNA-->RNA

表观遗传学有很多“类型”:从改变基因在细胞核中的位置到改变基因组的紧密度。

  • 就表观遗传时钟而言:我们关心的类型是编码 DNA 的碱基对的化学变化,特别是胞嘧啶的化学变化。

在胞嘧啶上添加一个额外的碳和三个氢(称为“甲基化”)有什么作用?

这非常复杂,与具体情况有关,远远超出了本文的范围。但表观遗传时钟是建立在对数十万个胞嘧啶碱基对及其甲基化状态的调查之上的。在这数十万个碱基对中(以后我将称之为“位点”),我们选择了几百个碱基对来实际预测一个人的年龄。

这几百个是如何选出来的呢?使用一种称为“弹性网络”的算法。弹性网络算法会显示来自几千人的数十万个潜在甲基化位点及其年龄(训练集),然后要求预测另外几千人的年龄(测试集)。

  • 一方面,它非常简单明了 - 它基于线性回归,这意味着年龄预测实际上只是将每个位点相加,乘以甲基化位点的比例和一些因子。
  • 另一方面,算法如何知道在数百个位点中哪一组可以用来预测年龄,哪一组不可以用来预测年龄?这个问题不清楚,而且是半随机的。

个经常被忽视的技术细节是,时钟不是从单个细胞中学习信息,而是从数十万个可能由数十种细胞类型组成的细胞中学习信息——这些细胞类型的比例会随着年龄和疾病而变化。

表观遗传时钟在预测年龄方面确实非常有效
事实证明,大多数位点的 DNA 甲基化都会随着年龄的增长而呈线性变化,尤其是在发育之后。表观遗传时钟也是使用非线性模型开发的,它们的预测准确性与线性算法的预测准确性相比并没有好很多。

这是表观遗传时钟领域的一项重要发现,表明与其他生物标志物相比,表观遗传时钟正在追踪更接近衰老根本原因的东西。但这与论文有点偏离。

还有其他一些有趣的发现。胚胎干细胞的表观遗传年龄非常年轻,被诱导成为多能干细胞的细胞也是如此
如果你让这些细胞分裂几十次,它们的表观遗传年龄就会开始增加。

表观遗传年龄预测与基因组不稳定性有关,并引用了年龄加速和癌症突变数量之间的负相关关系作为证据

突变较多的癌症看起来越来越不像模型所训练的正常人类细胞,因此它们的预测年龄变得更加不可预测。

DNA 甲基化位点非常吸引人,因为表观基因组中嵌入的信息足以预测年龄,误差不超过实际年龄的两年。

对我来说,令人兴奋的是,表观遗传时钟可能比迄今为止发现的任何其他生物标记更接近衰老的根本原因。这是一个细胞标记,这表明衰老首先以细胞内在的方式发生,然后才导致系统性破坏。