什么是山中因子?
山中因子(Yamanaka factors)指的是四种特定的转录因子蛋白质:OCT4、SOX2、KLF4 和 c-MYC,简称 OSKM。
它们由日本科学家 山中伸弥(Shinya Yamanaka) 在 2006 年首次提出。他发现,只要在普通的体细胞(比如皮肤细胞)中引入这四个基因,就能“重置”细胞,让它们回到类似胚胎干细胞的状态,这类细胞被称为 诱导多能干细胞(iPSC)。
山中因子的发现让细胞重编程成为可能,这一成就为山中伸弥赢得了 2012 年诺贝尔生理学或医学奖。
不过,山中因子也有一些缺点:
- 效率低:通常不到 0.1% 的细胞能成功被重编程。
- 过程慢:转化需要数周时间。
- 风险性:其中 c-MYC 本身是致癌基因,应用在临床上需要非常谨慎。
人工智能进入生命科学
在人工智能与生命科学的交汇处,OpenAI 与长寿生物技术公司 Retro Bio 的合作,展示了一幅极具前景的画面:AI 不再只是文本和代码的工具,它正在实实在在地改变我们对细胞、蛋白质乃至衰老机制的理解与操控。
在传统印象里,生命科学尤其是生物实验,似乎总是以实验室里的一管试剂、一块培养皿开始,依赖漫长的试错与积累。然而,这种方式效率极低。比如要优化某个蛋白质,科学家往往需要测试成千上万的突变体,才能找到几个有意义的改良。对于像 SOX2 或 KLF4 这种上百个氨基酸的复杂蛋白,其潜在变体数量甚至接近天文级别。人工手段几乎不可能全面探索。
AI 的价值在于,它能处理远超人类直觉范围的大规模组合空间。通过训练在大量蛋白质序列和结构数据上,它不仅能“读懂”蛋白质的逻辑,还能预测某些修改是否可能带来更优的功能。
正因如此,OpenAI 与 Retro Bio 联手,专门为蛋白质工程打造了一个微型模型 GPT-4 b micro,让它不仅懂语言,更懂生物。
这不是一个通用的聊天模型,而是一个在蛋白质数据集上深度训练的专用版本。不同于常见的蛋白质语言模型,GPT-4 b micro 额外引入了关于蛋白质功能、进化关系和三维结构的丰富上下文。这意味着它在生成新序列时,并不是盲目“拼字”,而是带着进化和功能信息的“合理猜测”。
更重要的是,GPT-4 b micro 可以处理高达 64,000 个 token 的上下文,这在蛋白质模型中属于首创。对研究者而言,这就像是给了一个记忆力极强、背景知识极为广博的“实验助手”。它不仅能生成变体,还能根据复杂的设计目标进行灵活调控。
AI 如何帮助优化山中因子?
山中伸弥因发现 OSKM 四因子(OCT4、SOX2、KLF4、MYC)能把成体细胞重编程为诱导多能干细胞(iPSC),而获得诺贝尔奖。但这些因子的效率极低,转化率不到 0.1%,而且周期漫长,更别说在老年或病变细胞中的表现。
Retro 的科学家们先搭建了一个实验筛选平台,以人类成纤维细胞为基础,验证了基线的 OSKM 组合。随后,他们把任务交给 GPT-4 b micro:请它提出一批全新的 SOX2 和 KLF4 变体。结果令人惊讶:超过 30% 的模型建议变体在多能性标记表达上优于天然 SOX2,远高于传统筛选常见的 10% 以下命中率。而且这些变体和原型的氨基酸差异超过百位,这说明模型不是小修小补,而是真正探索了全新的序列空间。
当最佳的 RetroSOX 和 RetroKLF 搭配使用时,干细胞重编程效率显著提升:早期标记和晚期标记都更快、更强烈地出现,甚至提前数天出现多能性特征。
实验进一步用 mRNA 传递方式和不同类型细胞(例如来自中老年供体的 MSCs)重复验证,仍然获得了 30% 以上的高效率转化,远超传统方法。
除了提高重编程效率,研究团队还考察了这些新因子是否能改善细胞衰老的典型指标——DNA 损伤。
在实验中,RetroSOX/KLF 组合的细胞表现出更低的 γ-H2AX 信号,说明 DNA 双链断裂更少。这意味着这些 AI 设计的蛋白质不只是“快”,还可能在本质上改善细胞功能,具备更强的复壮潜力。
这对未来的应用价值极大。因为干细胞疗法、抗衰老治疗都需要依赖细胞的基因组稳定性和修复能力。若能通过 AI 设计的因子同时解决效率与稳定性问题,将为再生医学打开更广阔的可能。
对 OpenAI 来说,这次合作不仅是展示 AI 能力的案例,更是一个范式的转变信号。过去,科学研究往往依赖逐步积累,验证一个假设可能需要数年时间。而在 AI 的帮助下,问题解决的速度被压缩到了“天”的量级。
这意味着:
1. 专用模型的潜力:不像通用大模型,领域定制的 AI 可以在极细分的问题上爆发巨大价值。
2. 科研流程的加速:AI 不只是“加快分析”,它直接影响了实验设计、结果验证和理论探索的效率。
3. 生命科学的新范式:如果 AI 能持续在蛋白质工程、基因编辑、药物设计中展现类似优势,我们可能正在见证一个“计算先行—实验验证”的新时代。
Retro 与 OpenAI 的这次实验仅仅是一个起点。更高效的因子意味着更便捷的 iPSC 生成,更强的 DNA 修复潜力意味着更可靠的细胞治疗。这些进展有望推动再生医学、抗衰老研究和疾病建模更快进入临床应用。
正如 OpenAI 研究伙伴负责人 Boris Power 所说:“当研究人员将深厚的领域知识与我们的语言模型工具结合时,那些原本需要数年才能完成的研究,可能只需要几天。”未来,当越来越多的科学家与 AI 合作,我们或许将迎来生命科学的加速时代。
Retro Biosciences(简称 Retro)
Retro是一家专注于 长寿科学(Longevity Science) 的生物科技公司,成立于 2021 年。它的目标很直接:让人类平均健康寿命延长 10 年。Retro 不做单一疗法,而是押注在几条最有潜力的方向上:
- 细胞重编程(让衰老细胞恢复年轻状态);
- 细胞疗法(例如利用间充质干细胞修复损伤组织);
- 血浆相关疗法(探索血液环境对衰老的影响)。
山姆奥特曼(OpenAI CEO,同时也是投资人)在 2022 年左右向 Retro 投入了 1.8 亿美元,这几乎是 Retro 当时最核心的一笔资金。
如果 AGI 能够帮助解决科研瓶颈,那么最大的受益领域之一一定是生命科学,Retro 刚好就是这种理念的实验场。