新药研发告别盲筛:主动学习 + 转录组扰动=13倍命中率飙升


我们证明,主动学习 + 转录组扰动可以指导下一步运行哪些实验,从而将表型命中率>提高 13 倍。人工智能不仅能预测生物,还能设计生物。

未来的新药研发可能不再靠“大海捞针”,而是靠AI精准“钓鱼”?这项研究彻底颠覆了传统药物筛选的方式——它用一种叫“主动深度学习”的智能算法,把找药效率直接拉高了13到17倍!

先说说背景。药物研发最头疼的问题之一,就是化学空间太大了。全世界可能有上亿种化合物,但真正能治病的可能只有几十个。传统做法是随机筛、大批量试,不仅烧钱,还特别慢。更麻烦的是,很多疾病不是单个基因出问题,而是整个细胞状态、基因表达网络都乱了——这种复杂表型,光靠老办法根本抓不住。

于是,科学家们开始尝试用AI帮忙。但早期的AI模型要么只能干一件事(单任务模型),换个病就废了;要么靠一些经验性的基因指标瞎猜,没法优化。结果就是:听起来高大上,实际命中率还是低得可怜。

这次的研究团队彻底改变了游戏规则。他们搞出了一套“主动深度学习框架”——啥意思?就是AI不是被动地看数据,而是会主动问:“接下来我该试哪个化合物最有可能成功?”它一边看细胞在药物处理后的转录组扰动数据(也就是RNA层面的基因活动变化),一边用深度学习预测哪些分子能诱导出我们想要的细胞表型,比如让癌细胞停止增殖、让免疫细胞恢复活力。

最关键的是,这套系统有个“实验室闭环反馈”机制。AI推荐一批化合物,实验室马上测试,结果立刻回传给AI,AI再根据新数据调整下一轮推荐。这就像是一个超级聪明的实习生,越干越懂行,越筛越精准。

研究团队在两个血液系统疾病的药物发现项目中实测了这套方法。结果惊人:相比传统随机筛选,他们的AI框架把“表型命中率”——也就是真正能引发目标细胞变化的化合物比例——提升了13到17倍!更绝的是,他们还加了一个“实验室内循环的特征优化步骤”,相当于让AI和实验员手拉手一起调参,命中率又翻了一倍,同时还获得了更深入的分子机制洞察。

这里得提一下“转录组扰动”这个概念。简单说,就是给细胞吃一个化合物,然后看它里面成千上万个基因的RNA表达怎么变。这种高维数据就像细胞的“表情包”,能真实反映药物对细胞整体状态的影响。传统方法只看一两个靶点,容易漏掉好药;而AI看的是整张“脸”,自然更准。

这项研究的主导者来自Recursion Pharmaceuticals——一家把AI和自动化实验室深度结合的生物技术公司。团队核心成员包括生物信息学家、机器学习专家和药物化学家,他们长期致力于用数据驱动的方式重塑药物发现流程。Recursion的CEO Chris Gibson本身就是计算生物学出身,坚信“生物学可计算、可编程”,公司已用类似方法推进多个罕见病和肿瘤项目进入临床阶段。

值得一提的是,这种“主动学习+实验室闭环”的模式,不只是快,还特别省。传统高通量筛选动辄测试几十万化合物,成本高到吓人;而AI先筛出几百个高潜力候选,实验室只用验证一小部分,资源利用率飙升。对于那些资金有限但创意满满的中小型药企或学术实验室来说,简直是福音。

更重要的是,这个框架是通用的。今天能用于血液病,明天就能迁移到神经退行性疾病、代谢病甚至抗衰老领域。只要能定义清楚你想要的细胞表型,AI就能帮你找药。这意味着,未来药物研发可能从“靶点驱动”全面转向“表型驱动”——不再执着于某个蛋白是不是被抑制了,而是直接看细胞有没有变健康。

当然,挑战依然存在。比如如何定义“理想表型”?不同疾病、不同细胞类型需要不同的转录组特征模板。还有实验噪声、批次效应这些技术细节,都会影响AI判断。但这项研究已经证明:只要把深度学习、主动学习和湿实验紧密结合,就能在浩瀚的化学宇宙中,精准定位那几颗救命的星星。

总结一下:

研究团队开发出一种主动深度学习框架,结合转录组扰动数据与实验室闭环反馈,将表型药物筛选命中率提升13–17倍,并通过特征优化再翻倍,显著加速复杂疾病药物发现。

这项工作不只是技术突破,更是一种范式转移。它告诉我们:AI不是取代科学家,而是成为科学家最聪明的实验搭档。当算法学会“思考下一步该做什么”,药物发现就从碰运气变成了有策略的探索。