NewLimit公司最新吹上天的AI模型,号称能预测被“折腾”过的细胞会变成啥鬼样子。
首先,想象一下你身体里有40万亿个细胞,每个细胞都拿着同一份DNA说明书,却偏要演成不同角色:有的当皮肤,有的当神经,还有的……嗯,可能正在你鼻子里策划一场喷嚏。为啥?因为有种叫“表观遗传”的玩意儿在暗箱操作——就像班主任偷偷给某些同学塞小纸条:“你,去当学霸!你,去当摆烂王!”
现在,一群穿着白大褂的科学怪人跳出来说:“我们能当‘细胞班主任’!”他们的秘密武器是1到6个叫“转录因子”的蛋白质小特务(简称TF)。只要把这几个TF扔进细胞里,老细胞就能返老还童,皮肤细胞也能秒变神经——听起来是不是像“用橡皮泥捏个新手机”那么离谱?
但问题来了:TF的组合比数学考试的选择题还多,银河系星星看了都得喊“卷不动”!
更惨的是,以前的实验就像用牙签搅太平洋——最多测1000种组合,还沾沾自喜。而现在的预测模型?呵,准确率跟“蒙眼扔飞镖扎气球”差不多,气球没炸就算赢。
于是NewLimit祭出了他们的“大杀器”——Ambrosia系统。名字听着像希腊神话的仙馐,实际上就是……
1. 让AI狂背蛋白质界的“黑话词典”(相当于给AI灌了500吨八卦杂志);
2. 用比别人多10倍的实验数据训练(其实多出来的9倍是实验室里泡发的烂细胞);
3. 开发了一个“瞎蒙采样”算法(MCMC:Monte Carlo Magic Circle,翻译过来就是“蒙的卡罗魔法圈”)。
看他们的PPT!数据曲线陡峭得能当滑梯,但纵坐标偷偷截了下半截——就像考试排名只公布前10名,后面全是“等200人”。他们还宣称:
- 细胞返老还童预测“暴涨”2%(从38%到40%,四舍五入就是“革命性突破”);
- 基因表达误差“暴跌”(误差从“能塞下一辆公交”变成“能塞下一辆Smart”);
- 干细胞制造成功率“爆表”(但小字备注:仅限周二下午、晴天、实验室WiFi信号满格时)。
最后,NewLimit的CEO在发布会上邪魅一笑:“我们的AI告诉我们,只要再烧10个亿,就能让细胞改行当‘变形金刚’!”——台下的投资人纷纷鼓掌,而细胞们在培养皿里瑟瑟发抖:“求求你们,别再让我当谜语人了!”
Ambrosia系统具体怎么工作的?
1. 先让 AI 背完“八卦黑话”
把几百万条蛋白质序列、结构、功能当八卦杂志扔给 AI,让它背下来,学会“蛋白质语”。这一步相当于给 AI 灌了一本《江湖黑话大全》,以后它看到任何 TF(转录因子)组合,都能秒懂:“哦,这几个家伙凑一起,八成是要让细胞去当神经。”
2. 用“代理老师”+“抢答器”挑下一轮实验
真正干活用的是“贝叶斯优化”——你可以想象成班里有两个小助手:
• 代理老师(高斯过程 GP)先根据现有成绩,给每种 TF 组合打一个“预期分数”和“不确定度”。
• 抢答器(采集函数,比如 EI 或 UCB)专门挑“可能分数高、但还不确定”的题目,让实验猿去做。这样就不用把银河系所有组合都试一遍,而是用最少实验次数,最快摸到高分区 。
3. 实验数据回流,继续“喂八卦”
每做一轮实验,新的细胞状态结果又扔回 AI 嘴里。AI 再啃一遍,更新自己的“八卦库”,下一轮预测就更准。数据越多,嘴越毒,预测越狠——这就是他们说的“主动学习”:边做实验边改剧本,省时省钱还显得特别高科技。
一句话总结:
Ambrosia 就是“背八卦+猜考题+改剧本”的循环赛,用最少实验,把最可能成功的 TF 组合筛出来。