虽然标题不准确,只是在一项指标上得分高出 1% 并不意味着胜过之前发布的模型。
新的 AI 公司 Chai Discovery 发布了 Chai-1,这是一种最先进的多模态基础模型,用于预测蛋白质、小分子、DNA 和 RNA 等生物分子的结构:
- Chai-1是第一个能够仅使用单序列(无需MSA搜索)预测多聚体结构的模型,达到AlphaFold-Multimer级别的质量。
- 基本上复制了 AlphaFold 所用的方法,但随后又加入了输入语言嵌入的能力。
- Chai-1还可以通过新数据(例如实验室衍生的限制条件)进行提示,从而显著提升性能。
- 模型权重和推理代码作为软件库发布,供非商业使用。
该模型在与药物发现相关的各种任务中表现出色,包括:
- 在 PoseBusters 基准测试中取得 77% 的成功率,优于 AlphaFold3 (76%)
- 在 CASP15 蛋白质单体结构预测集上,Cα LDDT 达到 0.849,超过 ESM3-98B(0.801)
- 仅使用单个序列即可比 AlphaFold-Multimer (67.7%) 更准确地折叠多聚体 (69.8%),而无需进行多重序列比对 (MSA)
Chai-1 背后的团队来自领先的人工智能和药物研发公司,在推动生物人工智能研究方面拥有丰富的经验,并帮助推进了十多个药物项目。
- 公司的更大使命是,通过构建 AI 基础模型,预测和重新编程生化分子(生命的基本组成部分)之间的相互作用,将生物学从科学转变为工程
网友:
1、生物知识的民主化可能带来安全隐患
2、对于生物黑客来说,使用这些模型开发新型蛋白质很容易:训练 PLM 生成蛋白质,用 AF3 验证,然后将其发送到实验室。