AlphaFold 3把“蛋白—配体/核酸/化学修饰复合体”也算出来了:这篇Nature论文到底更新了什么?

AlphaFold 3把“蛋白—配体/核酸/化学修饰复合体”也算出来了:这篇Nature论文到底更新了什么?

一、从 AlphaFold 2 到 AlphaFold 3:质变的一步

 

2020 年,DeepMind 发布 AlphaFold 2(AF 2),在 CASP14 大赛上“碾压”对手,将蛋白质结构预测精度推进到接近实验水平,被《Nature》称为“生物学的登月时刻”。然而,AF 2 有一个核心限制:它只能预测单一蛋白,或者在改进版 Multimer 下预测蛋白-蛋白复合物,却无法系统性地处理蛋白与 DNA、RNA、小分子药物、金属离子或翻译后修饰的结合状态。这让它难以真正进入药物研发一线。

 

2024 年 5 月,《Nature》在线发表 AlphaFold 3(AF 3) 的论文与技术解读,正式宣布:这一代模型把所有主要生命分子(蛋白质、核酸、小分子配体、化学修饰、金属离子等)统合到同一框架下,可以预测它们的复合结构。这不仅是精度上的提升,更是预测范围和应用场景上的拓展。

 

二、技术突破:从 Evoformer 到 Diffusion

 

AF 3 的架构与 AF 2 相比有两大核心变化:

 

统一分子表示

在 AF 3 中,所有分子(蛋白、DNA、RNA、小分子、化学修饰)都被转化为图模型节点。这样,系统可以以相同的形式处理氨基酸残基、核苷酸、配体原子,实现跨模态的交互预测。

 

引入扩散模型(Diffusion-based generative model)

与图像生成类似,AF 3 从一个“原子云”随机状态出发,通过扩散过程逐步收敛,得到高置信度的三维结构。这一方法显著改善了复杂体系中原子排列的合理性,使蛋白-配体、蛋白-核酸的结合模式更加接近实验值。

 

这一代模型不再依赖单一的“进化协同信号(MSA)”,而是引入多模态约束,结合已有复合物数据库进行训练,从而支持预测多种分子间作用。

 

三、性能评估:比专业工具还准?

 

在论文中,DeepMind 团队给出了系统性评测结果:

 

蛋白-配体结合

在 PoseBusters 和 PDBbind 等基准测试中,AF 3 的结合位点预测准确率显著超过当前常用的分子对接软件(如 AutoDock Vina)。有些类别的预测准确度提升接近 2 倍。

 

蛋白-核酸相互作用

AF 3 在 DNA-结合蛋白、RNA-结合蛋白上的预测,整体得分远高于传统核酸对接工具,能够更清晰地给出特异性识别的碱基位点。

 

抗原-抗体复合物

相较于 AF-Multimer,AF 3 对抗体-抗原结合位点的预测精度显著提高,尤其在重链-轻链互作以及抗体环区构象上更为可靠。

 

翻译后修饰

AF 3 还可预测蛋白质上的翻译后修饰(如糖基化)在三维结构中的具体位置与空间构象,这是 AF 2 完全无法覆盖的领域。

 

一句话总结:AF 3 不仅扩展了预测范围,还在精度上全面超越现有专业工具。

 

四、科学界的独立验证

 

随着模型上线,多个独立研究小组快速开展了评测:

 

结合自由能预测

研究者使用 SKEMPI 2.0 数据库的 8338 个突变样本进行测试,AF 3 预测的复合体在自由能变化上的 Pearson 相关系数达 0.86,仅比实验结构低 0.02,表现极为接近。

 

应用于蛋白工程

部分实验室尝试用 AF 3 预测突变体对 DNA 结合的影响,结果显示 AF 3 能较好区分结合力强弱的趋势,但对高柔性区域仍有误差。

 

与新兴替代模型对比

HelixFold-3、Chai-1 等模型也在 2024 年推出,部分指标可与 AF 3 相比,但普遍认为 AF 3 的预测稳定性和复合体覆盖范围仍是第一梯队。

 

这些独立测试验证了 AF 3 的可靠性,同时也揭示了动态构象预测不足和对不常见配体泛化能力有限的短板。

 

五、应用前景:科研与药物开发的双重革命

 

药物研发加速器

AF 3 能够高精度预测蛋白-小分子结合模式,意味着药物筛选可以更快找到潜在结合口袋,缩短实验验证周期,大幅降低成本。Isomorphic Labs 已与大型制药公司合作,将 AF 3 引入药物发现流程。

 

基因调控研究新工具

对蛋白-DNA、蛋白-RNA 复合体的预测,为理解转录因子-靶序列识别、CRISPR-Cas 与核酸互作等提供了全新工具,有助于基因编辑工具的优化。

 

抗体设计与疫苗开发

AF 3 提供的抗体-抗原复合物预测,可辅助 B 细胞表位设计,缩短疫苗和中和抗体研发路径。

 

基础科研普及化

AlphaFold Server(https://alphafoldserver.com

)已免费开放 AF 3,科研人员不必具备高性能计算资源,也能直接上传序列和分子结构进行预测,大大降低了技术门槛。

 

六、依然存在的挑战

 

无法捕捉分子动态性

分子在体内存在多种构象状态,AF 3 只能给出一个静态结构,无法模拟动态切换。

 

对固有无序区(IDRs)表现不佳

无序结构或低复杂度区的预测仍不可靠,这些区域在信号转导和调控中恰恰至关重要。

 

预测可能过于乐观

在某些蛋白-配体体系中,AF 3 给出高置信度评分,但实验验证发现并非真正结合状态,存在“虚假高分”的风险。

 

对未知配体泛化有限

模型依赖已有数据库训练,对新型化学骨架的小分子药物预测仍需谨慎。

 

七、结语:迈向“统一分子结构预测”

 

AlphaFold 3 的发布,被认为是继 AF 2 之后的又一次历史性飞跃。它不只是把单一蛋白的折叠问题解决,而是把生命科学中的多分子互作纳入了统一的预测框架。这意味着未来科研人员可能在实验之前,就能借助 AI 预测复杂的分子网络结构,从而更有针对性地设计实验与药物。

 

当然,AF 3 不是万能钥匙。它仍需要与实验数据相互印证,仍有动态、无序结构、未知配体等盲点。但不可否认的是,它正在推动结构生物学、药物研发和合成生物学进入一个AI 与实验深度融合的新时代。