与AlphaFold3持平!国产抗体设计生成式AI大模型发布

  百奥几何投稿

  量子位公众号 QbitAI

  AlphaFold3 引起的浪潮下,一个新的抗体设计生成式 AI 大模型浮出水面。

  名为GeoFlow,能够同时用于抗原-抗体复合物结构预测和抗体从头设计。

  例如,给定抗原结构和特定表位,GeoFlow 能够生成全新的抗体分子:

  △基于 GeoFlow 的抗体从头生成示意图

  在抗原-抗体复合物结构预测任务上,在由 66 个抗原-抗体复合物结构构成的测试集上,GeoFlow 的 Top-1 成功率达 43.9%,与 AlphaFold3 持平。

  GeoFlow 研发团队来自生成式 AI 驱动的蛋白质设计研发平台公司——百奥几何,百奥几何由 AI 药物发现科学家唐建博士于 2022 年创立,AI 三巨头之一、图灵奖获得者 Yoshua Bengio 担任首席科学顾问。

  GeoFlow 长啥样?

  近日,由 Google DeepMind 和 Isomorphic Labs 等团队开发的 AlphaFold3 登上 Nature,引发了业界广泛关注。

  与上一代方法相比,AlphaFold3 将预测的范围扩充到了几乎所有的生命分子以及它们之间的相互作用,是生成式 AI 在生命科学领域的又一重要里程碑。

  其模型的最大创新点之一,是用上了大火的生成式 AI 模型——扩散模型(AlphaFold 2 为判别式 AI 模型),直接生成每个原子的 3D 坐标。

  如果说传统的判别式 AI 是乐评人,可以对一首歌的节奏、风格、编曲进行识别和评价,那么生成式 AI 就是歌手,可以创作出新的作品。

  从评价数据到生成数据,AI 的应用场景得到了极大的拓展。例如,在结构预测场景中,生成式 AI 能更快地采样到更多的构象;在蛋白设计场景中,生成式 AI 能更高效地探索蛋白空间,设计具有预期功能的复杂蛋白分子。

  扩散生成模型早期主要用于图像生成(近期也被用于三维视频的生成,如 Sora)。

  百奥几何的核心团队,2021 年起将扩散模型用于分子的三维结构生成,曾发 GeoDiff 论文是 2022 年 AI 领域引用量排名前 50 的论文之一。

  基于前期技术积累,他们研发了最新的生成式 AI 抗体设计大模型 GeoFlow。

  GeoFlow 模型架构图如下:

  GeoFlow 基于几何深度学习架构和最新的流匹配生成模型(flow matching),能够同时用于:

  • 抗原-抗体复合物结构预测:输入抗原结构/序列以及完整的抗体序列,模型生成抗原-抗体复合物结构。
  • 抗体设计:输入抗原结构和抗体序列,待设计 CDR 区域以掩码表示,模型生成复合物结构以及 CDR 区域序列。

  在原子层面对抗原-抗体相互作用力进行建模是这两项任务的核心难点。

  与现有的 Transformer 架构不同,GeoFlow 采用了几何深度学习基础模型,能够更好地在三维空间上对原子-原子之间的关系进行建模。

  在生成模型选择上,GeoFlow 采用了最新的流匹配模型。与扩散生成模型相比,流匹配生成模型的训练和推理更高效,也更鲁棒。

  抗原抗体复合物结构预测媲美 AF3

  对于 GeoFlow 的性能,研究团队在抗原-抗体复合物结构预测任务上进行了测评。

  抗原-抗体复合物结构预测在抗体药物的发现中扮演着至关重要的角色。然而,无论是基于能量函数的传统方法(如 HDock 和 MOE),还是基于深度学习的预测模型(如 AlphaFold 2 Multimer),准确度目前都不太理想。

  在由 66 个抗原-抗体复合物结构(2023 年后发布的)构成的测试集上,GeoFlow 模型的Top-1 成功率(模型打分最高结构的 DockQ 水平为“Acceptable”以上则视为成功)达到了 43.9%,与 AlphaFold3 持平,大约是 AlphaFold2 Multimer 的两倍。

  △抗原-抗体复合物预测评测结果

  传统的分子对接方法尽管也能生成多个可能的结构,但打分准确率较低,实际应用的价值相当有限。

  △PDB 8BLQ(左)、8DOK(右)各模型预测结果对比

  与 AlphaFold3 相比,GeoFlow 不仅能够用于抗原-抗体复合物结构预测,还能够用于抗体的从头设计和优化。

  对于传统 AI 方法来说,大分子从头设计非常困难。主要原因是难以快速采样高质量的样本,只能通过判别模型从浩瀚的分子空间中评估大量低质量样本,这个过程如同大海捞针。

  生成式 AI 的出现为大分子设计带来了革命性的机遇。

  以 HER2 靶点为例,基于上市的抗体药物 Herceptin 的结合表位,研究团队利用 GeoFlow 生成了一个小的抗体库,然后再利用噬菌体库进行筛选。在得到的十条候选序列中:

  • 结合活性:6 个分子在 ELISA 实验中结合与 Herceptin 相当,达到纳摩尔水平,且 BLI 的结果显示 1 号和 3 号分子的亲和力相比 Herceptin 甚至有2-3 倍的提升。
  • 结合表位:竞争 ELISA 显示这 6 个分子的结合与 Herceptin 存在强竞争,推断其结合表位与 Herceptin 一致。

  上述结果展现了生成式 AI 在大分子从头设计领域的应用前景。

  关于百奥几何

  百奥几何是一家生成式 AI 驱动的蛋白质设计研发平台公司,由 AI 科学家唐建博士于 2022 年创立,AI 之父、图灵奖获得者 Yoshua Bengio 担任首席科学顾问。

  公司业务主要是通过打造 AIGC 大模型理解生命语言,搭建自然语言与蛋白质语言多模态大模型,重新构建蛋白质药物发现及设计过程,打造可编程的蛋白质,应用于生物医药和生物制造。

  百奥几何的生成式 AI 大模型,目前已覆盖了大分子设计、筛选和改造等环节,并开发了 GeoBiologics 一站式抗体发现平台。

  目前 GeoFlow 模型已开放,可用于抗原-抗体复合物结构预测的非商用测试,每周支持预测八个复合物,每个任务输入支持 1150 个氨基酸。

  测试地址:https://geobiologics-lite.biogeom.com/about