谷歌DeepMind祭出蛋白质设计新AI,有望攻克癌症!蛋白亲和力暴增300倍

  新智元报道

  编辑:编辑部

  今天,DeepMind 又发布了 Alpha 模型家族的新成员,堪称是「专精版」的 AlphaFold,专注于设计蛋白质结合剂,将大幅减少所需的实验室工作,提升开发效率。

  DeepMind「阿尔法」家族,再迎新贵。

  谷歌开发者负责人 Logan 昨日的一句话,勾起了全网好奇心。

  「如果你认为 AI 进展正在放缓,那就说明,你并没有密切关注它」。谷歌究竟有着什么大事,等着我们?

  刚好今天,谷歌 DeepMind 祭出了 AI 设计蛋白的新模型——AlphaProteo,再次在 AI 圈里掀起海啸级地震。

  它可以为不同的目标蛋白,设计新的蛋白结合剂,能够为癌症、糖尿病并发症相关的 VEGF-A。

  这也是,AI 工具首次能够为 VEGF-A,设计出成功的蛋白结合剂。

  在 7 种靶标蛋白测试中,AlphaProteo 比现有的方法,实现了3-300 倍的蛋白结合亲和力。

  它还大幅提升了研究效率,将实验室数年工作,压缩至几天甚至是几周之内。

  AlphaProteo 的意义在于,可以预防病毒感染,设计抗癌,等各种治愈疾病的药物。

  通过蛋白结合剂紧密附着在「病毒」、「癌细胞」上,阻止它们之间的信号传递,扰乱其功能,最终走向死亡。

  网友们纷纷感慨道,AI+ 生物学又一次突破,对于挽救人类生命来说意义重大。真不知道,医疗保健在未来5-10 年,会是什么样子?

  在 AI4Science 上,谷歌 DeepMind 只会投入更多。

  「阿尔法」家族的进阶

  AF3 的诞生,意味着将会开启更多变革性的科学研究,比如基因组学研究、加速药物设计、新材料开发、培育作物等等。

  要知道,2020 年发布的 AlphaFold 2 已经引起了科学界的轰动。

  由于在蛋白质结构预测上取得了根本突破,全球目前有数百万研究人员使用 AF2 来研制疫苗、治疗癌症或设计蛋白酶。

  而走出「蛋白质世界」,能够预测所有生物分子的 AF3,预计会给各领域的科学发现带来更大的变革。

  尽管 AlphaFold 系列模型已经取得了这些成就,团队领导人 John Jumper 还是经常被「催更」。

  比如,有人希望扩展 AlphaFold 的预测功能,直接针对能改变蛋白质功能的修饰,让模型更好地辅助药物设计、疾病理解等领域。

  虽然 Jumper 在采访中经常表示「很无奈、做不到」,但 DeepMind 显然看到了这一层需求。

  最新发布的模型 AlphaProteo,就是瞄准了这些领域的实际应用,旨在设计出能成功结合目标分子的蛋白质。

  博客地址:https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/

  学习蛋白质的相互结合

  从细胞生长到免疫反应,人体的每一个生物过程都依赖于蛋白质的之间的相互作用。

  蛋白质的结合具有一个重要性质——特异性,就像钥匙和锁。「锁齿」对不上,蛋白质就无法结合并发挥作用。

  关于这类过程的原理和机制,AlphaFold 等结构预测工具可以为我们提供很多见解,但还不能创造出新的蛋白质来直接操纵这些相互作用。

  想创造出能结合目标分子的蛋白质,这项工作目前还只能交给科学家完成。

  这类「蛋白质结合剂」可以加速许多领域研究的进展,包括药物开发、细胞和组织成像、疾病理解和诊断,甚至是提升作物抗虫性。

  尽管机器学习方法在蛋白质设计方面取得了重大进展,但这一过程仍然繁琐且复杂,传统方法耗时费力。

  不仅设计过程本身难度很大,需要多轮的广泛实验测试;结合剂被成功制造出来之后,还需要进行额外的实验来优化结合亲和力,以便能和目标蛋白结合得足够紧密、发挥作用。

  而今天推出的 AlphaProteo 就是专门用于设计高强度蛋白质结合剂, 有助于药物发现、开发生物传感器等应用

  实验发现,AlphaProteo 适用于多种目标蛋白,比如与癌症和糖尿病并发症相关的 VEGF-A,这是 AI 工具首次为 VEGF-A 成功设计出蛋白结合剂。

  此外,在测试的其他 7 种目标蛋白上,相比之前的最佳方法,AlphaProteo 的实验成功率更高,且蛋白质的结合亲和力有3~300 倍的提升。

  团队同时放出了一篇论文,详细介绍了湿实验的流程与验证结果。

  论文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/Protein_Design_White_Paper_2024.pdf

  AlphaProteo 的训练数据包括 Protein Data Bank(PDB)和 AlphaFold 生成的超过 1 亿个预测结构。

  通过训练,AlphaProteo 学习到了蛋白质分子相互结合的方式。给定目标分子的结构以及优先结合位点,模型就能生成在相应位点结合的候选蛋白质。

  预测的蛋白结合剂与目标蛋白质相互作用的示意图,蓝色部分为 AlphaProteo 生成的蛋白结合剂结构,黄色部分为目标蛋白质,即 SARS-CoV-2 刺突受体结合域

  但遗憾的是,博客和文章都没有提到 AlphaProteo 的模型架构或具体训练方法,目前也没有放出代码或模型权重。

  成功结合关键蛋白

  为了测试 AlphaProteo,团队在 7 种目标蛋白质上进行了测试,包括:

  - 2 种与感染有关的病毒蛋白:BHRF1 和 SARS-CoV-2 刺突蛋白受体结合域 SC2RBD

  - 5 种与癌症、炎症和自身免疫性疾病有关的蛋白质:IL-7Rɑ、PD-L1、TrkA、IL-17A 和 VEGF-A

  结果显示,AlphaProteo 具有极高的结合成功率和同类最佳的结合强度。

  它成功地在计算机模拟中生成了候选蛋白质,并在实验中实现了与目标蛋白质的紧密结合。

  AlphaProteo 为以上 7 种蛋白质生成了结合剂,蓝色是在湿实验室中测试的结合剂示例,黄色部分是目标蛋白质,深黄色部分突出显示了预期的结合区域

  对于病毒蛋白 BHRF1,候选分子成功结合的比例高达 88%,比现有的最佳设计方法高出 10 倍。

  候选蛋白的结合成功率提高,意味着需要更少的测试,就能找到成功的结合剂,可以大大缩短实验周期,降低研发成本。

  AlphaProteo 对 7 个目标蛋白质的输出结果在体外实验中的成功率

  对于另一个目标蛋白 TrkA,AlphaProteo 设计出的结合剂甚至胜过了先前最佳的、经过多轮实验优化的结合剂。

  在没有实验优化的情况下,AlphaProteo 对 7 个目标蛋白质设计结果的最佳亲和力,较低的亲和力意味着与目标蛋白结合得更紧密

  验证结果

  除了自己开展的实验,DeepMind 还邀请了英国王牌研究中心、欧洲最大的生物医学研究机构——弗朗西斯·克里克研究所(Francis Crick Institute)来进行验证。

  在不同的实验中,团队更深入地研究了两种目标蛋白,SC2RBD 和 VEGF-A 的结合剂。

  结果显示,这些结合剂的结合相互作用确实与 AlphaProteo 的预测相似,并且具备有效的生物功能。

  例如,SC2RBD 的蛋白结合剂被证明可以阻止 SARS-CoV-2 及其部分变种对细胞的感染。

  然而,由于 AI 的局限性,AlphaProteo 对一种目标蛋白无能为例,即与类风湿性关节炎等自身免疫性疾病相关的 TNFɑ。

  但值得注意的是,计算分析显示针对 TNFɑ设计结合剂极具挑战性,而这也是 DeepMind 用它来进行测试的原因。

  通常来说,实现强结合只是设计蛋白质结合剂的第一步,在研究和开发过程中还有许多生物工程障碍需要克服。

  而 AlphaProteo 可以大幅减少初步实验所需的时间,并适用于广泛的应用。

  蛋白设计是一项快速发展的技术,在多个领域都具有很大的科学潜力,比如理解疾病的致病因素、在病毒爆发中加速诊断测试的开发、支持可持续的制造工艺,甚至清除环境污染物等方面。

  DeepMind 提出,未来不仅会与学界合作,利用 AlphaProteo 解决具有影响力的生物学问题并了解其局限性,而且还会和 Isomorphic Labs 合作,探索药物设计方面的应用。

  同时,团队还将将继续提高 AlphaProteo 算法的成功率和亲和力,扩大其可以解决的设计问题范围,并与机器学习、结构生物学、生物化学和其他学科的研究人员合作,开发出负责任且更全面的蛋白设计方案。

  参考资料:

  https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/