腾讯提出蛋白质研究AI模型,预测准确率刷新纪录,入选Nature子刊

  蛋白质相互作用(PPI)可以说是人体最重要的分子事件之一,事关人体生长发育、新陈代谢,是疾病治疗干预的重要来源,PPI 失调会导致癌症等疾病发生,因而该领域也是医药行业关注的研究热点。

  为了更好地预测和解读 PPI,并深入挖掘相关分子信息,2023 年 3 月,腾讯 AI Lab 联合香港科技大学、中国科学院大学相关团队,将深度学习领域的层次图学习技术引入 PPI 研究,提出了一种双视图层次图学习模型(HIGH-PPI),模型被证明在 PPI 研究中具有更高的预测准确性和更好的可解释性,研究成果在知名国际学术期刊《自然-通讯》(Nature Communications)发表。

  人类蛋白质组学数据分析表明,人体的 PPI 网络涉及约 65 万个相关接触位点。处理这样量级的数据,人工智能的效率要明显高于人类,相关技术引入可以更加高效、准确地帮助人们找出重要信息,促进靶向药物的开发和癌症等疾病的治疗。

腾讯提出蛋白质研究 AI 模型,预测准确率刷新纪录,入选 Nature 子刊

  图:蛋白质结构和网络结构都对 PPI 的准确预测至关重要。(a)蛋白质序列通常能提供关于 PPI 的细节信息,但它也可能导致 PPI 的预测准确性降低,例如不具备序列相似性的两个蛋白质(SERPINA1、3)可能和同一蛋白质(ELANE)在相同作用界面发生 PPI;(b)包含网络结构信息的 PPI,将蛋白质区分为不同的社区,社区内的蛋白质之间存在密集的交互,而社区之间通常只有微弱的连结;(c)HIGH-PPI 具备双视图层次,顶视图包含网络结构信息,底视图包含蛋白质结构信息。

  这项研究是腾讯 AI Lab 对 PPI 层次问题建模的首次尝试,得到了审稿人的高度评价,被视为生物信息领域一项富有潜力的创新贡献,文章也得到了学界的认可,被选入《自然-通讯》年度编辑精选文章合集。

  HIGH-PPI 模型是腾讯在 AI+ 生命科学研究领域的最新研究成果,此前,团队在蛋白质相关的药物发现领域已经取得诸多领先成果,发表多项关于蛋白质结构-功能关系研究的文章,如蛋白质高精度结构模型、疾病分类、蛋白动力学建模以及蛋白质组学数据等。

  长期以来,腾讯 AI Lab 致力于推动 AI 技术与各行业的结合,在研究与应用并重发展的策略下,腾讯 AI Lab 关注机器学习、计算机视觉、语音技术及自然语言处理四大方向,持续探索 AI 在工业、农业、医疗、医药、生命科学等领域的研究应用。