洞察市场格局
解锁药品研发情报

客服电话

400-9696-311
医药数据查询

诺奖解读 | AI蛋白质折叠奠基人许锦波:AI蛋白质技术抵达规模化应用临界点

2024/10/28
AI蛋白质


在刚刚过去的“诺奖周”,人工智能所带来的变革性力量受到了诺贝尔委员会的双重认可:物理学奖授予神经网络的先驱,化学奖授予研究和设计蛋白质的计算工具的开发者。


其中,诺贝尔化学奖一半授予 DeepMind 联合创始人兼首席执行官 Demis Hassabis 和该公司董事 John Jumper,以表彰他们利用人工智能预测蛋白质结构的工作;另一半则授予华盛顿大学生物化学教授 David Baker,以表彰他在计算蛋白质设计方面的工作。


毫无疑问,这是人工智能在科学领域的重大时刻。2024 年的诺奖强调了人工智能的重要性,以及当今科学如何跨越传统界限,融合不同领域以取得突破性成果。


“我认为这将极大推动相关领域的发展。在科学研究领域,AI 的作用日益重要,其正在改变生物学,而不仅仅是蛋白质研究。学术界和产业界都应该探索这一领域。”分子之心创始人、美国芝加哥大学丰田计算技术研究所教授、清华大学智能产业研究院(AIR)访问学者许锦波表示。


他被业界誉为“AI 蛋白质折叠奠基人”。早在 2016 年,许锦波就开发出新算法 RaptorX-Contact,首次证明了深度学习可以大幅度提高蛋白质结构预测的性能。


也正是这年秋天,许锦波召开了一个小型报告会,邀请了学界人士共同探讨研究成果。其中一位参会者正是 John Jumper。在听完许锦波报告后,后者全力转向深度学习方法,并在一两个月后加入 DeepMind。


AI 蛋白质结构预测的背后推手


蛋白质结构预测有“阳光下最难的问题”之称。


为了解决这个问题,马里兰大学细胞生物学和分子遗传学系教授 John Moult 创办了 CASP(国际蛋白质结构预测大赛)。


几十年来,无数科学家投身其中。途中,由于难以推进,也不乏抽身离开者。


多年竞逐中,优秀的领军人逐渐浮出水面。


1998 年举办的第三届 CASP 中,David Baker 用他的算法 Rosetta 一鸣惊人。但此后十余年,再无大的进展。尤其是在 CASP 比赛最难、也是最具代表性的赛道上,得分始终在 30 分左右徘徊。


胶着期间,深度学习悄然入局,逐渐引起了生物学家对其在蛋白质科学中潜在力量的关注。


2012 年,深度学习开始在图像识别领域展示出威力。时任芝加哥大学丰田计算技术研究所教授许锦波深受启发,开始思考用深度学习去做蛋白质结构预测。


当时,计算机科学家已经在卷积网络方面取得了巨大成功,卷积网络可以编写深度学习算法,将图像分解成小块,并识别出它们之间的模式。


许锦波将这项技术运用到蛋白质折叠中。他使用一种称为矩阵的数学对象来表示哪些氨基酸在空间上靠得很近,然后将数据作为图像输入卷积网络。该算法在这些图像中寻找模式,以预测组成蛋白质的原子的 3D 坐标。


2014 年,许锦波设计了一种新的深度学习算法,从更为简单的问题入手——预测蛋白质的二级结构,即肽链主链骨架原子的空间位置排布,不涉及氨基酸残基侧链。测试发现,深度学习对这个简单问题有效。在 2015 年和 2016 年,许锦波再次开发了一种更好的深度学习算法,可以直接用来预测蛋白质的三维结构。


2016 年,许锦波发布了一篇关于 AI 预测蛋白质三维结构的论文,宣布 RaptorX-Contact 方法可以大幅度提高蛋白质结构预测精度。并在几个月后的 CASP12 中崭露头角。


不久之后,蛋白质结构研究人员开始涉足深度学习。自此,分子生物学界的研究范式从基于序列的研究转向基于结构的研究,进而促进了基于结构的蛋白质发现和设计,提高了蛋白质从头设计的效率。许锦波由此被业界称为“AI 蛋白质折叠的奠基人”。


2019 年,许锦波在全球范围内首次将 AI 应用至蛋白质氨基酸(原子)之间的距离预测,进一步提升了蛋白质三维结构预测的精度。他率先认识到氨基酸之间的距离预测,不能一对一对预测、要所有对一起预测,也就是所谓的端到端模型。


在氨基酸的距离预测上,许锦波真正将蛋白质预测的问题提升了一个台阶。”密苏里大学校董事会教授许东曾在 2020 年 12 月在图像计算与数字医学国际研讨会(ISICDM)主办的圆桌论坛上表示。


而 AlphaFold 2 所使用的也是端到端模型,根据序列的特征直接输出了三维结构。与许锦波的研究成果异曲同工。


“不可否认,DeepMind 开发了非常有效的方法。但这项工作背后的概念和方法并非凭空而来,其关键技术是深度学习方法的应用。许锦波是这些结构建模方法的主要贡献者, DeepMind 的成果无疑是直接建立在他的工作之上。”John Moult 曾高度肯定许锦波的工作。


2020 年初,Demis Hassabis 和 John Jumper 等人在 Nature 上发文展示了 AlphaFold 算法的细节,其中也认可了许锦波的前述贡献。



正是因为许锦波的开创性贡献,诺贝尔化学奖公布后,前斯坦福大学教授、斯坦福人工智能实验室(SAIL)成员塞拉菲姆·巴特佐格鲁(Serafim Batzoglou)公开表示,“并不是要否定 Hassabis、Jumper 和 Baker 的贡献,但还有一个人本应得到诺贝尔奖的认可,那个人就是许锦波。他第一个开发出(精准预测蛋白结构)的深度学习算法,这一算法后来被复现和增强到最初版本的 AlphaFold 中。他本应与 Hassabis 一起获得诺奖。”



“下一个爆发点将是 AI 蛋白质设计”


在取得众多从 0 到 1 的原创研究成果后,许锦波开始将 AI 蛋白质技术推向产业应用,重点关注应用空间更大的 AI 蛋白质优化设计方向。他于 2021 年回国,并于次年创办“分子之心”。


分子之心专注于 AI 蛋白质设计。在许锦波看来,“ AI 颠覆了蛋白质结构预测只是一个开始,真正的价值爆发点将在 AI 蛋白质设计。AI 蛋白质优化与设计上的突破,是实现对蛋白质有效利用的必由之路,将为药物研发、高性能材料、环境保护、绿色农业、食品等领域带来革命性的变化。”这意味着科学家现在可以从头开始创建定制蛋白质来对抗疾病、检测药物或生成新材料。


如在药物研发领域,AI 蛋白质技术可以被用于加速药物研发的成功率和效率,比如开发出可以针对多种癌症的治疗性疫苗,或者更精准、治疗窗口更大、更耐受的药物;在新材料领域,AI 蛋白质技术可生成创新蛋白材料、易降解且能循环使用的环保材料等;在农业领域,AI 蛋白质技术被用于生物育种以提升农作物的广谱抗性、产量、品质等关键指标,也可以被用于研发对人类健康安全无害、对环境友好的绿色农药,保障粮食安全与食品安全;在绿色低碳方面,AI 蛋白质技术可作为底层基础技术支撑石油化工、能源等行业转型升级,并在消除白色污染等改善环境的工作上发挥价值。


相比蛋白质结构预测,蛋白质设计是一个更加困难的问题。第一,蛋白质序列空间非常大;第二,基于特定功能设计蛋白质,需要对蛋白质结构、功能的深入理解;第三,产业界对蛋白质的需求复杂多样。


业内较为知名的蛋白质设计方法包括华盛顿大学 David Baker 团队推出的蛋白质序列设计方法 ProteinMPNN 和蛋白质主链生成模型 RFDiffusion、美国初创公司 Generate Biomedicine 公司推出的 Chroma、加拿大蒙特利尔学习算法研究院(MILA)与加州理工团队推出的 ProteinDT 等。但这些技术能力普适性较差(仅针对某些专门的蛋白质设计任务),且并未专门面向产业应用、没有真实的产业实践成果佐证。


基于许锦波先前的研究基础,分子之心在 AI 蛋白质结构预测、AI 蛋白质优化设计等领域具备技术优势。


如在产业应用所需的 AI 蛋白质优化与设计方面,分子之心同样自主开发了一系列技术能力优异的算法能力。其自研的蛋白动态结合设计算法,有效规避了目前主流算法和大模型大量存在的假阳性问题,精度和成功率均处于领先水平。在这个问题上,AlphaFold 未能有效解决。


此外,分子之心还开发出了世界上首次突破复杂结构的蛋白质主链结构从头设计、全球首创无需模板的蛋白质配体生成算法、世界上最精确的预测单点突变对蛋白质性能影响的算法等一系列算法。以及自研了全球首个功能完整的 AI 蛋白质优化与设计平台 MoleculeOS、及首个 AI 蛋白质生成大模型 NewOrigin(达尔文)——前者是一个可广泛用于多肽、抗体、酶和小蛋白的研究和设计的产业级平台,包含多种功能模块和解决方案;后者则可以根据结构和功能需求,直接生成具有特定功能的蛋白质。



可以说,在 AI 蛋白质研究领域,分子之心进行了从结构预测到设计、从科研到产业落地的系统性创新。基于这些技术,分子之心在酶活性优化设计、极端环境下蛋白质性能优化等难度极高、传统实验方法很难成功解决的产业任务中取得了突破。其帮助某头部合成生物学公司优化某个极具商业价值又设计行业瓶颈的关键蛋白。相对于野生菌,AI 设计的一个重要酶蛋白结构使菌种产率提高了 5 倍;同时,该公司与合作药企联合攻关,基于 NewOrigin 大模型解决蛋白疫苗稳定性难题。动物实验显示,疫苗产生中和抗体滴度为已公开专利和相关大型药企蛋白疫苗的数倍,突破相关疫苗稳定性专利。


就像人工智能彻底改变了蛋白质折叠一样,蛋白质设计也正在发生同样的变化。许锦波认为,随着更先进的人工智能模型的出现,AI 设计蛋白质的成功率、速度、成本都正在发生质的变化——这往往是一个新型技术抵达规模化产业应用临界点的标志。


此外,2024 年的诺贝尔奖有多位研究人员因其在人工智能领域的工作而获得诺贝尔奖评审团的认可,其激励作用可能会促使其他人开始聚集在该领域,并可能产生更大的爆发。


免责声明:本文旨在传递生命科学和医疗健康产业最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。











































<END>
*版权声明:本网站所转载的文章,均来自互联网,旨在传递更多信息。鉴于互联网的开放性和文章创作的复杂性,我们无法保证所转载的所有文章均已获得原作者的明确授权。如果您是原作者或拥有相关权益,请与我们联系,我们将立即删除未经授权的文章。本网站转载文章仅为方便读者查阅和了解相关信息,并不代表我们认同其观点和内容。读者应自行判断和鉴别转载文章的真实性、合法性和有效性。
AI+生命科学全产业链智能数据平台

收藏

发表评论
评论区(0
  • 暂无评论

    摩熵医药企业版
    50亿+条医药数据随时查
    7天免费试用
    摩熵数科开放平台
    原料药
    十五五战略规划

    全球新药治疗领域统计

    全球新药靶点统计

    专利数据服务
    添加收藏
      新建收藏夹
      取消
      确认