从预测走向现实,AlphaFold 3如何赋能生命健康领域?
不同于深耕大语言模型的OpenAI,谷歌DeepMind在结构生物学领域越走越深,从尝试预测蛋白质的三维结构出发,如今已实现对大部分生命分子的预测。
2018年,DeepMind推出第一代AlphaFold模型,开始公开其在蛋白质预测领域的工作,首代即达行业“天花板”高度,推进了蛋白质结构预测的前沿;2020年,DeepMind发布AlphaFold 2,被认为是蛋白质结构预测领域的里程碑式突破。今年5月,DeepMind再次对该模型实现更新,推出AlphaFold 3,直接登上Nature头条,引起业内广泛关注。
IQVIA高级分析和人工智能解决方案负责人金晖向21世纪经济报道记者介绍,AlphaFold主要是AI for Science领域的应用,相比于Alphafold 2,Alphafold 3不仅提高了预测准确度,还进一步扩大了预测范围。Alphafold 2是预测蛋白质单体结构,而更新之后还可以预测蛋白复合物间相互作用、蛋白与小分子相互作用等。
据官方披露的信息,AlphaFold 3引入了Pairformer,使模型更关注结构部分,同时,使用Diffusion代替原来的结构模块。升级之后的AlphaFold 3可以直接预测原子3D坐标,成功将AI的能力扩展到DNA、RNA等领域。对于蛋白质与其他分子类型的相互作用,AlphaFold 3在基准测试中的准确率比现有最好的传统方法高出50%,也因此成为首个在生物分子结构预测方面超越基于物理工具方法的AI系统。
沙利文大中华区执行总监周明子对21世纪经济报道表示,以AlphaFold3为代表的同类AI工具,为医疗行业发展带来了深远的影响。它们通过精准预测生物分子结构,加速了药物研发进程,推动了精准医疗的发展,并促进了科研合作与交流。
“这些技术工具不仅提高了药物研发的效率和成功率,还为疾病机制的深入理解提供了新视角。未来,随着技术的不断成熟和应用领域的拓展,AI工具在医疗领域的应用前景将更加广阔,有望为医疗行业带来更多创新和变革。但也需要关注技术成熟度、数据安全与隐私保护以及法规政策等方面的挑战。”周明子说。
赋能药物研发
人类对蛋白质结构的预测已持续半个世纪之久,AI入局之前,科学家主要用计算机分析蛋白质,但预测准确率较低,结构细节往往不被采信,多被当作晶体结构解析的模板使用,想要真正确认蛋白质的结构还是要通过实验。
AlphaFold的出现开始加速改变这一现状,初代AlphaFold已展示出了强大的预测实力,在CASP13(第十三届国际蛋白质结构预测竞赛)中获得第一名。在CASP14中,AlphaFold 2对大部分蛋白质结构的预测与真实结构只差一个原子的宽度。彼时,DeepMind表示,他们已经解决了关键的“蛋白质折叠问题”,并且将解决问题的运算时间从数月缩短至了数小时。截至目前,全球已有数百万的研究人员使用AlphaFold 2在疟疾疫苗、癌症治疗和酶设计等领域取得了进展。
对于最近更新的AlphaFold 3,只要给定分子输入列表,通过预测不仅能生成它们的联合三维结构,还能揭示分子之间的相互作用,这意味着AlphaFold 3将人类带到了蛋白质之外的更广泛的生物分子领域。
毫无疑问,创新AI工具的应用能够加速药物研发。金晖表示,药物研发领域有一个“双十定律”,即研发一款新药需要10年时间、10亿美金的投入。以AlphaFold 3为代表的AI for Science的工具,可以为药物研发指明方向,加速研发过程,提高研发效率。
有券商分析师对21世纪经济报道指出,通过预测药物分子与疾病相关蛋白的相互作用,AlphaFold 3显著加速了药物筛选过程,极大地提升整个新药研发阶段最耗时的筛选效率;通过底层逻辑来洞察新药的机制,能够提高疾病治疗的精确性,AlphaFold 3可以帮助科学家更深入地了解疾病通路和蛋白质功能,从而设计出更精准的治疗方案,包括个性化医疗和靶向治疗。
不仅如此,AlphaFold 3整体上可以降低研发成本。传统的蛋白质结构解析成本高昂,耗时且需要复杂的实验设备,AlphaFold 3通过AI技术降低了这些成本,使得更多的科研机构能够参与到相关研究中。
转向开源
关于大模型的开源和闭源,行业内的争论从未停止,此次AlphaFold 3也卷入了其中。
2021年,DeepMind宣布对AlphaFold 2进行开源,并发布了其模型和代码。而此次AlphaFold 3发布时,DeepMind并未打算发布其开源代码,科学家对其服务器的访问也受到各种限制:科学家可以通过AlphaFold Server访问AlphaFold 3,不过每天只能使用10次,且不能用于商业研究。同时,科学家也不可能获得可能与药物结合的蛋白质结构。
此举遭到科学界的反对,认为这种做法不符合科学进步的原则,多位科学家联名撰写了一封致Nature的公开信,并得到数百位科学家的支持。随后,DeepMind宣布将在六个月内,开放AlphaFold 3的代码和模型权重。与此同时,AlphaFold 3服务的每日使用次数上调为20次。
尽管如此,此后的一段时间仍有科学家在支持AlphaFold 3走向开源。根据最新数据,已有超千位来自世界各国的科学家在公开信上署名。
面对AlphaFold 3的冲击,我国又该如何不陷入“卡脖子”的困境?金晖表示,国内企业要持乐观态度,技术的发展从来都不是靠一家企业就可以实现的。当前AlphaFold 3更多还是在实验室或学术界被广泛讨论,没有真正实现大规模商业化,国内企业还是有时间去追赶或提高的。
通过梳理不难发现,我国部分企业在相关方面已经有所突破。比如,华为的MEGA-Protein、深势科技的Uni-Fold、华深智药的OmegaFold、百图生科和清华大学共同开发的xTrimoPGLM,以及复旦大学和上海人工智能实验室合作推出的OPUS系列算法等多种工具,已经开始赋能生物蛋白质领域的基础研究与应用工作。
未来,我国AI企业及相关药企应积极布局以应对挑战并抓住机遇。
周明子建议,一方面,AI企业可以加大在深度学习、Transformer和Diffusion模型等前沿技术的研发投入,提升模型预测准确性和泛化能力,同时探索与生物医药领域的深度融合,开发出更多具有实际应用价值的AI工具。
另一方面,药企应加强与AI企业的合作,利用AI技术加速新药研发流程,提高研发效率和成功率,同时关注AI在药物优化、疾病诊断等方面的应用,以科技创新推动产业升级。
“双方还应共同关注数据安全和隐私保护,确保在推动技术进步的同时,也符合法律法规和伦理要求。”周明子强调。
商业化落地存壁垒
DeepMind首席执行官Hassabis认为,AlphaFold 3通过加速生物学科研,将打开超过1000亿美元的药物研发市场。同时预计未来几年,会有一大批人工智能设计的药物进入临床,为人类的生命健康带来巨大好处。
面对成百上千亿美元的市场,如何实现商业化成为企业需要思考的问题。事实上,为更好实现AlphaFold项目的商业化,2021年11月,谷歌成立了Isomorphic Labs,布局药物研发。今年1月,Isomorphic Labs宣布与全球制药巨头礼来和诺华建立战略合作。当前,Isomorphic Labs已经使用AlphaFold 3为其内部项目以及合作伙伴进行药物设计。
“在AI制药领域,科技巨头和传统的头部制药企业的合作更能够为行业带来更多的颠覆。”上述券商分析师表示,不过,要想真正实现大规模商业化还有诸多壁垒。
在金晖看来,目前,AlphaFold 3只是在生物分子层面做预测,要真正实现AI for Science还有很长的路要走。一方面,AlphaFold 3这一模型的训练成本非常高,需要耗费大量的资源;另一方面,在真正做实际应用时,还需要硬件层面的一些准备。此外,企业也还在寻找PMF(产品市场匹配),所以未来大规模的商业推广、商业模型以及实际落地后为终端用户带来的商业价值还需要不断摸索。
周明子认为,AI在结构生物学及整个医疗领域实现大规模商业化落地,需通过技术不断成熟与应用拓展。如AlphaFold 3在蛋白质结构预测中的成功应用,推动了药物研发与疾病机制研究的进程。然而,要达成这一目标,还需克服多重壁垒,包括技术成熟度与可靠性的进一步提升、高质量医疗数据的积累与整合、数据隐私与安全保护机制的完善,以及适应行业特点的法规政策与标准的制定。此外,跨界合作与产业融合也是推动AI在医疗领域商业化落地的重要路径。
据行业媒体预测,预计到2025年,30%的新药将会使用AI研发。截至目前,FDA已经批准了100多种使用AI或机器学习进行开发的药物候选物的临床试验,不过想要最终上市可能还需要数年时间。
“药物研发过程很漫长,AI参与的结构预测只是其中最初的步骤。这些研究成果还需进行临床研究验证才能进行应用。”上述券商分析师说,无论如何,人工智能和医疗行业相结合,是未来发展的一个大方向。星星之火的阶段是人工智能嵌入到医疗行业不同场景,从而解决具体的问题,未来,人工智能将在医疗领域实现更深层次的应用,从而带来整个行业的巨大改变。