点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
2025 ASC世界大学生超算竞赛(ASC25)预赛阶段已接近尾声,经预赛选拔的25强队伍将参加5月10日-14日在青海大学举行的总决赛。全球300多支高校队伍在预赛阶段需完成指定任务,其中包括一道基于最新诺贝尔化学奖成果的人工智能难题――AlphaFold3推理优化。参赛队伍需要根据组委会的要求,在不同计算平台上运行并优化AlphaFold3结构预测代码,同时保持模型精度,推动AlphaFold3在实际业务场景的应用落地。
AlphaFold3能以极高精度预测多种蛋白质复合结构
诺奖应用AlphaFold推理优化难题亟待突破
2024年诺贝尔化学奖的一半被授予戴米斯·哈萨比斯(Demis Hassabis)和约翰·江珀(John M.Jumper),以表彰他们在“蛋白质结构预测”方面的贡献。他们开发的AlphaFold2模型解决了一个已有50年历史的重大难题。
精准预测蛋白质结构对生命科学意义重大。AlphaFold2基于大量氨基酸序列及对应蛋白质三维结构数据进行训练,最终实现了端到端准确预测蛋白质结构,不到一年时间就预测了超过两亿个蛋白质三维结构,而以往完成这些结构的预测需要花费数年甚至十几年的时间,这极大降低了科研时间和成本。以蛋白质设计应用为例,传统蛋白质设计受限于生物试验的长周期和高成本,只能在已发现蛋白的局部进行有限探索。而通过AlphaFold预测蛋白质属性,则突破了生物试验的速度和成本瓶颈,可在无限空间中探索全新蛋白设计,为药物研发和生物制造带来无限可能。最新的AlphaFold3功能再度升级,能以极高的精度预测多种蛋白质复合结构,包括蛋白质与蛋白质、DNA、RNA、配体分子等多种生物分子,在药物研发、疾病机理研究、精准医学等领域应用广泛。
随着AlphaFold3的广泛应用,其推理优化的重要性逐渐凸显。AlphaFold3的复杂性很高,其推理过程需要消耗大量的计算资源。尽管现有推理速度已提升至分钟级,但在高通量设计体系下,面对百万级序列预测,现有速度仍显不足,限制了业务效果提升和产业发展。因此,突破AlphaFold3推理速度优化问题是当务之急。但AlphaFold3推理优化并非易事,需要在减少模型复杂度和保持预测准确性之间找到平衡,以确保优化后的模型仍能提供可靠的预测结果。若蛋白质结构预测不准确,下游功能必然受影响。
大学生探索AlphaFold3在更广泛计算平台的运行优化
为了引导大学生学习理解人工智能与生命科学研究结合的最新成果,探索解决最前沿的生命科学行业难题,ASC25大赛设置了AlphaFold3推理优化赛题。要求各参赛队伍基于组委会提供的氨基酸序列,在不同平台上分别运行和优化AlphaFold3结构预测代码。大赛期望通过这一赛题,考察参赛队伍对AlphaFold3推理过程的理解能力和优化能力,并探索其在更广泛平台上的运行优化。
该赛题的难点在于:其一,参赛学生需要在保持模型精度的前提下提升推理速度,不能使用明显降低精度的优化手段;其二,基于CPU平台的模型推理优化难度大且可参考的实例少,CPU平台的并行处理方式、内存访问模式和编程范式与GPU平台不同,对大学生来说是很大的挑战。要想在这道赛题中取得佳绩,各参赛队伍需要充分了解并掌握AlphaFold3模型结构、推理过程,以及常见的模型优化方法,学习并尝试运用各种技术手段加速推理过程。
AlphaFold3推理优化赛题专家、百图生科技术副总裁张晓明表示,探索AlphaFold3在不同计算平台的运行优化,对于提升业务效果、降低研发成本意义重大。希望这道极具挑战性的赛题能够激发大学生对人工智能、蛋白质结构预测领域的兴趣,也期待参赛学生提出优秀的创新优化方案,从而降低AlphaFold3的运行门槛和计算成本。
AlphaFold3推理优化赛题专家、百图生科技术副总裁张晓明
ASC世界大学生超级计算机竞赛(ASC Student Supercomputer Challenge)由中国发起组织,并得到亚洲及欧美相关专家和机构支持,旨在通过大赛平台推动各国及地区间超算青年人才交流和培养,提升超算应用水平和研发能力,发挥超算的科技驱动力,促进科技与产业创新。ASC超算大赛迄今已举行至第十二届,吸引来自全球六大洲上万名大学生报名参赛,是全球最大规模的大学生超算竞赛。(鸣耒)