点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
8月15日,在2025 CCF全国高性能计算学术大会(HPC China 2025)上,中科曙光正式发布国内首个遵循行业标准的超智融合算力平台——Nebula 800。这一创新产品不仅填补了国内在超算与智算融合领域的空白,更因其技术突破性荣获2025 CCF全国高性能计算学术大会技术创新奖。
超算与智算为何要“融合”?
在大模型发展的初期阶段,训练出高效且准确度优异的模型是行业关注的核心焦点。这一时期,算力供给体系主要以低精度专用AI芯片为核心支撑,通过针对性的硬件架构优化满足模型训练的基础需求。
随着人工智能技术在各行各业的深度渗透与泛化应用,AI产业的发展重心已从单一模型与算法的研发阶段,逐步过渡到聚焦实际应用场景落地效果的关键发展期。在这一进程中,行业实践逐渐揭示:通过在数据层、算法层与业务层实现传统高性能数值模拟方法与新兴大模型技术的深度融合应用,能够在业务运行效率、结果准确性及系统稳定性等核心维度获得综合最优解。
这一融合路径在气象预报、新材料研发、生命科学探索、工业仿真等AI for Science(科学智能)创新业务场景中展现出尤为显著的价值。
面对新型业务形态的需求升级,过去超算平台与智算平台分立建设的模式已显露出明显局限,难以支撑融合计算场景的复杂需求。在此背景下,具备高精度算力与低精度算力融合能力,兼容主流技术生态与简单友好的应用开发环境,支持多类型计算任务协同调度,可承载各类业务全流程运行,同时满足超高性能需求的存、算、传、管协同设计,并兼顾绿色节能特性的新型超智融合算力平台,成为技术发展的必然趋势。
“过去用户常常面临选择困难:建一个超算平台,再建一个智算平台,资源割裂、调度困难、运维成本高。”中科曙光高性能计算产品事业部总经理李柳表示,“Nebula 800的诞生,正是为了解决这一痛点,让多种算力在一个平台上高效协同。”
中科曙光高性能计算产品事业部总经理李柳
为什么曙光能实现“融合”?长期积累的“水到渠成”
作为国内高性能计算领域的“老将”,曙光自90年代起便深耕算力领域。李柳坦言:“我们过去几年虽然低调,但从未停止高性能计算技术的研发。正是十年如一日的积累,让我们能率先看到趋势、提出标准,并最终打造出符合行业需求的产品。”
他强调,曙光从成立之初就肩负着支撑科研的使命。正是长期与高校、科研机构、企业的深度合作,让曙光能从一线用户的真实需求出发,提出“超智融合”理念,并与中国信息通信研究院、中国智能计算产业联盟等机构共同制定《超智融合集群能力要求》行业标准,推动超智融合技术更好的普及与应用。
“我们不是简单地把超算和智算设备拼在一起,而是从底层架构开始重新设计。”中科曙光高性能计算产品事业部总工程师卜景德解释道。Nebula 800采用“紧耦合分布式异构并行体系结构”,就像一个高度协同的“交响乐团”,CPU、GPU、存储、网络等组件紧密配合,避免传统系统中“各自为政”的低效问题。
据介绍,Nebula 800平台实现了三大融合:一是算力融合,支持双精度、单精度、半精度等多种计算模式。无论是需要极高精度的科学计算数值模拟,还是大规模AI模型训练,都能在同一芯片上完成,“一芯多用”,避免资源浪费。
二是存算传管融合。“打开智能管理,我们的管理系统会自动学习每个应用的计算特征、IO特征,应用再次运行时,会自动根据应用的需求特点、数据分布和网络拓扑采用最佳调度策略,让计算靠近数据或将数据提前‘搬运’至即将使用它的计算节点,大幅减少等待时间。”中科曙光高性能计算产品事业部副总经理刘冠川举例说。
在管理融合方面:平台配备智能运维系统,能实时感知运行状态,实现故障秒级定位与自动修复。同时,一个统一的调度平台即可调度科学计算、AI训练、工业仿真等多种任务,告别“多平台、多系统”的繁琐管理。
融合平台,如何改变科研与产业?
“超智融合不是噱头,而是解决实际问题的钥匙。”刘冠川分享了多个应用案例。
医疗领域:中山大学附属第一医院基于曙光超智融合技术构建的精准医疗平台,实现了全基因组测序数据比对分析效率的跨越式提升 —— 原本需要4小时的分析流程被压缩至30分钟,计算效率提升 20 倍,这为临床诊断和个性化治疗方案的快速制定提供了坚实支撑。
气象预报:某省气象局构建超智融合算力平台后,原3小时的预报间隔缩短至1小时,通过快速循环更新预报数据,有效提高了暴雨等灾害性天气的预报准确性,为防灾减灾争取了宝贵时间。
更深远的影响在于,超智融合算力平台内生的科学智能体让科研人员能更专注于创新本身。刘冠川解释:“过去,科学家要花大量时间处理数据、调试程序。现在,平台能自动优化流程,他们只需提出‘我想研究什么’,AI就能协助完成文献梳理、方案设计等辅助工作。科学家们从过去繁重的‘科研体力活’中解脱出来,把精力集中在更核心的事情上——提出创新性、颠覆性、高质量的科学问题和科学目标,加速科学发现的进程,让前沿研究成果更快地从实验室走向实际应用。”
据悉,曙光超智融技术已在30多个行业历经验证。“希望这个标准和产品,能推动整个行业从‘各自为战’走向‘协同创新’,让更多科研机构和企业能高效、低成本地用上先进算力。”李柳表示,未来将持续投入研发,让算力真正成为推动科技进步和社会发展的“引擎”。(记者肖春芳)