点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计
首页> 科技频道> 创新创业 > 正文

浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计

来源:光明网2025-08-07 18:28

  当前,开源模型正取得飞跃式进步,推动研发范式从封闭走向开放协作。随着大模型参数量的持续提升,对算力基础设施的建设提出了更高要求。8月7日,浪潮信息发布面向万亿参数大模型的超节点AI服务器“元脑SD200”。该产品基于浪潮信息创新研发的多主机低延迟内存语义通信架构,以开放系统设计向上扩展支持64路本土GPU芯片。

  据介绍,元脑SD200可实现单机内运行超万亿参数大模型,并支持多个领先大模型机内同时运行及多智能体实时协作与按需调用,目前已率先实现商用。在实际评测中,元脑SD200运行DeepSeek R1和Kimi K2等全参模型的64卡整机推理性能实现超线性扩展。浪潮信息通过开放系统架构创新,为开源大模型的规模化落地和应用创新提供关键支撑。

浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计

  随着混合专家模型(MoE)的高效架构驱动大模型参数规模持续扩展,国内外前沿大模型的参数量快速突破万亿规模,这给算力系统架构提出新的挑战。一方面,模型参数量增加和序列长度增加带来的键值缓存(KV cache)激增,需要智能计算系统具有超大显存空间承载,依靠单芯片或节点的性能提升已难以为继;且其推理过程作为通信敏感型计算,对分布式计算通信延时要求极高,需要构建更大向上扩展(Scale up)高速互连域。另一方面,智能体AI开启多模型协作的新范式,其推理过程需要生成比传统模型多近百倍的数据词元(token),导致计算量激增。

  元脑SD200超节点AI服务器是浪潮信息面向万亿参数大模型AI时代而设计,创新研发多主机低延迟内存语义通信架构,基于开放总线交换技术构建,在单机内实现了64路GPU芯片的高速统一互连,成功解决万亿大模型对超大显存空间和超低通信延时的核心需求。在开放架构之上,元脑SD200通过智能总线管理和开放的预填充-解码(Prefill-Decoder)分离推理框架实现软硬件深度协同,智能化管理复杂AI计算任务。

  在架构层面,元脑SD200基于自主研发的开放总线交换技术首创多主机三维网格系统架构,实现64路本土GPU芯片高速互连;通过创新远端GPU虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8倍,单机可以提供最大4TB显存和64TB内存,为万亿参数、超长序列大模型提供充足键值缓存空间。同时,依托百纳秒级超低延迟链路,构建64卡大高速互连域统一原生内存语义通信,实测结果表明,在推理过程常见的小数据包通信场景中,全规约(All Reduce)性能表现优异,显著提升计算与通信效率。

  在系统层面,根据万亿参数大模型计算、通信需求特征,浪潮信息开发智能总线管理系统,实现超节点64卡全局最优路由的自动创建,支持不同拓扑切换,资源按需切分。对于全规约、全聚集(All Gather)等典型通信算子,开展不同数据量大小的细粒度通信策略设计,如多层级通信机制等,实现通信延时进一步降低。同时依托开放的PD分离框架,支持异步KV Cache高效传输与差异化并行策略,在提升业务服务级别目标的同时保持对多元算力的兼容性,实现计算与通信架构的深度协同优化。

  元脑SD200超节点AI服务器通过软硬协同系统创新,成功向上扩展突破芯片性能边界,在大模型场景中展示出优异的性能表现。结合优化的PD分离框架,SD200超节点满机运行DeepSeek R1全参模型推理性能超线性提升比为3.7倍,满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍。 (战钊)

[ 责编:王若昕 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 中国队首次参加世运会软式曲棍球比赛

  • 贵州加快构建现代化能源体系

独家策划

推荐阅读
近日,中国科学院大连化学物理研究所研究员吴凯丰团队采用胶体量子点溶液作为增益介质,通过法布里-珀罗谐振腔耦合及双脉冲泵浦设计,开发出连续稳定工作10天以上、能量转化效率大于17%的量子点液体激光器。
2025-08-07 10:18
近日,中国农业科学院农业基因组研究所的研究团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。
2025-08-07 10:18
无论是钢琴家指尖流淌出的动人旋律,还是外科医生在显微镜下的精准操作,甚至是母亲为孩子系鞋带时的温柔细致……
2025-08-07 03:40
月球,地球最亲密的邻居,它的“婴儿期”是什么样的?为破解这个谜题,中国地质大学(北京)科学研究院王水炯教授团队和中国科学院地质与地球物理研究所李秋立研究员团队合作
2025-08-07 03:40
近日,国务院常务会议讨论并原则通过了《中华人民共和国耕地保护和质量提升法(草案)》(以下简称《草案》),决定将《草案》提请全国人大常委会审议。
2025-08-07 03:40
长期以来,石油衍生塑料的污染问题,特别是微塑料对食物和水源的有害影响,一直困扰着人类。研究人员设计了利用恶臭假单胞菌等菌株,将二氧化碳、木质素和食物垃圾等废物转化为生物塑料的方法。
2025-08-06 09:38
南方科技大学地球与空间科学系副教授林玉峰与合作者揭示了地球磁场发电机对地核流体黏度的不变性,并发现早期地球模型可产生与现今观测高度相似的地磁场结构和强度。
2025-08-06 09:35
中国工程院院士、中国农业科学院作物科学研究所研究员万建民表示,纹枯病是威胁全球水稻生产的重大病害,年均造成产量损失10%至30%。
2025-08-06 09:33
近年来,受全球气候变化影响,灾害性天气的突发性、极端性、不确定性愈加明显,特别是进入汛期,突破历史纪录和传统认知的灾害频繁发生。
2025-08-06 09:25
农业农村部、生态环境部日前联合发布《中国渔业生态环境状况公报(2024)》,公布2024年中国渔业水域水质、沉积物、浮游生物等18项指标的生态环境监测情况。
2025-08-06 09:22
林炳亮:基孔肯雅病毒不会通过日常接触引发人际传播,也不会通过咳嗽、打喷嚏等传播。林炳亮:基孔肯雅热和登革热的传播途径一样,都是由伊蚊传播,因此防控措施也一样。基孔肯雅热的治疗尚无特效药物,以对症治疗为主,并做好防蚊隔离。
2025-08-05 10:16
黄皮、龙宫果、嘉宝果、蛇皮果……不少爱吃水果的消费者发现,无论是在线下超市里,还是在线上购物软件里,市面上出售的新奇小众水果越来越多了。泰国的榴莲、山竹都是很热门的水果,我们在泰国采购过程中发现,当地的榴莲果园里会混种一些龙宫果的树木。
2025-08-05 10:15
》显示,长江流域水生生物资源恢复态势总体向好,完整性指数持续提升。
2025-08-05 10:14
近30年来,程芳琴带领团队聚焦煤、电、冶等产业中产生的工业固废处理处置问题,致力于工业固废的低碳化、高值化利用和无害化处置。通过“预处理活化—资源化利用—无害化处置”的技术链条,让工业固废逐步从环境负担转化为可利用资源,促进循环经济发展。
2025-08-05 10:13
物理学家利用一种仅几千克重的装置从核反应堆中捕获了中微子,这种装置的重量比标准的中微子探测器小几个数量级。Scholberg的COHERENT探测器首次利用了一种名为相干散射的现象,即中微子与整个原子核发生“散射”,而不是与构成原子的粒子发生散射。
2025-08-05 10:11
湖南益阳,大通湖区宏硕生态农业农机合作社,王建刚守在水田边,脸上的汗连珠落下,在稻秆上摔出水花。在湖南农业大学等高校和科研院所推动下,再生稻种植在湖南年推广面积已超400万亩,越来越多种粮大户从中受益。
2025-08-04 09:43
中国科学院上海天文台研究员韩文标团队首次发现双黑洞并合事件可能发生在第三个致密天体附近,为揭开双黑洞的形成之谜提供了全新线索。研究团队注意到,若双黑洞在第三个致密天体附近并合,绕第三个天体的轨道运动会产生沿着观测者视线方向的加速度,进而通过多普勒效应改变引力波频率,在信号中留下独特“印记”。
2025-08-04 09:40
经过近10年的持续攻关,研究团队采用单晶石墨作为前驱体,在金刚石压砧内的准静水高压(2亿兆帕)、高温(1400摄氏度)条件下,成功合成百微米级大小、高度有序的六方金刚石三重孪晶样品。
2025-08-04 09:37
现在,深海所的科学家与合作者首次在深渊极限深度中发现了大规模的化能合成群落,几乎覆盖了整个北太平洋的深海俯冲带,在海沟中绵延超过2500公里。“我们的分析显示,深渊冷泉甲烷的碳和氢同位素值非常负——指示甲烷是微生物成因,是在微生物作用下由二氧化碳和氢气合成的。
2025-08-04 09:36
光明日报上饶8月3日电 记者王洋、李玉兰、胡晓军从江西婺源森林鸟类国家级自然保护区获悉,该保护区与井冈山大学蜘蛛生物学研究团队在蜘蛛物种多样性初步调查中发现了跳蛛科合跳蛛属新物种——婺源合跳蛛。
2025-08-04 09:29
加载更多