点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

光明网讯(记者 战钊)网络,作为实现算力互联的中枢神经,是构建大规模智算系统的关键纽带,也是决定海量算力资源能否被高效连接的核心要素。近日,元脉网络发布全新算力互联引擎——25.6T本土芯片智算交换机C400,该产品集安全可靠、开放灵活、智能运维、极致性能、绿色节能于一身,解决了大规模算力系统在传输稳定性、运维效率、可靠性等方面的挑战,满足智算中心、云数据中心等场景的传输需求,助推本土算力高质量发展。
当下,随着AI算力规模的不断扩张,大模型训练在传输稳定性和资源利用率上,面临更为严苛的挑战。元脉网络此次推出的智算交换机C400,以“可靠、开放、智能”为核心理念,通过“超大规模算力系统互联、动态弹性负载、AI 级可靠保障”三大设计,增强算力互联效能,推动产业新跃迁。
算力系统互联层面,C400集成64个400G QSFP112 端口,最大可支持10万卡规模组网,轻松化解超大规模AI算力系统的部署需求,并为万亿级大模型训练奠定基础。业务流量负载均衡方面,依托EMLB(弹性网络负载均衡)技术,可提供Flowlet与逐包转发双模式,实现流量智能分配,保障算力资源的高效均衡利用,规避单点过载问题,全面提升算力系统整体运行效率。
第三方数据统计显示,大模型训练过程中8%的意外中断由光模块/光纤故障引起。针对这一训练成本问题,元脉网络通过深度学习技术,实现对光模块/光纤健康度的预测与监管。客户可以在故障发生前进行干预和纠正,规避由训练中断引起的资源和时间浪费,有效提升训练时间,大幅增强AI训练的稳定性和成功率。
为了从底层构建全面可靠的安全屏障,C400采用业界领先的25.6T本土交换芯片,及本土化的核心元器件,满足客户对信息安全和供应稳定的要求。同时,元脉网络从架构、硬件、软件三大维度对产品的可靠性进行加固,为算力网络的长期稳定运行提供坚实保障。
开放网络技术正以全球化的协作创新模式,推动智算中心技术发展。SONiC作为开放网络的代表,被誉为网络领域的“Linux”,它的快速成长为产业生态注入了新活力,带动硬件、系统软件、业务应用的快速迭代,为智算中心网络业务的创新赋予无限可能。C400基于开放架构设计,实现了软硬件的全面解耦。不仅支持元脉基于SONiC研发的 UXOS 操作系统,还可兼容开源 SONiC及其他第三方OS。
此外,为了深度契合不同行业、不同规模用户的差异化需求,相较于闭源单一的商业模式,元脉网络能够提供多种灵活组合方案。在提高部署和运维效率的设计思路上,C400还支持RoCE网络参数的一键最优部署,通过自动化和智能化的配置流程,减少RoCE网络参数手动调优步骤,将部署调优效率提升35%,有效缩短项目周期,帮助业务快速上线。
大模型训练需要海量数据持续交互,即使毫秒级的丢包也可能导致训练中断、进度回滚,造成算力资源浪费,这就要求网络具备极致的故障感知和定位能力。C400的MoD监测功能恰好完美匹配这一需求,既能快速感知故障,又能精准锁定问题根源,实现丢包事件的毫秒级定位,大幅缩短故障恢复时间,保障业务的稳定运行。
基于绿色节能的设计理念,C400采用phyless技术,省去PHY芯片等高功耗有源器件。另外,通过极致调优的散热策略,在保障设备全场景散热效率的前提下,显著降低风扇转速。相较于市场同类型产品,整机功耗降低15%以上。
同时,C400采用创新的“盒-盒组网”模式,可降低企业总体拥有成本(TCO)50%,大幅削减长期能耗和运维投入,帮助企业实现经济效益与可持续发展的完美平衡。
作为AI时代网络创新引领者,元脉网络可以为用户提供面向AI时代的智算中心、数据中心、边缘网络等全栈网络方案。并坚持可靠、开放、智能的发展理念,持续深化自身在技术创新、场景创新、合作创新上的能力,为AI时代算力、数据价值的释放,打造坚实互联基石。
