点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
上个月,DeepSeek发布了最新开源模型R1,凭借其高性能、低成本的模型特点,再次引发全球用户与开发者的广泛关注。但在实际应用中,用户在本地接入DeepSeek时,面临算力基础设施缺失、模型服务性能不足等众多挑战。为此,浪潮企业云精准聚焦用户核心痛点,重磅推出集成DeepSeek的浪潮云帆超融合一体机(智算型-7000 G3),为各行各业踊跃投身智能浪潮提供强劲动力。
开箱即用 提供极致性能体验
浪潮云帆超融合一体机能够为用户提供从底层算力、模型服务、推理能力到应用开发的全栈解决方案,实现模型服务的本地化部署,打造“开箱即用”的极致体验。
而此次重磅推出的浪潮云帆超融合一体机(DeepSeek版)将云帆超融合系统、GPU算力与DeepSeek-R1模型进行深度融合,为DeepSeek-R1的运行提供了本地化稳若磐石的算力供给与极致性能。
灵活选型 构建企业智能中枢
为满足用户从复杂决策到高并发交互的全场景需求,浪潮企业云打造的浪潮云帆超融合一体机(DeepSeek版)支持从DeepSeek-R1满血版(671B参数)到轻量化蒸馏版的灵活部署。
满血版(671B参数):性能强大、数据安全与隐私性程度高、服务稳定性和自主性强。在部署DeepSeek-R1 671B满血版的场景中,可采用5台满配浪潮云帆超融合一体机,单台搭载八张显存为48G的GPU,共计可提供1920G显存,能够充分满足用户在实际业务场景中对高并发、高效率以及稳定运行的需求,确保 DeepSeek-R1 671B版本在复杂业务环境下的稳定、高效运行。
蒸馏版:模型轻量、推理效率高、性价比高。在企业级应用的常规智能问答系统、内容生成平台等场景中,推荐搭载14B或32B参数的模型,单台浪潮云帆超融合一体机(仅使用两张显存48G GPU卡,总显存96G)即可满足模型搭建需求,具备处理文本生成、简单问答等基础任务的能力,也具备一定的复杂问答和知识推理能力。
浪潮企业云打造的浪潮云帆超融合一体机,让用户可以充分体验智能时代高性能大模型的独特价值,摆脱繁琐的基础性构建工作,专注于使用AI技术创造实际价值。未来,浪潮企业云将持续重点打造软硬结合的行业智能体,将复杂的开发流程转化为标准化产品,为用户定制“云+AI”的数智化解决方案,携手合作伙伴,共建云帆联盟,支撑行业数字化转型,助力数字中国建设。
敲重点!全尺寸模型知识科普
DeepSeek-R1系列模型涵盖了从轻量级到超大规模的多个版本,适用于不同的应用场景。了解各版本在不同量化精度下的显存和内存需求,有助于用户选择适合自身硬件配置的模型服务。
全尺寸模型的显存与内存占用估算
DeepSeek-R1系列涵盖了从轻量1.5B 到超大规模 671B 参数的不同层次模型。参数规模越大,对硬件的要求则越高,显存需求也呈指数级增长。1.5B - 14B 参数的版本适用于个人轻量任务,32B - 70B参数的版本面向企业级复杂任务,671B参数的满血版本则为大规模研究专用。
小型模型(如 1.5B - 8B):一般情况下,对显卡要求不高,甚至仅使用CPU也可推理;若要使用显卡,推荐16GB 显存的版本,可处理文本摘要、翻译等中等复杂度的自然语言处理任务。
中型模型(如 14B - 32B):14B 模型推荐使用28GB显存的显卡;32B模型则至少需要64GB显存的显卡,适用于多模态任务预处理等高精度专业领域。
大型模型(如 70B - 671B):70B 模型需多卡并行;671B 模型则需多节点分布式部署,适用于超大规模研究或通用人工智能探索。(柯岩)