点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:开箱即用!DeepSeek+浪潮云帆超融合一体机解读
首页> 科技频道> 综合新闻 > 正文

开箱即用!DeepSeek+浪潮云帆超融合一体机解读

来源:光明网2025-02-19 09:00

  上个月,DeepSeek发布了最新开源模型R1,凭借其高性能、低成本的模型特点,再次引发全球用户与开发者的广泛关注。但在实际应用中,用户在本地接入DeepSeek时,面临算力基础设施缺失、模型服务性能不足等众多挑战。为此,浪潮企业云精准聚焦用户核心痛点,重磅推出集成DeepSeek的浪潮云帆超融合一体机(智算型-7000 G3),为各行各业踊跃投身智能浪潮提供强劲动力。

  开箱即用 提供极致性能体验

  浪潮云帆超融合一体机能够为用户提供从底层算力、模型服务、推理能力到应用开发的全栈解决方案,实现模型服务的本地化部署,打造“开箱即用”的极致体验。

开箱即用!DeepSeek+浪潮云帆超融合一体机解读

  而此次重磅推出的浪潮云帆超融合一体机(DeepSeek版)将云帆超融合系统、GPU算力与DeepSeek-R1模型进行深度融合,为DeepSeek-R1的运行提供了本地化稳若磐石的算力供给与极致性能。

  灵活选型 构建企业智能中枢

  为满足用户从复杂决策到高并发交互的全场景需求,浪潮企业云打造的浪潮云帆超融合一体机(DeepSeek版)支持从DeepSeek-R1满血版(671B参数)到轻量化蒸馏版的灵活部署。

  满血版(671B参数):性能强大、数据安全与隐私性程度高、服务稳定性和自主性强。在部署DeepSeek-R1 671B满血版的场景中,可采用5台满配浪潮云帆超融合一体机,单台搭载八张显存为48G的GPU,共计可提供1920G显存,能够充分满足用户在实际业务场景中对高并发、高效率以及稳定运行的需求,确保 DeepSeek-R1 671B版本在复杂业务环境下的稳定、高效运行。

  蒸馏版:模型轻量、推理效率高、性价比高。在企业级应用的常规智能问答系统、内容生成平台等场景中,推荐搭载14B或32B参数的模型,单台浪潮云帆超融合一体机(仅使用两张显存48G GPU卡,总显存96G)即可满足模型搭建需求,具备处理文本生成、简单问答等基础任务的能力,也具备一定的复杂问答和知识推理能力。

  浪潮企业云打造的浪潮云帆超融合一体机,让用户可以充分体验智能时代高性能大模型的独特价值,摆脱繁琐的基础性构建工作,专注于使用AI技术创造实际价值。未来,浪潮企业云将持续重点打造软硬结合的行业智能体,将复杂的开发流程转化为标准化产品,为用户定制“云+AI”的数智化解决方案,携手合作伙伴,共建云帆联盟,支撑行业数字化转型,助力数字中国建设。

  敲重点!全尺寸模型知识科普

  DeepSeek-R1系列模型涵盖了从轻量级到超大规模的多个版本,适用于不同的应用场景。了解各版本在不同量化精度下的显存和内存需求,有助于用户选择适合自身硬件配置的模型服务。

开箱即用!DeepSeek+浪潮云帆超融合一体机解读

  全尺寸模型的显存与内存占用估算

  DeepSeek-R1系列涵盖了从轻量1.5B 到超大规模 671B 参数的不同层次模型。参数规模越大,对硬件的要求则越高,显存需求也呈指数级增长。1.5B - 14B 参数的版本适用于个人轻量任务,32B - 70B参数的版本面向企业级复杂任务,671B参数的满血版本则为大规模研究专用。

  小型模型(如 1.5B - 8B):一般情况下,对显卡要求不高,甚至仅使用CPU也可推理;若要使用显卡,推荐16GB 显存的版本,可处理文本摘要、翻译等中等复杂度的自然语言处理任务。

  中型模型(如 14B - 32B):14B 模型推荐使用28GB显存的显卡;32B模型则至少需要64GB显存的显卡,适用于多模态任务预处理等高精度专业领域。

  大型模型(如 70B - 671B):70B 模型需多卡并行;671B 模型则需多节点分布式部署,适用于超大规模研究或通用人工智能探索。(柯岩)

[ 责编:战钊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 铁路物流运输助力春耕生产

  • 辽宁营口:“北粮南运”运输忙

独家策划

推荐阅读
最近,全国多地将DeepSeek等人工智能系统应用于政务和公共服务。
2025-02-20 14:40
DeepSeek引发的冲击波仍在持续:不仅多个平台宣布接入DeepSeek,各个行业也密集搭上这趟“快车”。2月4日,DeepSeek系列大模型正式上线昇腾社区,开发者可一键获取DeepSeek系列模型,并支持昇腾硬件平台上开箱即用。
2025-02-20 10:02
近日,全国首套大型智能化森林火灾救援处置训练设施顺利通过最终验收,在国家西南应急救援中心正式交付使用。
2025-02-20 02:50
19日,科学家们在国际学术期刊《天体物理杂志快报》发布了“天关”卫星的最新发现。
2025-02-20 02:50
夜幕低垂,驾车穿行在贵州兴义环城高速公路的隧道中,柔和光线如点点星光洒下,为隧道披上一层温暖的光纱,照亮往来的车辆。
2025-02-20 02:50
近日,习近平总书记在听取吉林省委和省政府工作汇报时强调,要推进科技创新同产业创新深度融合,整合科研资源和力量,强化企业创新主体地位,优化创新生态,力争在一批重大科技专项上取得新突破,推动科技成果向现实生产力转化。
2025-02-20 02:50
在万里风沙线上筑起“绿色长城”
2025-02-19 09:48
近日,由中国科学院空天信息创新研究院(空天院)研制的直升机航空大地电磁探测系统,成功应用于高原铁路建设工程。
2025-02-19 09:47
由南方科技大学、粤港澳大湾区量子科学中心与清华大学联合组成的研究团队于2月18日在国际学术期刊《自然》线上发表研究成果。
2025-02-19 09:45
18日从中国科协第十届全国委员会第九次会议上获悉,2024年,我国在科技人才培养、科技期刊建设、公民科学素质建设、国际民间科技交流、规范学术团体治理等领域取得进展。
2025-02-19 09:44
2025年开年以来,人工智能(AI)技术继续保持迅猛发展的态势。
2025-02-19 09:42
我国新型储能制造业全链条国际竞争优势凸显,优势企业梯队进一步壮大,产业创新力和综合竞争力显著提升,实现高端化、智能化、绿色化发展。
2025-02-18 09:33
新修订的科学技术普及法自2024年12月25日起施行。宣传贯彻科学技术普及法座谈会17日在京召开,全国人大常委会副委员长蔡达峰出席会议并讲话。
2025-02-18 09:32
迈着深深浅浅的步子走进葡萄园,脚下,枯叶作被覆盖着泥土;头顶,休眠的葡萄枝上零星挂着卷曲的叶子。果农们在葡萄架下来回穿梭,剪刀在手中翻飞,老练地修剪着葡萄枝条,随后,有条不紊地完成着开沟、窝肥、清园等“冬管清单”。
2025-02-18 09:32
2月13日,北京儿童医院,13位知名专家对1位8岁男孩的疑难病例展开缜密讨论。主持人是北京儿童医院院长、耳鼻咽喉头颈外科专家倪鑫,专家们则来自神经外科、肿瘤外科、口腔科等科室。
2025-02-18 09:28
2024年度河南省科学技术奖励名单上,河南农业大学“‘醛’球无敌”博士后科研团队的《木制细胞低碳增强结合关键技术》项目赫然在列。团队负责人彭万喜难掩笑意:“自2021年在全国博士后创新创业大赛拿金奖后,我们团队就荣誉不断。这背后,是国家对甲醛防控治理的日益重视。”
2025-02-18 09:27
重塑金身,树皮、籽壳和叶脉中的杜仲胶可作为首选材料。
2025-02-18 08:56
农业农村部近日制定印发《全国农业科技创新重点领域(2024—2028年)》,要求聚焦十大重点领域,加快推进高水平农业科技自立自强。
2025-02-17 10:16
2024年,中国智能算力规模达725.3百亿亿次/秒(EFLOPS),同比增长74.1%,增幅是同期通用算力增幅(20.6%)的3倍以上;市场规模为190亿美元,同比增长86.9%。
2025-02-17 10:14
我国第三代自主超导量子计算机“本源悟空”全球访问量突破2000万次,刷新了我国自主量子算力服务规模纪录。
2025-02-17 10:14
加载更多