点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:DeepSeek成功的底层逻辑及产业影响
首页> 科技频道> 人工智能 > 正文

DeepSeek成功的底层逻辑及产业影响

来源:人民邮电报2025-02-19 09:06

  仿佛是一夜之间,DeepSeek迎来了“滔天的流量”。它不仅在全球引发了新一轮的AI应用热潮,而且给全球的算力资本市场带来了重大冲击。究其原因,DeepSeek不仅在训练成本及使用成本、模型训练及优化方式等领域实现了大量的工程创新,而且打破了AI领域许多的传统叙事逻辑。简而言之,DeepSeek正在改变游戏规则。

  DeepSeek最新推理模型R1的横空出世,带来了一个非常大的惊喜,仅用6天就发展了1亿用户。“用好奇心来揭开AGI的神秘面纱”这一愿景,更增添了神秘色彩。那么,DeepSeek在技术上究竟有哪些创新,成功的背后有哪些深层次的原因?这一切将对中美下一个十年的科技竞争产生哪些影响?

  本图片为AI生成并进行了人为后期加工。 遥歌/制作

  工程创新

  成就与众不同

  DeepSeek不仅引发了全球新一轮的AI应用热潮,而且对全球的算力资本市场产生重大冲击。究其原因,DeepSeek在训练成本及使用成本、模型训练及优化方式方面均实现了大量工程创新。

  成本是最大的亮点。DeepSeek-R1的整体训练成本比OpenAI少了一个数量级以上。R1在整个训练过程中的工程优化和创新亮点非常多,包括“Multi-Head Latent Attention——多头隐形注意力机制”“Multi-token predication——多token预测”“有选择性地使用8个浮点数精度FP8来替代FP16甚至FP31”等。这些优化其实都不容易实现。每一个看似不显著的优化,在层级叠加效应下却产生了非常惊人的效果。

  DeepSeek其实一共发布了两个模型,分别是R1和R1-zero。DeepSeek基于V3这个基础模型聚焦强化学习获得了R1-zero。但是,R1-zero在回答一些问题的时候容易产生包括“多语言混杂”在内的诸多问题。Deep-Seek又对这个模型进行了SFT(监督微调优化),从而产生了R1。R1的强化学习功能可以实现自动化,是比较容易去scale的。这样一来,该模型未来的想象空间接近无限。

  颠覆性改变

  打破传统叙事逻辑

  DeepSeek之所以备受关注,本质在于打破了很多AI领域的传统叙事逻辑,例如OpenAI对于推理模型的算力堆叠霸权逻辑、AI应用圈的OpenAI寡头垄断格局逻辑、美国对中国的高制程芯片封锁逻辑以及AI大模型的开源闭源逻辑……

  首先,AI圈公认这种推理模型的实现难度是极大的。此前,比较好的推理模型只有OpenAI的GPT o1。Anthropic做不出来,Google“卡”了很久才推出表现一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力还要强于o1。进一步来看,R1不仅免费还开源,训练成本和使用成本均实现了指数级下降。原先o1凭借领先性可以“收割”相当长一段时间的价值,但DeepSeek-R1的出现以及开源的举措,让绝大多数开发者以及聚焦应用的创业公司都能够以更低的门槛去做开发。更加便宜且更容易私有化部署的R1,击碎了华尔街对于所有大模型公司的估值逻辑。

  其次,DeepSeek的出现打破了AI应用圈原有的竞争枷锁。就算是美国的顶尖应用公司选择DeepSeek和ChatGPT时,答案也很清楚。Cursor、Perplexity这些AI领域的超级明星应用,都第一时间进行了DeepSeek模型的部署,而且设置了推荐第一优先级。此外,Google、Amazon、NV等平台也都部署了Deep-Seek模型。这些改变,同步影响了云服务的市场格局。国内大量从事应用开发的企业,在DeepSeek-R1出现之前不得不使用微软云(为了便捷使用GPT-4的API);现在,使用阿里云上部署的Deep-Seek成为可选项。

  再其次,DeepSeek带来了芯片封锁逻辑的崩塌。DeepSeek在辉达CUDA生态的更底层(例如PTX层),通过微调底层代码来优化性能,从而解决“连接通信能力和调度能力被阉割”的问题。专家普遍认为,目前中美AI大模型领域的技术差距约为4个月。从技术能力发展的趋势来看,这一差距继续缩小的概率大于扩大的概率。

  最后,开源让DeepSeek在舆论战中至少“不落下风”。在AGI的道路上做出最强大的模型并开源,应该是OpenAI最早的初心和使命。市场永远不会说谎,谁的模型能力强谁就能掌握最终的话语权。2024年12月DeepSeek V3发布的时候,国际主流媒体主要关注其“成本低廉”;当Deep-Seek-R1发布时,情况则截然不同,因为“滔天的流量”来了。作为一个开源模型,DeepSeek让所有用户在任何领域都增加了一个“顶尖专家”,免费且24小时随时在线。(作者:郑涛)

[ 责编:肖春芳 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 探访北京市平谷区体育中心安置点

  • 延安南泥湾:陕北好江南再焕新颜

独家策划

推荐阅读
科技浪潮下,侨界青年索华也带来创业项目——基于燃气低碳催化的粉末喷涂线研发和产业化,顺应新能源与“双碳”目标趋势。
2025-07-30 09:41
中国国土南北跨越纬度近50度、东西跨经度60多度,带来气候多样性,适宜不同品种的蔬菜、水果生长。答:“十四五”以来,在消费升级与供应链创新的双重作用下,我国果蔬产业发生着诸多变化。
2025-07-30 09:40
面对激荡的国际竞争局势与高质量发展的迫切需求,唯有主动拥抱变革,让人工智能科技创新的“源头活水”充分浇灌产业创新的“广阔田野”,方能赢得战略主动、制胜未来。
2025-07-30 05:00
前不久,甘肃皋兰什川古梨园系统、浙江德清淡水珍珠复合养殖系统和福建福鼎白茶文化系统正式被联合国粮农组织认定为全球重要农业文化遗产。至此,我国的全球重要农业文化遗产数量增至25项,继续领跑全球。
2025-07-30 05:00
29日12时11分,双曲线一号遥十运载火箭在我国酒泉卫星发射中心发射升空,将搭载的恩施硒都山泉号卫星顺利送入预定轨道,飞行试验任务获得圆满成功。
2025-07-30 05:00
北京时间7月27日18时03分,我国在太原卫星发射中心使用长征六号改运载火箭,成功将卫星互联网低轨05组卫星发射升空,卫星顺利进入预定轨道,发射任务获得圆满成功。
2025-07-29 10:17
鸟类因误判透明或反光的玻璃而撞击建筑物,被称为“鸟撞”,是威胁鸟类种群的重要因素之一。
2025-07-29 04:40
日前从江西铜钹山国家级自然保护区获悉,该自然保护区与井冈山大学蜘蛛生物学研究团队开展蜘蛛资源本底调查中发现蜘蛛新物种——广丰合跳蛛。研究成果在国际期刊《生物钥匙》上发表。
2025-07-29 04:40
近日,该中心与重庆师范大学生命科学学院唐安军教授团队,在巫溪县白果林场发现近危物种长叶山兰,这是在阴条岭发现的又一新纪录种。
2025-07-29 04:40
随着大数据和人工智能技术的发展,数字化健康管理成为一种新的生活风尚,帮助人们提高健康管理的效率和质量。但当人们对健康数据的关注逐渐演变为时刻紧盯、过度解读时,这一数字化工具,反而可能催生不必要的焦虑,让人们在不知不觉中被数据所“绑架”。
2025-07-29 04:40
上海开普勒机器人有限公司专注于将人形机器人应用于智能制造、仓储物流、智慧巡检等工业场景,以满足实际生产需求。展望未来,人形机器人将提高生产力,与人类高效合作,可能为许多行业带来革命性变革,创造新的价值定位和商业模式。
2025-07-28 09:28
智元机器人联合创始人、首席技术官彭志辉就带着机器人进行了一场别开生面的“人机对话”,展望了具身智能时代的人机关系。
2025-07-28 09:28
在产品研制阶段,科研人员重点针对能量高效汇聚—传输、月壤致密化输运等问题,开展了关键技术攻关。
2025-07-28 09:27
当日下午抵达位于青海省境内的长江源区通天河直门达河段,进行了多学科采样观测,这意味着2025年江源综合科考正式启动。
2025-07-28 09:25
研究团队历时5年,通过对近4.7万份田间数据的深度挖掘,构建了涵盖2191份全球小麦种质的“综合抗源”核心资源库。以此为基础,团队首次绘制出覆盖431个遗传位点的小麦基因组抗条锈病基因全景图,清晰展现出抗性基因在全球麦区的时空分布特征。
2025-07-29 04:40
英国《自然》周刊网站指出,招募研究人员和高技能人才是中国推动经济社会发展和实现科技自立自强的核心。经济合作与发展组织3月发布的报告显示,2023年中国研发投入已超过7800亿美元,达到美国96%的水平,10年前这一比例为72%。
2025-07-28 09:24
艾玛口中的“邦邦车”,是一台由中国企业邦邦机器人独立生产研发的智能辅助出行机器人。爬坡、颠簸路况行进、刹车制动……走进位于江苏省常州市天宁区的邦邦机器人研发中心,不少新产品正在进行多环节测试。
2025-07-28 09:24
盛夏时节,数千名科技精英正在浙江湖州西塞科学谷潜心攻关。作为湖州“五谷丰登”计划的首个“创谷”项目,西塞科学谷开园3年来累计引进省内外科技团队近40个、汇聚科技人才2600余名,成功入选全国首批“科创中国”创新基地。
2025-07-25 10:05
一台银灰色人形机器人在汽车生产车间内沉稳行进。2024年,深圳机器人产业集群企业数量达74032家,机器人上市企业34家、独角兽企业9家。
2025-07-25 10:05
24日中午12时许,“新舟”60民用搜救机顺利起飞,经过1小时20分飞行并完成预定验证科目后,平稳降落在西安阎良机场,顺利完成首次飞行。
2025-07-25 10:01
加载更多