点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:文心大模型4.5系列正式开源 涵盖10款模型
首页> 科技频道> 人工智能 > 正文

文心大模型4.5系列正式开源 涵盖10款模型

来源:光明网2025-06-30 15:15

  6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心大模型4.5开源系列已可在飞桨星河社区、HuggingFace等平台下载部署使用,同时开源模型API服务也可在百度智能云千帆大模型平台使用。早在今年2月,百度就已预告了文心大模型4.5系列的推出计划,并明确将于6月30日起正式开源。

文心大模型4.5系列正式开源 涵盖10款模型

文心大模型4.5系列开源模型

  此次百度一次性推出10款文心大模型4.5系列开源模型,在独立自研模型数量占比、模型类型数量、参数丰富度、开源宽松度与可靠性等关键维度上,均处于行业领先位置。

  据介绍,文心大模型4.5开源系列针对MoE架构提出了一种创新性的多模态异构模型结构,适用于从大语言模型向多模态模型的持续预训练范式,在保持甚至提升文本任务性能的基础上,显著增强了多模态理解能力,其优越的性能主要得益于多模态混合专家模型预训练、高效训练推理框架和针对模态的后训练等关键技术点。

  此外,文心大模型4.5开源系列均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。实验结果显示,其系列模型在多个文本和多模态基准测试中达到SOTA水平,尤其在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果突出。

  在文本模型方面,文心大模型4.5开源系列基础能力强、事实准确性高、指令遵循能力强、推理和编程能力出色,在多个主流基准评测中超越DeepSeek-V3、Qwen3等模型。在多模态模型方面,文心大模型4.5开源系列拥有卓越的视觉感知能力,同时精通丰富视觉常识,并实现了思考与非思考统一,在视觉常识、多模态推理、视觉感知等主流的多模态大模型评测中优于闭源的OpenAI o1。此外,在轻量模型上,文心4.5-21B-A3B-Base文本模型效果与同量级的Qwen3相当,文心4.5-VL-28B-A3B多模态模型也是目前同量级最好的多模态开源模型,甚至与更大参数模型Qwen2.5-VL-32B不相上下。

文心大模型4.5系列正式开源 涵盖10款模型

文心4.5预训练模型在主流基准测试中表现优异

文心大模型4.5系列正式开源 涵盖10款模型

文心4.5-300B-A47B模型在主流基准测试中表现优异

文心大模型4.5系列正式开源 涵盖10款模型

文心大模型4.5系列正式开源 涵盖10款模型

文心多模态后训练模型(支持思考、关闭思考)在多个多模态基准测试中达到SOTA水平

  据了解,文心大模型4.5开源系列权重按照Apache 2.0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广泛兼容多种芯片,降低模型的后训练和部署门槛。

  作为国内最早投入AI研发的企业之一,百度在算力、框架、模型到应用的四层布局构建了明显的AI全栈技术优势。其中,飞桨是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台,基于多年飞桨开源技术与生态系统积累,此次文心大模型4.5开源系列同步升级发布文心大模型开发套件ERNIEKit和大模型高效部署套件FastDeploy,为文心大模型4.5系列及开发者提供开箱即用的工具和全流程支持。

  值得关注的是,此次文心大模型4.5系列开源后,百度实现了框架层与模型层的“双层开源”,为行业树立了新标杆。(记者 武玥彤)

[ 责编:谢芸 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 香港“非遗月”处处有“非遗”

  • 江苏南通:“第二现场”观赛区 城市“全域”看“苏超”

独家策划

推荐阅读
四大家鱼,即青鱼、草鱼、鲢鱼、鳙鱼,是我国重要的经济鱼类,占淡水鱼类养殖总量的“半壁江山”,尤以长江流域所产鱼品质最优。但人工养殖久了,鱼类品质逐渐下降,需要捕捞野生鱼种来更换,确保鱼类种质“基因库”稳定。
2025-06-30 04:50
FAST如今每天观测时长接近24小时,每年总观测时长超过5300小时,持续不断地为科学家提供宝贵的数据。
2025-06-30 09:52
华南农业大学积极探索应用大数据、人工智能等技术加速育种创新,“华航香银针”就是创新成果之一。
2025-06-30 09:51
在近日落下帷幕的第十五届全国周培源大学生力学竞赛中,一位特殊的“考生”吸引了人们目光。
2025-06-30 09:51
6月29日,在海南文昌卫星超级工厂项目建设现场,各方正全力以赴加快工厂投产进程。
2025-06-30 09:51
作为一所工科见长的大学,近年来,山东科技大学涌现出一批热衷文化艺术的学生:材料学院研究生庄英赞受邀参加《声声入戏——中央广播电视总台首届京剧票友大会》节目;
2025-06-30 04:50
今年“三夏”生产,该农场配备无人驾驶系统的收割机和拖拉机、气吸播种机、精准水肥轮灌系统、自动巡田无人机等智能化装备大显身手。
2025-06-27 10:25
6月24日,国家重大科研仪器研制项目“2.5米大视场高分辨率太阳望远镜”(WeHoST)在四川稻城启动建设配套项目,预计2027年望远镜完成装调并投入试运行。
2025-06-27 10:24
古生物研究表明,包括早期犬齿兽在内的一些远古动物,脑袋为一个没有左右脑半球区分的整体,而现生哺乳动物和典型的进步颌兽类则有左右两个脑半球。
2025-06-27 10:18
6月26日21时29分,经过约6.5小时的出舱活动,神舟二十号乘组航天员陈冬、陈中瑞、王杰密切协同,在空间站机械臂和地面科研人员的配合支持下,圆满完成既定任务。
2025-06-27 10:17
北京大学马丁教授团队26日凌晨在国际学术期刊《自然》上发表一项开创性研究,成功将复杂难处理的混合废塑料变废为宝,为根治全球塑料污染顽疾提供了新的思路。
2025-06-27 10:16
近日,一组“清华学生戴头套看演出”的照片在网络引发热议。脑机接口技术的应用还面临社会伦理与隐私保护方面的争议,如何平衡科学技术创新与社会伦理、监管要求等仍是难题。
2025-06-27 10:15
据中国载人航天工程办公室消息,根据计划安排,神舟二十号航天员乘组将于近日择机实施第二次出舱活动。目前,空间站组合体运行稳定,神舟二十号航天员乘组在轨工作已满两个月,身心状态良好,已做好出舱活动各项准备工作。
2025-06-26 09:48
6600万年前,希克苏鲁伯小行星撞击地球导致非鸟类恐龙灭绝,而就在撞击点附近,一种神秘的夜蜥蜴可能是唯一幸存下来的陆生脊椎动物。白垩纪末期,一颗巨型小行星撞击了墨西哥尤卡坦半岛附近的区域,形成了一个直径超过150公里的陨石坑,导致全球大多数动植物物种灭绝。
2025-06-26 09:47
在全球面临日益严峻的生态危机之际,中国科学院院士、中国科学院生态环境研究中心研究员傅伯杰等提出了一个衡量人与自然共同繁荣程度的全球框架。论文合作作者、联合国开发计划署人类发展报告办公室主任Pedro Conceicao表示,面对当今严峻的地球系统变化,我们必须把人与自然健康、互惠的关系纳入发展愿景。
2025-06-26 09:46
黑土地被誉为“耕地中的大熊猫”,是世界上最肥沃的土壤。这项调查系统查清了我国东北典型黑土区地表基质资源“家底”,实现了东北黑土地地表基质层的首次系统调查与深度解剖。
2025-06-26 09:41
记者邱玥25日从中国海油获悉,我国首个自营超深水大气田“深海一号”二期项目全面投产。 目前,“深海一号”大气田已经达到最高产能设计状态,年产气量有望超过45亿立方米。
2025-06-26 09:40
由美国国家科学基金会和能源部支持的薇拉·C·鲁宾天文台,首次捕捉到的太空景象呈现出一场由恒星“托儿所”及邻近星系的密集星团构成的粉蓝视觉盛宴。鲁宾天文台的科学团队还开发了面向公众的工具“天空查看器”,用户可通过平移和缩放功能探索这些超高分辨率图像中的恒星和星系。
2025-06-25 09:46
中国海油25日宣布,公司在南海水域的“深海一号”大气田二期项目全面投产,标志着我国最大海上气田建成。“深海一号”大气田分一期和二期开发建设(一期于2021年6月投产),探明天然气地质储量超1500亿立方米,最大作业水深超1500米,最大井深达5000米以上,是我国迄今为止自主开发建设的作业水深最深、地层温压最高、勘探开发难度最大的深水气田。
2025-06-25 09:33
2017年启动的第二次青藏高原综合科学考察,为新一代草地植被图的绘制提供了新的契机。“我们共识别出65种主要草地类型,其中高山嵩草草甸、紫花针茅草原、矮生嵩草草甸、垂穗披碱草草甸和线叶嵩草草甸这5个群系分布最广。
2025-06-25 09:30
加载更多