点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:文心大模型4.5系列正式开源 涵盖10款模型
首页> 科技频道> 人工智能 > 正文

文心大模型4.5系列正式开源 涵盖10款模型

来源:光明网2025-06-30 15:15

  6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心大模型4.5开源系列已可在飞桨星河社区、HuggingFace等平台下载部署使用,同时开源模型API服务也可在百度智能云千帆大模型平台使用。早在今年2月,百度就已预告了文心大模型4.5系列的推出计划,并明确将于6月30日起正式开源。

文心大模型4.5系列正式开源 涵盖10款模型

文心大模型4.5系列开源模型

  此次百度一次性推出10款文心大模型4.5系列开源模型,在独立自研模型数量占比、模型类型数量、参数丰富度、开源宽松度与可靠性等关键维度上,均处于行业领先位置。

  据介绍,文心大模型4.5开源系列针对MoE架构提出了一种创新性的多模态异构模型结构,适用于从大语言模型向多模态模型的持续预训练范式,在保持甚至提升文本任务性能的基础上,显著增强了多模态理解能力,其优越的性能主要得益于多模态混合专家模型预训练、高效训练推理框架和针对模态的后训练等关键技术点。

  此外,文心大模型4.5开源系列均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。实验结果显示,其系列模型在多个文本和多模态基准测试中达到SOTA水平,尤其在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果突出。

  在文本模型方面,文心大模型4.5开源系列基础能力强、事实准确性高、指令遵循能力强、推理和编程能力出色,在多个主流基准评测中超越DeepSeek-V3、Qwen3等模型。在多模态模型方面,文心大模型4.5开源系列拥有卓越的视觉感知能力,同时精通丰富视觉常识,并实现了思考与非思考统一,在视觉常识、多模态推理、视觉感知等主流的多模态大模型评测中优于闭源的OpenAI o1。此外,在轻量模型上,文心4.5-21B-A3B-Base文本模型效果与同量级的Qwen3相当,文心4.5-VL-28B-A3B多模态模型也是目前同量级最好的多模态开源模型,甚至与更大参数模型Qwen2.5-VL-32B不相上下。

文心大模型4.5系列正式开源 涵盖10款模型

文心4.5预训练模型在主流基准测试中表现优异

文心大模型4.5系列正式开源 涵盖10款模型

文心4.5-300B-A47B模型在主流基准测试中表现优异

文心大模型4.5系列正式开源 涵盖10款模型

文心大模型4.5系列正式开源 涵盖10款模型

文心多模态后训练模型(支持思考、关闭思考)在多个多模态基准测试中达到SOTA水平

  据了解,文心大模型4.5开源系列权重按照Apache 2.0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广泛兼容多种芯片,降低模型的后训练和部署门槛。

  作为国内最早投入AI研发的企业之一,百度在算力、框架、模型到应用的四层布局构建了明显的AI全栈技术优势。其中,飞桨是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台,基于多年飞桨开源技术与生态系统积累,此次文心大模型4.5开源系列同步升级发布文心大模型开发套件ERNIEKit和大模型高效部署套件FastDeploy,为文心大模型4.5系列及开发者提供开箱即用的工具和全流程支持。

  值得关注的是,此次文心大模型4.5系列开源后,百度实现了框架层与模型层的“双层开源”,为行业树立了新标杆。(记者 武玥彤)

[ 责编:谢芸 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • “黑科技”守护铁路行车安全

  • 冬游“神州北极”漠河

独家策划

推荐阅读
为揭示东亚古人类的技术智慧与演化脉络提供了关键证据。
2026-01-30 09:37
中国气象局29日发布《2025年中国风能太阳能资源年景公报》。公报显示:2025年,全国风能资源为正常年景,全国太阳能资源总体为偏小年景。
2026-01-30 03:30
想象一下手电筒的光:柔和而四散,照亮着前方。激光,就像一束训练有素的光——所有光粒子步调一致,朝着同一个方向前进,能量高度集中。这种特性让激光能完成普通光做不到的“精细活”,从超市扫码器到医院手术刀,从光纤通信到舞台灯光秀,背后都有它的身影。
2026-01-30 03:30
激光技术被誉为20世纪“四大科技发明”之一。聚焦真空紫外非线性光学晶体材料领域基础研究和关键核心技术,中国科学院新疆理化技术研究所(以下简称“新疆理化所”)潘世烈团队成功研制出氟化硼酸铵(ABF)晶体,首次实现直接倍频真空紫外激光158.9纳米输出,创造了该领域世界最短输出波长纪录。相关成果于29日在国际学术期刊《自然》发表。
2026-01-30 03:30
开慧镇党委书记杨骏介绍,依托科技小院,全镇形成科技养殖示范点5处、示范户24户,带动村民增收1800余万元,并发展起梅花鹿、鹌鹑等特色养殖产业。在博乐市区西南方向四五公里处的荒漠化草原上,科技小院还开辟了200多亩的试验场,将这里作为科研攻关的第一线。
2026-01-30 09:17
科研人员将种子放入冷库储存。例如,千年种子库与中国西南野生生物种质资源库就通过人员交流、技术培训、资源备份、联合研究等,共同推进生物多样性保护。
2026-01-30 09:16
寒冬时节,云南省元江哈尼族彝族傣族自治县龙潭社区番荔枝种植基地里却热火朝天,一颗颗“冬日限定”的番荔枝被采摘、装箱,销往全国各地。
2026-01-30 09:14
“相对拥有百年历史的《科学》,《工程》才走过第一个十年。未来十年,我们要争取与世界顶级刊群比肩。”周济表示,这条路需要时间,以及学术评价观念、出版生态与国际化运营能力的协同推进。
2026-01-29 02:45
工业和信息化部28日公布,2025年,我国通信业实现平稳增长,产业结构持续优化,用户规模实现量质双升,5G、千兆等新型信息基础设施建设加快部署。
2026-01-29 02:55
中国科学院物理研究所近日发布《2025年度REBCO高温超导带材战略研究报告》(以下简称“报告”),这是国际上首份针对高温超导带材发展的系统性战略报告。
2026-01-29 02:55
2025年,山东省实现地区生产总值10.3万亿元,比上年增长5.5%。亮眼的成绩单,离不开创新动能持续发力。齐鲁大地上,科技创新和产业创新融合发展成果正在厚积薄发,新质生产力加速崛起,转型动能持续增强,高水平创新型省份建设的目标正在逐步实现,向着“十五五”征程稳步进发。
2026-01-29 02:45
近期,多家外国科技公司宣布计划将人工智能及数据中心送往太空,引发了科技界的热烈讨论。这一看似在科幻电影中才会发生的场景,已逐步从设想转变为现实。
2026-01-29 02:55
手机厂商将投入更多精力,通过形态变革、差异化外观设计、联名合作等,更好地满足用户的情绪价值需求,激发消费者购买欲望。
2026-01-29 09:02
截至2025年底,全国累计发电装机容量38.9亿千瓦,同比增长16.1%。2025年,风电光伏累计装机历史性超过火电,截至12月底已超出约3亿千瓦。
2026-01-29 09:01
1月27日上午,中国科学院大学星际航行学院揭牌仪式在中国科学院与“两弹一星”纪念馆举行,标志着该学院正式成立。从“东方红一号”划破天际到“祝融号”漫步火星,中国人的航天梦从未停止。
2026-01-28 02:45
2025年,我国区域科技创新布局更加优化,三大国际科技创新中心建设进入新阶段,区域科技创新中心建设取得新成效。
2026-01-28 02:45
打破产业间的壁垒,鼓励跨领域、跨行业的融合探索,推动资源要素的自由流动与高效配置,不仅能盘活存量资源、激发增量活力,更能催生具有引领性的新产业、新模式、新动能。
2026-01-28 02:45
合肥是儿童文学作家许诺晨的家乡。合肥科学岛,是她所拥有的一座得天独厚的科学和科幻题材的“硬核基地”,由她来写量子少年这个题材,可谓“近水楼台”。《量子女孩》(中国少年儿童新闻出版总社2025年12月出版)是她献给“量子新城”合肥的一部“家乡书”。
2026-01-28 02:55
北京火箭大街展示与运控中心作为商业航天测运控中心、商业航天公共服务平台的空间载体,将为企业提供卫星运控服务和交流推介平台。
2026-01-28 09:15
水稻耐不耐旱,和叶子的厚实程度相关,这是由什么因素决定的?日前,中国农业科学院作物科学研究所水稻分子设计技术与应用创新团队发现,水稻基因组中的三个耐旱基因可以“团队作战”,
2026-01-27 02:50
加载更多