点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

近日,中国工业互联网研究院发布《人工智能大模型工业应用能力测评报告》。报告显示,由北电数智自主研发的“骄阳・工业大模型”在核心工业场景能力评测中表现突出,尤其在工具调用、多步推理、工业标准问答、产品客服四项关键评测维度,位列参评国产大模型首位。
据了解,本次测评重点突出面向智能体任务应用特点,围绕自主规划、多步推理、工具调用、环境交互等能力维度,进行大模型智能体组件级能力测试。同时,在场景能力方面,首次面向工业标准问答、工业单据识别等大模型创新场景进行应用成熟度测评。
在智能体工具调用能力测试中,“骄阳·工业大模型”综合排名位列国产大模型第一,在工具选择与参数匹配等细分能力上表现突出,标志着模型具备强大的自主或半自主执行任务能力,可通过与多系统交互,优化或辅助复杂工业流程落地,为工业场景自动化运营奠定基础。
在智能体多步推理能力测试中,“骄阳·工业大模型”展现了出色的记忆管理、任务多步执行与错误检测能力。在实际工业环境中,模型在处理类似设备故障诊断、工艺参数优化等复杂的工业任务流程时,能够准确调用历史信息与中间结果,减少人工干预成本,实现更高效、更精准的工业化运营与流程优化。
在智能体自主规划能力测试中,“骄阳·工业大模型”的表现位居国产大模型前列。在任务分解、约束识别与动态校准三项细分能力上具有突出优势,这让模型能够根据不同条件,实时优化生产排程、资源调度等多约束复杂任务;同时,出色的自主规划能力也让模型能够将长流程目标系统拆解为可执行步骤,从而提升智能排产、工艺优化等工业场景下决策的可靠性与敏捷性。
此外,工业场景能力测试专项中,“骄阳·工业大模型”在工业标准问答、产品客服能力等方面表现优异。
作为北电数智面向泛工业场景自主研发的大模型,“骄阳·工业大模型”已在装备制造、医疗器械、家纺印刷等领域部署应用,并取得多项标杆成果。(战钊)
