点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:AI赋能金融高质量数据集建设,怎么看、怎么办、怎么干
首页> 科技频道> 人工智能 > 正文

AI赋能金融高质量数据集建设,怎么看、怎么办、怎么干

来源:光明网2025-09-11 16:16

  光明网讯 国务院印发的《关于深入实施“人工智能+”行动的意见》指出,“加强数据供给创新。以应用为导向,持续加强人工智能高质量数据集建设。”当前,高质量数据集已成为驱动行业大模型应用落地的“核心燃料”。

  近日在贵阳举办的2025数博会上,建设高质量数据集、加快促进数据要素流通交易和释放数据价值成为讨论焦点。其间,浪潮软件集团金融业务总监王香萍分享了浪潮软件集团的探索与实践,为金融行业借助 AI 技术构建高质量数据集提供了参考样本。

AI赋能金融高质量数据集建设,怎么看、怎么办、怎么干

  王香萍(主办方供图)

  随着“人工智能+”行动的深入推进,人工智能在各行业的应用场景由点到面、由浅入深,正发生质的跃迁。这一变革浪潮中,金融行业作为数字化转型的前沿阵地,迎来从“数字化”向“数智化”跨越的重要机遇。伴随金融行业的发展,浪潮历经了从信息化到数字化、从数字化到“数智化”的升级,目前正在以深厚行业积累和AI、大数据技术,助力金融行业客户进入数智新时代。

  浪潮在深入参与数智金融建设中,认识到金融高质量数据集是驱动AI技术落地的基石。一方面,金融业务处理过程中产生的海量过程材料,为数据集的构建提供了丰富素材;另一方面,人工智能技术又能反向赋能数据集——通过精准处理、智能分析,不断丰富数据集的维度与价值。尤其在金融这一高度专业化的领域,数据必须具备高精准性、强行业规范性、高行业适配性三大核心特质,才能确保 AI 垂类模型训练“不跑偏”、决策优化“行业适用”,真正发挥技术价值。

  在王香萍看来,在商业银行核心的信贷风控领域,AI 技术的价值尤为突出。过往 AI 多聚焦 C 端金融应用,如今随着小微企业 B 端需求激增,其应用重心逐步转移。小微企业数量大、单体授信额度小、业务频次高、覆盖范围广的特点,对信贷风控的数据治理与高质量数据集生成提出更高要求。

  以商业银行普惠小微金融业务中高频次使用的“尽调报告”为例,其数据治理需重点突破两大核心要点:一是关系网精准构建。借助AI技术能够准确梳理企业股权链、供应链,以及企业实控人与经营团队的关系链,确保关联信息无遗漏、无偏差;二是单体、行业与异常特征值智能生成。通过AI技术自动计算企业财务指标与非财务指标,并与细分行业、通用行业的当期及历史数据进行对比分析,精准识别原始材料异常与外部信息异常,为风控决策提供全面的“风险画像”。

  针对这一需求,浪潮软件集团依托“星耀・模型引擎”,通过数据采集治理、模型深度分析两大核心能力,实现了对高质量尽调报告的自动化筛查与精准标注,大幅提升了尽调效率与数据质量。

  在实践中,浪潮软件集团已形成“数据底座支撑层—采存加工层—大模型加小模型决策引擎层—高质量数据集”的一体化实现路径。借助要素核查、行业分析、财务健康分析等轻量子模型,对小微企业尽调报告的质量、真实性进行评价与异常预警,以“小步快跑”的思路完成结构化与半结构化数据向高质量数据集的升级,既贴合金融业务逻辑,又能快速响应市场需求。

  王香萍表示,尽管AI为金融高质量数据集建设提供了有力支撑,有助于提升金融风控水平,然而不可忽视的是,在实践中仍面临不少挑战。诸如,业务与技术领域对多模态数据处理标准的理解偏差,导致数据应用衔接不畅;金融专业知识积累难度大,制约模型稳定性提升;信贷逻辑与技术逻辑的冲突,影响数据集实用性;同时,金融行业惯例下,结果可解释性与审计可溯源性难以满足监管要求等。

  金融高质量数据集建设面临广阔的机遇。在商业银行普惠金融领域,小微用户在授信、用信等金融行为中产生了海量数据。这些宝贵的“数据富矿”,为人工智能技术助力高质量数据集生成提供了坚实基础。随着人工智能技术的持续升级,以及数据要素与金融建设的深度融合,“以AI技术赋能金融高质量数据集建设”已具备广阔的应用空间与市场前景。

  王香萍认为,金融行业“在发展中防风险、在创新中保安全”的审慎监管逻辑,需贯穿AI赋能高质量数据集建设全过程。首先要严控数据源头质量,避免财报质量低、要素缺失等问题影响数据可信度;其次需明确法律、责任、条线归口,解决权责模糊问题;再者要强化隐私保护,防范企业与个人信息泄露;同时需警惕AI模型精准度不足或“AI幻觉”引发的风控“茧房”风险,以及数据传输中的网络安全风险。

  为此,浪潮软件集团倡议,金融科技厂商与金融机构需以开放态度推动技术创新,以审慎操作守住风险底线,共同实现“技术创新源自规范、AI能力创造价值、数智升级引领发展”的目标,为数字金融高质量发展注入新动能。(记者 战钊)

[ 责编:张佳兴 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 北京刑警举行“五四青年节辩论赛”

  • 2026年“中华美食荟”活动启动

独家策划

推荐阅读
2010年,舒易来获得赴美国哈佛大学麻省眼耳医院联合培养的机会,在该院陈正一教授课题组继续开展耳聋治疗研究。2014年,舒易来带着最前沿的基因编辑理念回到复旦大学附属眼耳鼻喉科医院,继续探索耳聋治疗的新方法。
2026-04-29 10:43
一张4厘米见方、6微米厚的薄膜贴附于大脑功能区表面的硬脑膜外,就能采集到大脑信号。“北脑一号”已在研究者发起的临床研究中完成7例患者植入手术,器械在人体内累计工作时长超4.5万小时,初步验证产品的安全有效性。
2026-04-29 10:38
生物医药基础科研水平大幅提升。据统计,2023年,中国学者在生物医药领域三家全球顶尖学术刊物《细胞》《自然》《科学》发表的文章数量,跃升至全球第二,仅次于美国。在评选出的“2024年医疗界十大临床突破”中,有四项来自中国。
2026-04-29 10:33
乘坐自动扶梯时,很多人有“左行右立”的习惯:右侧站立,左侧留给赶路行人。可如果“左行”撞到了“右立”,还造成了一定损失,要担责吗?近期,上海铁路运输法院审结了一起相关案件。
2026-04-29 10:27
4月27日,农业法修订草案提交十四届全国人大常委会第二十二次会议审议。为突出耕地等农业资源保护和农业绿色发展,草案将现行农业法第八章“农业资源与农业环境保护”分为“土地等农业资源保护”“农业绿色发展”两章。
2026-04-29 10:13
教育部今天(28日)发布《普通高等学校本科专业目录(2026年)》,共新增38种普通高校本科新专业。本次获批申办高校可纳入2026年高考招生。
2026-04-28 11:22
目前,本科专业目录共涵盖13个门类、92个专业类、883种专业。
2026-04-28 11:20
中国农业科学院作物科学研究所小麦基因资源发掘与利用创新团队近日成功克隆了调控小麦分枝与主茎之间角度的关键基因,并揭示了其平衡调控小麦“站姿”的分子机制。
2026-04-28 10:01
作为牵头用户,生态环境部已有8颗环境和大气系列卫星在轨运行,还可统筹调用140余颗民商卫星数据资源。
2026-04-28 10:00
西南大学徐洛浩、刘海平教授团队联合德国科学院院士阿克塞尔·迈尔开展攻关,成功破解相关科学难题。
2026-04-28 09:59
人工智能的崛起为人类社会开启了变革的新纪元,深刻重塑着我们生活与生产的各个方面。而作为文明传承与思维锻造的核心路径,阅读在这一浪潮中经历着前所未有的影响与重构。
2026-04-28 09:57
透视农业农村经济“开门红”,其背后是国家战略引领、政策有力支持和市场社会力量的协同发力。
2026-04-28 09:46
外商投资安全审查工作机制办公室(国家发展改革委)依法依规对外资收购Manus项目作出禁止投资决定,要求当事人撤销该收购交易。
2026-04-27 16:54
当前,具身智能产业站在商业落地的临界点,一场从“炫技”到“干活”的务实转向正在悄然发生。
2026-04-27 15:39
以往以机械素质、品牌底蕴为核心卖点的外资车企,纷纷将智能化作为参展的核心主线。
2026-04-27 14:48
这里是淳安国家储备林示范基地,587亩山林经过精心打造,早已不是传统意义上的林场。480多亩杉木林完成阔叶化改造,浙江楠、浙江樟等珍贵树种错落生长;430亩“有路、有房、有水、有轨、有网、有电、有眼”的“七有”林业标准地里,黄精、白芨、三叶青等中药材长势旺盛,菌菇悄悄破土;30多亩梅花观光园内,880株梅花迎春绽放,成为游客青睐的打卡地。
2026-04-27 13:53
近年来,科普视频越来越多地成为公众获取科技知识的重要渠道。
2026-04-27 13:35
中国科协在中国科学家博物馆举行“全民阅读活动周·科学家精神故事会”暨科学家精神主题丛书发布活动。
2026-04-27 12:53
今年4月25日是第四十个“全国儿童预防接种日”,主题是“预防接种,苗助健康,全民行动”。
2026-04-27 10:05
从古人立竿测影、夜观北斗辨识方向,到北斗卫星导航系统提供全天候、高精度的时空信息服务——科技发展沧海桑田,但人类对“我在哪里、我要去哪、如何到达”的追问从未停歇,其指向始终是更好地认识世界、利用资源、服务发展。
2026-04-27 10:03
加载更多