点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:AI赋能金融高质量数据集建设,怎么看、怎么办、怎么干
首页> 科技频道> 人工智能 > 正文

AI赋能金融高质量数据集建设,怎么看、怎么办、怎么干

来源:光明网2025-09-11 16:16

  光明网讯 国务院印发的《关于深入实施“人工智能+”行动的意见》指出,“加强数据供给创新。以应用为导向,持续加强人工智能高质量数据集建设。”当前,高质量数据集已成为驱动行业大模型应用落地的“核心燃料”。

  近日在贵阳举办的2025数博会上,建设高质量数据集、加快促进数据要素流通交易和释放数据价值成为讨论焦点。其间,浪潮软件集团金融业务总监王香萍分享了浪潮软件集团的探索与实践,为金融行业借助 AI 技术构建高质量数据集提供了参考样本。

AI赋能金融高质量数据集建设,怎么看、怎么办、怎么干

  王香萍(主办方供图)

  随着“人工智能+”行动的深入推进,人工智能在各行业的应用场景由点到面、由浅入深,正发生质的跃迁。这一变革浪潮中,金融行业作为数字化转型的前沿阵地,迎来从“数字化”向“数智化”跨越的重要机遇。伴随金融行业的发展,浪潮历经了从信息化到数字化、从数字化到“数智化”的升级,目前正在以深厚行业积累和AI、大数据技术,助力金融行业客户进入数智新时代。

  浪潮在深入参与数智金融建设中,认识到金融高质量数据集是驱动AI技术落地的基石。一方面,金融业务处理过程中产生的海量过程材料,为数据集的构建提供了丰富素材;另一方面,人工智能技术又能反向赋能数据集——通过精准处理、智能分析,不断丰富数据集的维度与价值。尤其在金融这一高度专业化的领域,数据必须具备高精准性、强行业规范性、高行业适配性三大核心特质,才能确保 AI 垂类模型训练“不跑偏”、决策优化“行业适用”,真正发挥技术价值。

  在王香萍看来,在商业银行核心的信贷风控领域,AI 技术的价值尤为突出。过往 AI 多聚焦 C 端金融应用,如今随着小微企业 B 端需求激增,其应用重心逐步转移。小微企业数量大、单体授信额度小、业务频次高、覆盖范围广的特点,对信贷风控的数据治理与高质量数据集生成提出更高要求。

  以商业银行普惠小微金融业务中高频次使用的“尽调报告”为例,其数据治理需重点突破两大核心要点:一是关系网精准构建。借助AI技术能够准确梳理企业股权链、供应链,以及企业实控人与经营团队的关系链,确保关联信息无遗漏、无偏差;二是单体、行业与异常特征值智能生成。通过AI技术自动计算企业财务指标与非财务指标,并与细分行业、通用行业的当期及历史数据进行对比分析,精准识别原始材料异常与外部信息异常,为风控决策提供全面的“风险画像”。

  针对这一需求,浪潮软件集团依托“星耀・模型引擎”,通过数据采集治理、模型深度分析两大核心能力,实现了对高质量尽调报告的自动化筛查与精准标注,大幅提升了尽调效率与数据质量。

  在实践中,浪潮软件集团已形成“数据底座支撑层—采存加工层—大模型加小模型决策引擎层—高质量数据集”的一体化实现路径。借助要素核查、行业分析、财务健康分析等轻量子模型,对小微企业尽调报告的质量、真实性进行评价与异常预警,以“小步快跑”的思路完成结构化与半结构化数据向高质量数据集的升级,既贴合金融业务逻辑,又能快速响应市场需求。

  王香萍表示,尽管AI为金融高质量数据集建设提供了有力支撑,有助于提升金融风控水平,然而不可忽视的是,在实践中仍面临不少挑战。诸如,业务与技术领域对多模态数据处理标准的理解偏差,导致数据应用衔接不畅;金融专业知识积累难度大,制约模型稳定性提升;信贷逻辑与技术逻辑的冲突,影响数据集实用性;同时,金融行业惯例下,结果可解释性与审计可溯源性难以满足监管要求等。

  金融高质量数据集建设面临广阔的机遇。在商业银行普惠金融领域,小微用户在授信、用信等金融行为中产生了海量数据。这些宝贵的“数据富矿”,为人工智能技术助力高质量数据集生成提供了坚实基础。随着人工智能技术的持续升级,以及数据要素与金融建设的深度融合,“以AI技术赋能金融高质量数据集建设”已具备广阔的应用空间与市场前景。

  王香萍认为,金融行业“在发展中防风险、在创新中保安全”的审慎监管逻辑,需贯穿AI赋能高质量数据集建设全过程。首先要严控数据源头质量,避免财报质量低、要素缺失等问题影响数据可信度;其次需明确法律、责任、条线归口,解决权责模糊问题;再者要强化隐私保护,防范企业与个人信息泄露;同时需警惕AI模型精准度不足或“AI幻觉”引发的风控“茧房”风险,以及数据传输中的网络安全风险。

  为此,浪潮软件集团倡议,金融科技厂商与金融机构需以开放态度推动技术创新,以审慎操作守住风险底线,共同实现“技术创新源自规范、AI能力创造价值、数智升级引领发展”的目标,为数字金融高质量发展注入新动能。(记者 战钊)

[ 责编:张佳兴 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 宁夏:社火欢腾闹新春

  • 青海原子城里的“开学第一课”

独家策划

推荐阅读
我国生成式人工智能用户规模和普及率快速提升。
2026-03-03 09:37
本报讯(记者陶稳 通讯员张莹)突然出现头晕、头痛、视力障碍、肢体麻木无力,持续几分钟到几小时,无法缓解……遇到这些情况别大意,可能是“沉默的杀手”脑梗死在作祟。
2026-03-03 09:35
近日,中国科学院青岛生物能源与过程研究所太阳能光电转化与利用全国重点实验室联合香港科技大学研究团队,在钙钛矿太阳能电池埋底界面工程领域取得重要突破。
2026-03-03 09:34
今年元宵节,适逢月全食。新华社发(刘兵 摄)  本次月全食将从3日傍晚开始,整个过程主要分为半影食始、初亏、食既、食甚、生光、复圆、半影食终七个阶段。2025年9月7日夜晚至8日凌晨,在山西大同古城墙乾楼拍摄的月全食轨迹(多张堆栈),形似“金箍棒”。
2026-03-03 09:33
水稻患上了病毒病,往往矮化、分蘖(稻等植物发育的时候,在幼苗靠近土壤的茎节上生出分枝)增多,严重的甚至绝收。这一成果不仅解决了困扰学界的植物抗病毒免疫扩增谜题,更为培育“抗病不减产”的水稻新品种开辟了全新路径。
2026-03-03 09:33
这三项国家标准是:《食品安全国家标准 植物源性食品中352种农药及其代谢物残留量的测定液相色谱-质谱联用法》《食品安全国家标准 植物源性食品中242种农药及其代谢物残留量的测定 气相色谱-质谱联用法》和《食品安全国家标准植物源性食品中草甘膦等4种农药及其代谢物残留量的测定 液相色谱-质谱联用法》。
2026-03-03 09:32
由中国科学院古脊椎动物与古人类研究所主导的一项研究,在江西省九江市武宁县志留纪地层中发现盔甲鱼类大庸鱼科一新属种——武宁西海鱼。
2026-03-03 09:32
太空探索技术公司下属企业xAI为该项目另一竞争方,尽管其创始人埃隆·马斯克长期表示反对开发“杀人的新工具”。
2026-03-02 13:02
国家能源局发布的数据显示:截至2025年底,我国可再生能源总装机达到23.4亿千瓦。
2026-03-02 09:57
多国正将AI、物联网与大数据融入现有空气监测体系,追踪大气变化,预警污染风险,为人类在数字时代的每一次呼吸保驾护航。
2026-03-02 09:56
北部湾海域油田无人机系统运营项目正式落地,这是我国海上油田首次实现无人机规模化作业,为海洋能源开发与低空经济融合提供了实践范例。
2026-03-02 09:55
很多人都有过这样的疑问:AI离真正成为“人”,到底还有多远?研究人员表示:有突破,但仍有难以逾越的鸿沟,短期内无法实现“类人完整智能”。
2026-03-02 09:55
人工智能不再只会“死记硬背”了——我国科研团队最新研发出一种新型神经网络,让AI能像人类一样,从看到、听到的信息里自己提炼概念、理解含义,还能互相交流。
2026-03-02 09:53
国家统计局2月28日公布《2025年国民经济和社会发展统计公报》。
2026-02-28 17:21
人们常说“眼见为实”,但如果今天再问一个问题:照片还能算现实的记录吗?答案或许已经不像过去那么简单。
2026-02-28 10:27
国家能源局27日发布的数据显示,目前,全国已有84个绿电直连项目完成审批,新能源总装机规模3259万千瓦。
2026-02-28 10:25
“具身天工3.0”刚刚发布——首届机器人半马赛事冠军正在加紧训练,成绩有望大幅提升;朱雀三号重复使用火箭蓄势待发,计划二季度再次挑战回收复用;小米汽车超级工厂的生产线一片繁忙,累计交付量已突破60万辆……
2026-02-28 10:23
今年以来,水利部指导督促各地抢抓河湖枯水期、施工影响小的窗口期,不断推动国家水网联网、补网、强链。
2026-02-28 10:22
几十年来,关于月球早期磁场是强是弱,科学界一直争论不休。如今,英国牛津大学科学家通过分析阿波罗任务带回的样本,发现月球曾拥有极强磁场,强度甚至一度超过地球磁场。
2026-02-28 10:19
发现分数量子反常霍尔效应和里德堡莫尔激子态,解决超导量子计算难题,攻克国产无液氦稀释制冷机和极高场全超导磁体等关键实验技术……
2026-02-27 09:39
加载更多