作者

中国银联风险控制部总经理 王钰

中国银联风险控制部 郜捷 庞磊

中国银联风险控制部总经理 王钰

随着生成式人工智能的飞速发展,大模型在知识表示、推理建模、复杂场景适配等方面不断取得突破,有望成为应对犯罪产业化、攻击多样化、数据碎片化等现实挑战的关键技术支撑。本文系统探索大模型技术在支付风控场景下的应用路径与能力边界,围绕提示词与检索增强生成(Prompt&RAG)、监督微调与强化学习(SFT&RL)、预训练(Pre-Training)等不同层级的技术路线开展创新实践,旨在推动智能风控从“综合研判”向“智能决策”升级,为支付行业构建新一代风控体系提供实践参考。

一、整体思路:

大模型赋能支付风控的路径设计

近年来,大模型相关算法与技术成果正加速向各行业渗透,在金融支付领域尤其展现出显著的应用价值。以DeepSeek为代表的开源大模型的面世,进一步降低了企业应用大模型的技术门槛,为本地化部署与场景验证创造了有利条件。

1.大模型的技术框架与应用层级

当前,大模型的应用模式呈现出清晰的层级化发展路径,从上层工具化应用到底层基座模型建设,可划分为以下三级技术路径。

(1)Prompt&RAG

作为轻量化应用模式,该模式无需调整已充分预训练的开源大模型(以下统称“基座模型”)的结构或参数,仅通过优化Prompt或引入外挂领域知识库,即可快速适配特定业务场景。其部署成本低、响应速度快,但能力受限于基座模型的原始知识范围,适用于智能问答、规则解读等文本密集型任务。

(2)SFT&RL

该模式借助标注数据进行SFT,或结合RL优化输出策略,以提升模型在特定任务中的表现。其任务适配性更强,但底层语义理解仍依赖基座模型的预训练基础,存在“专业领域理解不深、跨场景泛化不足”的局限。

(3)Pre-Training

该模式涉及对基座模型本身的优化调整,分为基于通用模型的增量预训练(Continue Pre-Training)和完全基于自有数据构建基座模型的全量预训练(Full Pre-Training)。其中Full Pre-Training属于行业级基础设施,能够实现对模型全流程的自主掌控,显著增强其在专业领域的原生语义理解,并支持多模态扩展。尽管技术门槛高、投入大,该模式具备不可替代的长期价值。

2.支付风控的核心痛点与大模型应用思路

(1)支付风控的核心痛点

在移动支付快速普及的背景下,支付场景不断延伸,参与主体日趋多元,支付风险也呈现出“手法多样化、组织团伙化、技术智能化、传播隐蔽化”的新特征,传统风控体系面临严峻挑战。具体而言,当前支付风控存在以下三大核心痛点。

一是风险形态持续演变。风险从传统线下单一形态向线上线下交织转变,由交易环节的单点攻击向业务全链条渗透,并呈现出跨机构、跨渠道、跨区域蔓延趋势。

二是风险识别方法落后。现有风控模型多依赖事后经验与专家规则,难以对新型风险手法进行前瞻预判,导致风控长期处于被动响应状态。

三是风险预测精准不足。传统模型在识别准确率与响应速度方面存在局限,难以在支付便利性与风险拦截率之间实现有效平衡。

(2)支付风控大模型应用思路

大模型具备高效处理海量数据、深度提炼潜在规律、精准预测业务趋势的能力,为破解支付风控难题提供了全新思路。商业银行、支付公司等机构在业务开展中沉淀了海量数据资源,为大模型的应用奠定了坚实基础——既可支撑智能问答、规则建议等轻量化场景,也能够满足底层交易模型构建所需的大规模数据要求。基于此,本文以支付风控为典型场景,系统探索大模型从轻量调用到深度建模的演进路径,旨在构建具备自主理解、逻辑推理与自适应优化能力的新一代智能风控体系,助力支付行业实现更高质量的发展。

二、轻量落地:

基于Prompt&RAG打造风控数字员工

开源大模型凭借其在性能与成本之间的良好平衡,正加速应用于各垂直行业。但在支付风控等专业场景中,其自身存在的“专业知识缺口”问题也日益凸显。Prompt&RAG模式由于具备快速见效与成本可控的特点,成为弥补这一短板的可行路径。该模式通过构建行业知识库与智能助手,打造风控数字员工,能够充分发挥大模型快速响应的能力优势,有效提升风控基础效率与风险预判能力。

1.技术实现路径与优化策略

打造风控数字员工,关键在于借助专业领域知识增强大模型能力,以解决通用模型存在的知识过时、输出缺乏依据、专业场景适配性差等问题,具体实现路径如下。

(1)构建结构化知识库

对内部控制制度、监管政策、风险案例及历史处置经验等知识进行系统梳理,将其按语义单元切分为独立文本块,再通过大模型转化为嵌入向量,并存储于向量数据库中,从而构建起支持高效检索的结构化知识体系。

(2)实现RAG

针对用户提出的问题,系统首先基于问题从知识库中精准检索相关文本片段,随后将问题与检索到的片段拼接为结构化Prompt,并输入大模型。大模型结合上下文信息生成回答,从而确保输出内容有明确依据。

(3)实施全流程优化

在检索环节,采用“余弦相似度初筛+交叉编码器精排”的组合策略提升检索精度,并利用Jaccard相似度去除重复片段;在文本处理环节,依据大模型的Token限制动态调整文本块大小,以避免关键信息被截断;在Prompt设计方面,通过明确模型角色与输出格式,进一步增强回答的规范性。

2.典型应用场景与实践成效

(1)内控制度智能审查

中国银联通过构建业务流程全覆盖的内控制度知识库,打造了“内控智能问答助手”。该应用能够支持风控人员7×24小时查询制度条款、校验合规要求、获取案例参考,并辅助起草制度文件。该应用已面向中国银联内部数百名业务人员开展测试,累计提供上千次精准解答,显著降低了制度学习成本,有效提升了合规审查效率。

(2)非法平台预警侦测

中国银联通过整合各类风险信息源,构建了具备“自我驱动、链式推理”能力的“非法平台侦测助手”。该应用可定期从非结构化文本(如用户投诉、黑产情报、网络信息)中提取结构化数据,识别不同非法App之间的团伙关联关系与最新欺诈手法,并生成如“欺诈手法—平台关联矩阵”“地区风险热力图”“高风险交易明细”等分析结果,助力风控人员精准识别高风险用户与商户,实现风险的早发现、早处置。

三、有机协同:

基于SFT&RL提升电诈风险识别力

传统反电诈风控主要依赖专家规则与机器学习模型,在复杂场景中存在明显局限:对交易上下文理解不足,难以识别隐蔽的风险特征;输出结果“黑箱化”,缺乏清晰的推理过程;对新型电诈手法的泛化能力弱,需频繁更新迭代。自DeepSeek-R1推理模型发布以来,RL逐渐成为提升大模型推理能力的重要技术路径之一。基于SFT&RL模式,可构建具备“因果链推理、合规化输出、场景自适应”能力的反诈大模型,并与现有风控方法高效协同,从而提升复杂风险交易的识别效果。

1.技术实现流程与核心方案设计

反诈大模型的训练流程包括“数据蒸馏—SFT—RL”等环节(如图1所示),其关键步骤如下。

图1 反诈大模型的训练流程

(1)高质量训练集构建

可以DeepSeek-R1等超大规模推理模型为“教师模型”,结合反电诈领域知识设计场景化Prompt。在人工标注数据稀缺的前提下,通过少样本提示(Few-Shot Prompting)与思维链引导(Chain-of-Thought)生成推理样本,再经人工审核与自动化工具对样本进行校验与清洗,确保数据具备逻辑完整性、场景贴合性与因果一致性,从而构建结构化SFT数据集。

(2)SFT阶段

可将Qwen2.5等开源模型作为基座,采用量化低秩适配器(Quantized Low-Rank Adapter,QLoRA)技术进行高效的SFT——冻结模型主干参数,仅在关键层中插入可学习的低秩权重。本阶段重点训练模型三方面能力:理解交易上下文与风险特征、分析交易路径与账户行为模式,以及输出符合规范的文本报告与因果推理链条。

(3)RL阶段

在SFT的基础上,引入RL以进一步提升模型输出质量。通过设计“双维度奖励函数”,分别针对“任务完成度”和“合规约束”进行RL与专项提升;采用近端策略优化(Proximal Policy Optimization,PPO)和组相对策略优化(Group Relative Policy Optimization,GRPO)算法对策略进行调优。在平衡模型探索能力与输出稳定性的同时,最终生成具备高质量、可解释与强合规特性的分析报告。

2.反电诈业务应用价值

基于SFT&RL技术构建的反诈大模型,通过与现有大小模型协同工作,可进一步筑牢反诈防线。其应用价值主要体现在以下三个方面。

一是加速模型迭代。利用大模型推理与发散的能力,实现从底层交易数据到风险特征规则的自动化工作流编排,扩展专家特征体系,大幅提升智能评分模型的迭代效率,使模型上线周期缩短60%。

二是消除风险盲点。通过模拟风险专家的分析经验,系统能够以更快速度分析漏抓、漏报的风险案例,形成可追溯的思维链,补充原有规则中的遗漏点,从而提升智能评分模型的覆盖范围,快速降低风险敞口。

三是提升识别精度。基于LoRA与8-bit量化技术,对机器学习初步筛选出的高风险交易进行语义解析、路径追溯与主体判别,实现对规则识别结果的二次验证与逻辑补充,有效提升模型整体的识别准确率。

四、底层革新:

基于Full Pre-Training构建交易大模型

参考大模型等前沿技术,并采用改进的Transformer架构,可将支付交易数据视为一种独特的多模态时序数据进行建模,从而构建具备交易通用理解能力的交易大模型,为支付风控等业务场景提供底层能力支撑。

Full Pre-Training的核心在于通过自监督学习使模型掌握交易行为规律,从而形成对交易特征、用户习惯及风险模式的通用理解能力。该能力不依赖于具体风控任务,可借助SFT快速适配伪冒欺诈、电信诈骗等不同下游场景,有效降低对人工特征工程和标注数据的依赖,提升风控模型的开发效率与泛化性能。

1.交易大模型技术框架与核心设计

交易大模型的总体实施分为两个阶段:第一阶段(Full Pre-Training)为核心环节,重点针对交易数据与自然语言的结构差异改进Transformer架构,完全基于支付交易数据从零开始进行自监督训练,使模型自主学习交易行为规律,形成具备通用理解能力的交易基座大模型;第二阶段(下游任务适配)侧重于价值转化,基于少量标注数据对基座模型进行微调,以在反欺诈、反电诈等具体场景中验证其通用能力的适配效果。

交易大模型以“捕捉交易本质规律”为核心理念,结合支付交易特性进行如下针对性设计。

(1)交易序列建模方法

借鉴语言模型对文本的Token化方法,将用户历史交易视为“交易序列”。每笔交易类比一个“词”,包含时间、金额、商户、场景等多维特征;将用户在特定时间窗口内的交易按时间顺序排列,构建可供模型学习的序列数据结构(如图2所示)。

图2 交易序列建模方法

(2)三层架构设计

交易大模型采用“嵌入层—编码层—解码层”的三层架构。嵌入层用于将交易序列转化为统一的向量表征;编码层基于Transformer架构和自注意力机制,捕捉交易序列的上下文关联规律,从而增强向量表征;解码层则根据编码后的表征预测后续交易特征,并通过与真实交易数据的对比构建损失函数,以驱动模型的自监督学习过程。

(3)自监督训练策略

交易大模型充分利用海量无标注交易数据进行自监督Pre-Training,通过“下一步预测”“多步预测”等自监督目标,使模型自主学习交易行为中的潜在规律与模式。

2.交易大模型应用价值分析与场景验证

笔者团队通过自监督预训练构建了十亿级参数规模的交易大模型,深入学习了百亿规模交易数据中的业务规律。该模型的业务价值主要体现在以下几个方面。

一是弱化对人工特征工程的依赖。模型能够直接从原始交易数据中提取高阶特征,将低结构、高噪声的原始数据转化为高质量建模资产,解决支付行业中“数据丰富但标签稀缺”的问题。

二是增强跨场景泛化能力。模型基于统一的基座,无需针对不同风险类型分别构建模型,仅需通过少量样本微调即可适配反欺诈、反电信诈骗等多种场景,可显著提高模型复用效率并降低维护成本。

三是发挥数据规模优势。模型性能随样本规模增长而提升,支付行业积累的海量交易数据可为模型性能的持续优化提供可靠保障。

在重点场景验证中,交易大模型在反欺诈、反电诈等领域展现出显著价值。以电诈资金链防控为例,数据表明,模型可在现有规则与模型体系的基础上,额外识别约30%的涉案账户,从而显著提升风险识别的覆盖率与精准度。

五、应用建议:

大模型在金融业的深化方向

本文的实践经验表明,大模型在支付风控领域的应用可遵循“实用优先、分层推进”的原则:借助Prompt&RAG解决基础效率问题,实现快速落地见效;通过SFT&RL深化场景适配,提升决策质量;借助Pre-Training提升风险防控的底层能力与执行效率。这一“轻量应用—有机协同—底层革新”的推进路径,可有效降低技术落地风险,并加速业务价值的释放。

结合行业痛点与技术发展趋势,未来大模型在金融领域的深化应用可重点聚焦以下方向:一是推动模型结构创新,在现有大模型基础上引入图神经网络与多模态建模等技术,增强对复杂交易图谱和跨渠道风险关联的识别和预判能力;二是构建数据协同机制,采用联邦学习等隐私保护技术,推动跨机构联合建模,打破“数据孤岛”,激活行业数据要素价值,从而提升整体风控效能;三是实现业务闭环构建,将大模型深度融入风控、合规、审计等全流程,打通“风险识别—智能预警—精准处置—效果复盘”的业务链条,构建一体化风险管理体系;四是完善监管框架,建立覆盖准确性、合规性、稳定性与可解释性等方面的评估标准,确保大模型在实际应用中可用、可信、可控。

大模型在支付风控领域的应用正逐步从探索阶段迈入实用阶段。随着技术持续演进及与场景深度融合,大模型有望推动构建具备自适应、可解释与高可靠特征的新一代风控体系,为金融行业高质量发展注入新动能。

本文刊于《中国金融电脑》2026年第1期

声明:本文来自中国金融电脑,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。