作者:中国建设银行上海大数据智慧中心 陈宇钧 欧建林

随着科技的进步,全球正在加速进入“万物互联、泛在智能”的数字经济时代。商业银行在长期承担信用中介职能的过程中,依托其在资金流动中的枢纽地位,逐步积累了反映各类社会经济主体之间关系的有价值数据,形成了人与人、人与物、物与物之间连接的价值网络。图分析技术有助于商业银行对价值网络进行有效的建模、探索、挖掘,以及业务决策的优化与改进,为差异化竞争和实现业务创新带来新机遇。

图分析是一组分析技术,可用于探索感兴趣的实体(如组织、人员和交易)之间的关系。作为传统分析技术的重要补充,图分析技术可为数据管理、数据分析、人工智能和机器学习提供更大的支持,日益成为现代数据分析的重要基础。相比传统基于关系型数据结构的分析,图分析技术原生的点边结构模式及其支持的算法技术能够深度查询遍历数据之间的关系,从而获取更深层的数据洞察。

建设银行自2018年引入图分析技术以来,持续围绕数据能力、分析能力与应用能力等推进图分析能力建设工作,搭建了多位一体的图分析基础框架,构建了千亿级的全景化关系图谱,提供了多样化的图分析功能,可支持客户营销、产品创新、运营决策及风险管控等领域新模式的业务应用。

一、搭建多位一体的图分析基础框架

1.多位一体的基础框架是图分析与应用的动力引擎

建设银行针对数据分析工作不同阶段、不同应用场景等需要,基于图数据库工具,搭建部署了涵盖研发图分析、批量图分析、联机图查询等多位一体的图分析基础框架。其中,研发图分析用于满足数据分析人员进行数据分析与建模的需要;批量图分析用于满足图数据批量更新、图分析模型周期性跑批处理等场景需要;联机图查询通过API接口提供图查询能力,满足业务流程在线调用等场景需要。

2.在基础环境之上实现图数据库与其他系统之间的集成

一是构建图数据库与大规模并行处理(MPP)等关系型数据库之间的数据交换通道,满足将业务实体、关系属性等数据从关系型数据库同步到图数据库,以及将图计算结果数据同步到关系型数据库的需要;二是打通图数据库与SAS、Python等机器学习框架的融合通道,实现将图特征等作为机器学习模型的特征变量进行输入,满足机器学习模型研发与投产的需要;三是建立与营销应用组件、贷款应用组件等系统之间的批量数据推送、联机数据查询等数据服务调用机制。

二、构建全景化的关系图谱

全景化的关系图谱是图分析与应用的基础要素。建设银行运用知识图谱技术,基于行内外数据,构建了包含基础、推演、业务的三级层级结构的千亿级全景关系图谱。

1.基础关系图谱

基础关系图谱基于全量客户、多维数据,识别出企业、个人、商户、借记卡、信用卡、产品、用户ID、设备ID等多种业务实体,以及资金交易、投资、任职、担保、票据等多种基础业务关系。

2.推演关系图谱

推演关系图谱基于确定性的多维度基础关系,运用图计算、概率推理等算法,推断生成实体两两之间的新关系,如客户之间的综合亲密度、交易紧密度等。以综合亲密度为例,基于客户之间多维度的基础关系,运用六度空间理论,采用基于信任概率的亲密度算法,计算两两之间的综合亲密度。形成两两之间的综合亲密度后,再基于多度的图遍历算法,计算多度融合后的综合亲密度,形成客户之间的最终综合亲密度。

3.业务关系图谱

业务关系图谱是从基础关系图谱和推演关系图谱中抽取的子图,以满足不同业务部门的图分析应用需要,如产业链关系图谱、供应链关系图谱、用户ID关系图谱等。以用户ID关系图谱为例,其核心思想是利用联通子图等图算法,通过联通子图识别、主要核心ID识别、实体点相关性计算、实体点归属划分、新子图社群计算等处理过程,将来自客户信息管理、手机银行及其他App等不同数据源的多种用户身份标识进行合并,从而识别出不同ID隶属于同一个用户。

图数据模型设计是关系图谱构建的核心。建设银行基于图数据库的特点,通过多元关系转换、实体关系拆分合并等多种方式优化图谱数据结构设计,使之具有查询效率高、数据冗余少、扩展性强等优点。

三、提供多样化的图分析功能

多样化的图分析功能是推广图分析与应用的重要手段。为了满足不同人员技能、不同应用场景的图分析需求,建设银行提供多样化的图分析功能,为总分行业务分析师、数据分析师以及应用系统等数据消费者提供主动型、增强型、场景化的数据洞察,支持银行数字化经营。

1.支持业务分析人员自助式使用图分析功能

建设银行通过对业务场景的沉淀和提炼,封装图查询遍历、社区划分、中心度等算法,提供了关系链查询、关系链追踪、社群划分、核心客户发现等可视化交互分析功能,以无代码方式支持业务分析人员使用图分析能力进行业务运营支持,如资金流向分析、投资分析股权、核心客户挖掘等,从而降低图分析技术的应用门槛,使业务分析人员能够更加专注于创造性、高价值的业务,以形成更有效的业务运营分析与决策分析。

2.支持数据分析人员使用图分析功能

建设银行提供了可视化的IDE支持图数据分析和建模,并根据数据分析场景需要对图算法进行自主研发与封装,包括用于样本聚类的图划分算法、用于特征工程的图指标类算法、用于表示学习的图嵌入类算法等,支持数据分析人员更简便地将图分析融合到机器学习中,以获得更深入的数据洞察。

3.支持业务流程系统级调用图分析能力

建设银行根据业务场景需求提供数据推送、联机图查询API等数据服务供给模式,嵌入业务流程支持智能化决策,例如,提供企业关系链查询API服务,以支持授信审批中的集团客户认定。

四、支持新模式的业务应用

新模式的业务应用是图分析与应用的价值增益。图分析技术为商业银行提供了一种重新认识世界的方式,改变传统基于个体的认知模式,将个体置于网络去重新认知。这将助力商业银行创新基于社群、价值链的经营模式,驱动客户营销、产品创新、运营决策以及风险管控等领域业务创新与发展。

1.客户营销领域

建设银行利用图分析技术创新社群营销、链式营销的营销模式。一是利用图分析能力支持公私联动营销,通过分析目标企业的关系网络,找到关联人或企业作为营销突破口,通过优化重要关联人或企业服务获得引荐,从而成功将目标企业发展成本行客户;同时,通过开展公私联动,在企业客户的关系圈中挖掘潜在客户,成功营销企业法人、高管等亲密关系人成为个人客户。二是利用图分析能力支持供应链金融营销,锁定重点客户资金上下游企业与商户,有针对性地拓展供应链上重大客户;此外,分析供应链核心企业预付账款的金额和账期,根据客户上游对预付账款资金的需求,向其营销供应链融资业务。

2.产品创新领域

建设银行利用图分析技术创新普惠金融信贷、供应链金融等产品。一是根据个体工商户经营特点,以个体工商户及其实际控制人为准入评分对象,利用评分对象所处的社群,在评分模型中引入企业与企业综合亲密均值、企业与个人综合亲密度均值等评分指标,推出个体工商户经营快贷产品,推动普惠金融业务发展。二是基于供应链运作逻辑和风险特征,完善供应链金融产品,为链上企业提供存货质押、预付账款、应收账款、票据贴现等一揽子金融服务。

3.运营决策领域

建设银行利用图分析技术提供具象化的决策管理手段,以提升决策精准度。一是利用图分析能力辅助托管投资监督与业务准入决策,通过实时查询客户关系,核实管理人股权关系、关联公司情况等信息,高效精准地做好客户准入工作,同时,掌握管理人的资金流向,实现全流程监控,避免操作风险及声誉风险。将监督机制引入托管业务全流程,实现由“被动控”向“主动管”的转变。二是利用图分析能力辅助集团客户授信决策,通过多层股权穿透,以及共享实际控制人、法人、高管、股东及其亲属等关系,可以识别企业、自然人之间的关系,挖掘其潜在关联,确定集团边界,从而有效甄别高风险客户,防范多头授信、过度授信等风险。

4.风险管控领域

建设银行利用图分析技术创新链式风控模式,以提升风险管控能力。一是通过图分析等技术构建风险传导模型,发现客户之间风险传导的路径、时间、节点等特征,量化风险传导概率。风险传导模型的核心思想是,认为信贷客户的信用风险除了自身因素导致的原发性风险外,还包括通过资金链、担保关系等关联关系传递而来的外部因素导致的传导性风险。具体做法是基于客户所处的关联关系网,使用PageRank、Adar指数、Katz距离等算法,计算节点的中心度、节点对的邻域相似度及路径长度等与传导相关的图特征变量,运用随机森林、GBDT等算法构建风险传导预测模型,发现客户间风险传导路径及概率,并对潜在高风险客户进行风险预警。二是利用图分析技术识别团伙欺诈。欺诈者通常存在异常的交易行为模式和行为特征,欺诈团伙内部人员可能会在交易上下游、交易设备、联系方式、注册地址、关联人等维度存在关联。基于这些关联关系可将客户进行社区划分,利用积累的欺诈黑样本,计算节点维度和社区维度的图特征,训练机器学习模型,挖掘欺诈的行为特征,从而实现事中和事后的欺诈侦测。

图分析技术是数据分析领域的重要发展趋势,建设银行将不断追踪业界发展动态和前沿技术,继续推进流式图计算、时序图分析以及图分析与机器学习的交叉融合等技术应用,持续提升图分析与应用能力,为数字化业务发展赋能。

本文刊于《中国金融电脑》2022年第08期

声明:本文来自中国金融电脑,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。