数据是资产的概念已经成为行业共识。然而现实中,对数据资产的管理和应用往往还处于摸索阶段,数据资产管理面临诸多挑战。

为进一步促进数据资产价值相关问题的研究交流,2018年12月13日,由中国信息通信研究院、中国通信标准化协会主办的“2018数据资产管理大会”在京召开。中国建设银行股份有限公司副总经理尚波进行了《中国建设银行的数据能力建设》的演讲。

主讲人:尚波

在演讲中,他详细的回顾了建行企业级数据能力建设历程与认知过程,从业务数据化、数据资产化考虑,以建行为出发点,将讨论延伸至其他行业与企业的数据管理能力,同时阐述了多项数据应用能力,并对未来做了切实展望。

以下为演讲实录

各位领导,各位嘉宾,今天我很荣幸能够代表中国建设银行给大家报告一下我们在数据能力建设方面的实践和体会。

我的报告分主要分为四部分。第一部分介绍中国建设银行数据能力建设的历程。在这一部分,实际上整个中国建设银行数据能力建设是与中国建设银行信息化建设的历程一脉相承、同步进行。我们分成了五个阶段,第一阶段是以84年为起点到2003年,这一阶段叫做“不关注”,在此期间中国建设银行的重点是将业务电算化,实现从“单点”到“城市内联网”。并进行城市通兑网与省级大联网,最终在2005年实现全国大联通。当时大家将业务数字化,但是对数据的管理和应用依然没有准确的概念。

第二阶段叫做“起步”。2003年中国建设银行总行成立了信息中心,也就是数据管理部的前身,其中有一支队伍专门关注数据管理。与此同时,我们提出了数据管控的一些概念,制定了相应的数据标准,规划和搭建建设银行的数据仓库。由2003年的规划到2004年的建设,再到2005年上线,我们成为了在大银行里第一家建成了数据仓库的银行。

第三阶段是“打基础”,时间是2007年到2010年。2007年建设银行股改上市会以后,与美国银行开展战略合作,美银在数据治理和数据管理方面给予了我们很大的帮助,带领我们去研究数据能力框架。同时也是我们数据管理部实施新资本协议第三支柱的牵头人,在理念上、规范上与仓库建设上,我们都在这一阶段打下了很好的基础。

第四阶段是“体系化”。2011年中国建设银行开始对全行的核心业务系统进行重构,打破原来所有的系统,按照组件化、模型驱动的方法构建建设银行新一代的核心系统,为期六年。通过新一代核心系统,再加之我们在前期的积累,中国建设银行建立了数据管理体系和数据应用体系。为什么叫体系化?是因为我们建立了两个体系,从数据能力建设的角度看,这两个体系从2007年开始就不断的被优化。

第五阶段是“持续优化”。在这样一个数据化的时代,我们已经把数据视作资产、视作战略资源加以管理和应用。 

第二部分,在2007年美银专家开始带领开始建设数据能力的框架,明确我们在数据能力建设方面必须去做的事情或者暂时没有能力去实现的事情,使我们不会走偏。2007年搭建的这个框架参考了美银、IBM的能力框架,同时也借鉴了DAMA。但是在2007年以后,我们也在不断地学习和应用新技术、新工具,并顺应数据行业的发展,对数据的应用、数据管控机制和管理类数据的需求与统筹管理等方面入手,修订、补充、完善这个框架。 

业务数据化。中国建设银行的新一代核心系统的建设靠模型驱动,不是传统的写文字。我们主要有两大核心模型,一个是数据模型,另一个是流程模型。从数据的角度来看,我们参考了IBM金融服务数据模型,从ABCC’到D,最核心的一块是C。C模型是企业界的逻辑数据模型,涵盖了建设银行所有的产品和服务涉及的业务基础数据, C’模型是应用级或者叫组件级的模型。建设银行根据C模型组建指导C’模型设计,最终落地到数据库。企业界的C模型把建设银行所有数据的规范和标准进行统一的定义,包括代码。左边我们定义了建设银行所有的基础数据,右边可以从业务视角看指标或者从数据视角看衍生数据。由底层到上面有一套管控机制,这套管控机制保证中国建设银行的任何一个数据,不论是基础数据还是汇总数据或者指标数据,都是通过单点去创建。从而避免了企业常见的同名不同义,或者同义不同名的情况。通过两套模型的技术标准规范定义,企业数据的标准唯一便可确认。 

数据资产化,刚才我们谈业务要数据化,数据要资产化,资产化我们借助底层的一系列措施,根据数据能力框架已定义的内容,完善数据管控的机制以及数据管理核心能力,保证中国建设银行的数据能够达到全、省、快、信、易、好,保证数据是良性的。

中国建设银行在2011年启动企业级数据建模,在2015年前后替换了数据仓库的逻辑模型,使用了我们自行建立的C模型来构建仓库,我们讲九大主题就是这九大主题,所以在整合数据的时候用建设银行企业级的逻辑模型去构建。下游所有管理分析类应用唯一的数据来源就是仓库,各管理分析系统之间没有任何直接数据交换,唯一的交换点也是仓库。仓库的构建使得中国建设银行在任何一个试点企业核心的全貌数据是可见的,也是准确的,所以我们讲大数据时代或者讲数据服务,在可见的将来,数据仓库都是非常重要的,而且必须存在,因为我们仓库是结构化数据,所以它是在任何一个时间点是能够保证企业拥有完整的、统一的一个视图的关键,同时也保证了数据的可信。 

这部分谈数据治理组织架构,中国建设银行今年刚刚改革,并于今年成立了金融科技创新委员会。我们最大的特点是在创新委员会下面设立了数据治理专业委员会,它最重要的职责是审批中国建设银行所有关于数据管理和数据应用的重大事项与财务支出。数据治理专业委员会主任是我们的一把手,也是我们的行长。数据治理专业委员会办公室设在我们部门,旗下包括一个上海大数据智慧中心,这是一支200人的队伍,而我们要干的就是大数据的事情。  

建设银行数据管理部承担的一个重大的职责就是把数据需求进行集中,统一进行管理,我们把数据需求分为三类,分别是简单需求、复杂需求和专业需求。因为所有的需求都会到数据管理部进行统筹,对于涉及到开发的我们直接就转技术部门。对于纯数据的需求,第一类简单的我们直接通过一些管理分析类的系统,通过界面去解决。再一类是复杂的需求,这往往是临时性、紧迫性的,我们有数据团队通过服务去交付,那么这块也就完成了。还有一块需求是专业需求,专业需求往往先建设数据模型,并通过模型跑出的结果去交付。

最重要的一点是驱动,有两类驱动,一类是业务需求驱动,业务部门或者分行将有困难或者干不了的事情提出来,就成了驱动力;还有一块是数据需求驱动,数据需求驱动这块为什么重点来谈呢?因为它的产生是数据分析人员、数据专业人员对于业务有一定的洞察能力的时候而主动提出一些需求,而往往大数据产品的很多需求(比如一些评分、指数、客户标签等)都来自于这些数据条线的专业人员。

关于数据的需求,除了传统的管理分析类专业的系统,我们数据管理部还应承担一些跨部门、跨条线、暂时说不清楚规则的需求。这块需求包含三类:第一类是固定报表、自助查询加上机器查询,这类应用由数据管理部牵头建设的各类企业级数据平台来去支撑。它们最重要的作用支撑业务人员自主用数,将用数的权利还给业务人员;第二类是数据模型实验室和数据挖掘,这块对应着大数据智能平台,大数据智能平台承担着中国建设银行数据模型实验室和传统的商业智能,或者是现有的大数据分析应用等功能;第三类是仪表盘,仪表盘这块有我们的手机移动端作出各阶层500、600个指标,大部分核心业务指标通过T+1去实现。 

建设银行2016年开始建设大数据智能平台,从底层看,我们有数据,其数据来源是数据仓库,数据仓库所有的数据包括内部数据、外部数据、结构化数据、非结构化数据,它们对于大数据智能平台是开放的。大数据智能平台有三大核心功能:第一,数据的获取,从仓库拿数据不需要走上线流程,有一套机制可以直接去抽取;第二是分析能力,借助已经部署的传统商业智能工具、新型大数据(包括人工智能)的一些工具实现;第三是交付,我们可以把模型或者结果批量的交付出去,也可以分装服务直接与流程系统对接。 

另外我们还有三个库。第一个是产品库,好的模型需要分装成产品去共享,变成一个数据产品;第二个是知识库,工具箱,其中工具箱就是刚才谈到的所有的基于传统的商业智能工具和大数据工具;第三个是图数据库,也包含已经部署的可视化分析工具相关算法。

我们现在进行了“绿树工程”。我们最大的职责是管理好数据,以便让大家更好的使用数据。绿树工程又可以叫做大数据人才培养工程,从2016年开始到现在,我们在各部门、各条线开展了3年,并培训条线的各分行、各部门人员到上海做一些相关建设与模型应用,这样,他们在分行和部门的带头作用就很有效果了。目前而言,各部门的大数据应用卓有成效,认识水平也有大大的提高。 

通过共享实现数据对企业的价值,让数据的价值最大化,是最后一个价值化。我们谈到一个重要的理念也是中国建设银行总行的数据管理部刘总提出来四化的概念:业务数据化、数据资产化、资产价值化、价值最大化。力求价值最大化也是围绕着这“四化”而谈。 

伴随着中国建设银行新一代核心系统的建设,我们也同步创建了两大体系:数据管理体系和数据应用体系。在数据应用过程中发现的数据问题,可以通过数据管理体系去解决,而一旦数据管理体系可以实现高效解决,也将更好地来支撑数据应用体系的相应建设。这两个体系的互动,帮助我们提高数据质量,同时也支撑数据应用更好的发展。

我的汇报到此为止,谢谢大家!

声明:本文来自大数据技术标准推进委员会,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。