首页 -> 新闻中心 -> 云计算 -> 正文
中国银行数据中心副总经理杨志国:管理体系在银行业数据中心的创新与实践
2017-12-25

12月22日,第十二届中国IDCC产业年度大典·金融科技高峰论坛暨《管理体系在银行业数据中心的创新与实践》首发仪式在国家会议中心举行。

2017年被誉为金融科技元年,区块链、人工智能、大数据、云计算对银行业的影响正在不断深入,这其中面临更严峻的网络安全、监管、容灾等问题。针对这一现状,中国银行总行、IBM、中国信息通信研究院、平安科技、中国银行数据中心(上海)、腾讯、中国信息安全认证中心、中国电信、中国银行江苏省分行等数位企业高层就金融科技当下趋势及问题进行演讲。

12月22日,《管理体系在银行业数据中心的创新与实践》首发仪式在IDCC2017·金融科技高峰论坛成功举行,中国银行数据中心副总经理杨志国带来题为《管理体系在银行业数据中心的创新与实践》的演讲。

杨志国

杨志国:谢谢大家下午来参加我们这个发布会。咱们IDCC专门安排金融场,我们也来站一个台,特别是我们很多一些朋友们和同事们都来参加这个会议,非常感谢大家。

确实咱们在金融界特别在数据中心这块,可能我跟的时间比较长,可能在座的同志比我长的比较少,因为从事IT方面已经有30多年时间了,非常漫长。我记得我们中国银行最早是1986年开始建数据中心,现在叫IDC,实际上是比较漫长的时间,我们要做点事,跟了这么长时间,能不能把这些经验留下来?我一直在琢磨这件事。

运维方面,现在因为我也参加很多标准的制定,结合我自己的经验来讲,去和大家分享一下我们数据中心是怎么管理的,我们还有下篇,这一篇我们主要偏向于管理方面,让大家知道以后,我们银行业数据中心的发展,我们数据中心的规模大家也都知道了,现在已经发展到非常快了,根据IDC的统计,2016年底,数据中心已经达到43万个,当然这里面不光是银行的,是所有,包括个人,包括我们BAT,包括IDC的,包括机构等很多数据中心,数据中心你把它建好了以后,你怎么管理,这是一门科学。现在我们都正在建,你怎么去管理它,它有一套规范。大家都知道以后,现在比如说我们中国的发展太快了,我统计了一下数字,能排在前面10名的可能不是四大银行,现在是谁排老大呢?中国是工农中建交,这五大国有商业银行他们的资产规模是排老大的,大家都知道,现在它排老大以后,你资产规模大了以后,交易量也大,它是成正比的,一般的超大数据中心交易量超过3个亿以上,我们中国银行双11过去以后,我们已经突破了6.5个亿,什么概念?每一秒钟有多少交易量?我记得今年双11,像咱们马云的支付宝,他的并发度到多少?25.6万每秒,那可了不得。去年才12万次,今年达到这么多。所以现在的第一都发生在中国了,大家都知道,这个时间也来到了,当然我们还有那么多银行。

大家知道,刚才曹总讲的腾讯跟我们中国银行的合作,确实是合作的非常好,现在BAT以前银行是老大,现在老大也不是银行了,BAT是老大了,不管腾讯还是阿里巴巴,他的新的技术来了,所以我们叫做技术创新。今天讲管理创新,技术创新,互联网、大数据、云计算都是技术创新来的,我银行不能关门啊,你还得往前走,所以要引入这些新技术。为什么咱们跟腾讯合作?合作非常好,我们第一个产品已经推出来了,已经上线了,老杨就是管生产的,正式上线了,合作的非常快。大数据我们已经开始使用腾讯的大数据平台了,刚才曹总已经介绍了他的数据平台,非常棒,不错,我也考察过,我得往前走,马云说了,银行不改变,我得改变银行,这些话记在我脑子里面,说实在的,我们就往前追了,这些新技术到银行,银行数据中心怎么提升你的管理的目标,这是一个方向,在座有一些是搞银行的,有一些是搞IDC的,有一些是我们产业链的,有一些BAT的同志来了,共同探讨一下帮助银行解决银行的问题,跟你们有关系。

我搞了30多年的银行以后,数据中心运维,我们就讲我们要活着,行长领导说了,你们数据中心就不能出问题。所以我们第一句话,就要活着,活下去,你才有戏,没活下去你就滚蛋,就这样一个情况,还活的更好。你怎么活着?这句话是老杨同志的真实经验,首先银行追求的是安全、稳定、可靠,这是一个观点,你不安全,不稳定,不可靠,银行别搞了,这里面包括你所有基础设施,你的所有的系统架构,你的所有的安全监控,你必须要围绕这6个字,安全、稳定、可靠,我们叫做合规也可以。还有你出了问题怎么办?你要做到快速有序有效,把问题解决。因为搞银行,你像大银行来讲,我们有上万台,刚才我们张处长说了,我有上万台客户端,几万台服务器,大量的运营系统跑着。所以必须要快速有序有效,去解决问题,这是你的一个观点,告诉大家,这不是说这几个字好讲,你要做起来,必须要做起来。当然快速、有序、有效,今天我们是发布第一本书,我们马上第二本书就出来了,怎么快速、有序、有效?我们讲经济管理。

这个地方是活的,基本一点是活着下去,你搞数据的运维必须活下去,同时行长说的,不行,老杨你光活不行,你要活的更好,对不起,体验、效率和效益出来了,体验你的系统友不友好,客户体验好不好?刚才说为什么微信体验好,快速、有效、少环节、少麻烦,所以我今天我不知道阿里巴巴有人在没有,我现在倾向于用微信支付,安全、可靠、快速,说实在的,我是微信的最佳实验者,绑定的是我们中国银行的卡,对不起,落地还落到我这里来,当然还有别的银行。

体验好,你的交易路径时间短,100毫秒行不行,你100毫秒,人家1秒,低于10倍,肯定体验不好,网络快速与系统,体验要好,快速有效。你效果高不高?交易效率都是很高的,现在中国银行有一个全球智能项目出来了,叫做GPI,它的速度是秒到英国伦敦,这个体验比较好,这是我们智能项目出台了。

我们还得讲效益,为什么?你的价格要优惠,要适当的调优。我们今天上午开一个会的时候算帐,我去年调优以后减少多少,一算两个亿出去了,我减少两个亿投入,所以效率是我们做数据的,不管你做技术环境方面,我正好数据标准出来了,数据标准出来以后降低我们的PH值,拿中国银行来讲,每年的经费将近一个亿,如果我能降0.1,对不起,我差不多有400万是可观的,所以通过技术改造是可以实现的,所以我们讲效益。

18个字送给大家,快速、安全、稳定、可靠,快速、有序、有效,体验、效率和效益,这是我老杨做数据中心18个字的方针检验送给大家。

还有几个字是非常好的管理理念,大家可能要记住,我们为什么讲这个书,我又有加了20个字,5句话,第一句话,制度管人,中国的制度太多了,制度管人,人是活的,制度是死的,不管是业务的还是IT部门的。怎么办呢?制度管人管不住怎么办?我引进了流程分责,我们按照流程理念,流程你是变更的,你是故障处理的,你是做系统维护的,每个人都按照一定的流程去做,这个流程如果流不动,它就有阻碍,就像我们血管一样,你不流就有肿瘤发生。对不起,流必须要流动起来,这个地方流到那个地方是你的责任,你要不处理是你的责任,我们叫做流程分责。我们角色定位,角色定位,数据不是老总,不是处长,也不是科长,你是故障经理,你是事件经理等等,这个名称起的很好,不是当官的,就是负责这个事的角色,你说故障了进行分析,分析完了以后往下走,角色定位很重要,角色还能把事做好吗?还做不好。

标准,标准做事,我们数据中心有病人目录,有时间监控的标准,有服务请求的标准,等等都有很多标准去做,标准是我们通过多年运营下来的经验。你说我有法治标准,85%就是报警,报警完了你就解决它的问题。标准做事完了以后能把这个事情做好吗?效益和效率不好。以前我们靠人跟手去做,我们现在引进自动化的工具,我已经讲过,加速智能化,数字化转型,怎么样加速它的数字化,制度化监控,那是我们做运维最关键的一点,没有智能化的工具以后你前面的东西都是效率和效益不高。所以这是一个老杨的5句话,18个字加上5句话,你就可以把运维工作搞好。

咱们今天讲很多数据的发展,为什么做数据的管理,以前没有任何的规范去做,通过我们18个字,5句话以后,我们总结我们的经验。我们今天写这本书,它是确确实实结合我国大型银行的运维的事件,大概我们这些实践也是很多参与者,制定出来标准,说到这个标准的东西以后,我们直接探讨,我对这方面还是比较感兴趣。

为什么西方国家喜欢搞标准?统治全世界,标准的东西可是了不得,他是要有价值的,不能说我就几个地方,我们ISO它有价值的,中国每年要交多少钱给人家去?版权费是要交钱的。所有的手机厂商必须给华为钱,这是标准。所以我们现在要结合这些标准来了以后,我们自己跟自己共享。

这个实践以后,我们可能它的对象,管理者,管理人员,监管人员,银行数据中心,建设规划人员,研究人员都是一个参考书,大家可能看到这本书,所以我们讲的它对象还是非常的广泛的,这也是我认为,在数据中心管理体系上面应该填补我们国家的空白,这句话不为过。

它有多少章?我们大致是9章,有4万字,480页。这个是我们经过了一年去摸索,特别是我们在国家信息认证,张剑处长的支持下,我们数据中心大概参与人员有54人之多,也给我们一些指导和意见,他们毕竟在运维也方面做的很不错,还有一些公司有一些实践,我听一些外部厂商的意见。所以这个书,我认为它是一个非常不错的,它结合了很多国际和国内通用的标准的要求,去建立我们这套书的理论体系支撑,告诉大家方法论,方法是很重要的。这个书大家一看就知道怎么去做数据的管理,这个非常多,可行性管理都在里面,都明确的告诉你方法论的问题,你拿去就能干活,我觉得非常不错,这是我们的经验之谈。

我把这个书稍微梳理一下,我们怎么去做实践?大家知道我们这个书来了以后,它是逐步往前走的,当时写这个架构,我们从2003年开始的,包括以前的经验不说,到逐步往前走过来,走的这么一个道路。这个书的架构以后,我认为,我管理体系架构怎么样?实际上管理架构是数据中心必须要去做的事情,包括你的战略架构,你的流程架构等等方面必须考虑这个事情,不考虑还不行,围绕这个东西,很多IDC的人找我老杨,我们就找来就用了,当然你把物理环境建好了,你怎么运维它,不是说你上来以后,后天就宕机,你IDC就玩不下去了,他是有一套管理体系做的,他是有管理理念在里面的。

第一思想,就是安全第一要务,安全生产,是1,其余的都是0。所以安全生产如果失灵,后面有再多的0也没有用,安全生产以后我们要打造几个体系,要风险管理、运维体系、服务管理体系、技术管理、测试、能力发展体系,通过这些体系去建一个比较好的数据中心的运维,它是可靠的。如果说银行去做IDC,你不能说,老杨,我就几个人搞运维,你来做,我来做了以后银行也会掉下去。

数据中心在文化建设上面确实是打造一个企业文化,数据中心并不是技术中心,理念不一样的东西,文化理念必须要打造企业文化,这样大家凝聚力好,心都往一处想,这才是比较好的文化特征。

同时,我为什么不去讲技术中心,我要讲人,人的培养是关键。为什么在我的评价以后,我们数据离职率是最低的,人是很关键,要培养人,今天时间有限,不展开去讲。包括人的培养是很关键的,要培养大家安全责任,一个务实创新的团队出来是非常不简单的。这一点我认为我们在中国银行还做的不错,包括人力资源培养,人将来以后怎么发展,它是继续那条线还是都过那条线,你都要考虑,这是整个企业人力培养。

刚才张强同志已经讲了这个,他讲的非常不错,也比较保守,没有给大家讲一些干货出来,毕竟有一些安全的问题要考虑,安全管理工作必须要做,他说的非常到位,我们在制度继续运行方面,是怎么做的,审计控制是怎么控制的?那是必须要做的。

当然我们还有一些合规、框架、建设,这是必须要考虑的东西。包括我们国内,尽管海外监管,这些标准我们都引入到这个书里面去了。创新大家都会看到源源不断的东西,海外监管,国内监管,包括国际标准他是怎么做的?我们都引入到我们书里面去了,你们都会看到真实的内容。防控是怎么做的?那个流程是怎么做的?我们都会把它放在里面去,把一些精华放在书里面去了。

这是这里面我们讲,数据安全是最重要的,所以我们讲数据它的管理的目标,它的生命安全周期管理,也都在书里面非常好的体现,人家讲数据提三性,我提五性,数据的保密性是最重要的,现在我们国家在数据保密方面没有太多的国家标准出来,管理性,审计性,可追溯性,可一致性,为什么讲银行的数据是唯一的?我们跟BAT不一样,它的数据的完整性绝对跟我们不一样。传统银行跟互联网银行是不一样的,我们新的银行是两套架构,一个是传统银行架构必须保留下去,一本帐一个数据源没办法,同时我们加强互联网、云平台的建设,我们中国银行也开始在合肥我们有自己一个平台,我们进行自己的云平台建设。银行的数据是安全、可靠的,所以我退休以后,我现在就想做一个国家数据的规范标准出来,在数据管理方面。数据的采集、传输、使用、消费有一套管理,国家还没有。我退休以后,我想没事干,把这事捣鼓捣鼓一下,在我们国家数据层面去做一些规范出来,这些在书里面都有要点体现。

机构,把它屏蔽掉了,我当时没把它屏蔽掉,这里没写中国银行,这个架构是无所谓,不管是工行、建行都有这套架构出来,几大层面做安全架构。这个架构,我记得2016年我召集了几个同志做架构方案,现在还做的不错。我也希望我们一些BAT公司给一些行业,包括银行业,在安全方面我们真的要注意。

现在我们我们经济发展越快,遭受的攻击肯定越来越多。另外我们监管体系建设,我把这些东西都放在里面去了,我们今后怎么做?做到及时发现,准确定位、自动响应、全面监控、全面覆盖,这是我们做数据运维的方案,你不能说你系统上去了以后还靠人,现在每天IT的组件达到35个,这么多靠人去做远远不行,现在已经认证我们数字化、自动化、智能化,加速一体化的运维管理体系建设,加速数字和智能化的转型,所以我们做数据中心的建设,包括广度、深度和跨度都要适合我们生态的要求,不能讲一个面,深度,有效性,你必须做到快速有序、有效,能抓住。所以抓住以后你的问题才能解决,你的逻辑系统30分钟必须报,所以你的监控是非常重要的。

我记得我讲过一个PPT,大概40页纸的样子,我们怎么去做监控体系的建设,这个很难,这也在我们的书里面比较好的体现,包括我们今后的标准怎么制定,都已经告诉大家。

应急管理,作为银行来讲,要及时处理,这必须是我们最有效的管理手段。快速、有序、有效,你怎么做到这一点呢?你要建立自己的应急管理体系,所有的应急管理方法、手段,根据来分析,对我们系统网络设备、运营、各个方面都有一个应急管理手段。你拿了东西你就去做,我一台主机的模块坏了,告诉你怎么更换,它的流程是哪一些,我要求快速、有序、有效,所以这里面做的比较好的结果,应急管理在中国银行打造了应急管理体系建设,非常不错。包括我们运维、事件应急响应、工具和方法、快速、有序、有效的联动,它有一套体系建设,哪一些应该事前怎么做,事后怎么做,非常全面。

我们的目标是建立标准,目标导向,量化评价,提升服务,它就是应急管理体系的一个方面。

应急管理,我们刚刚分了很多角色,大家可能知道,我们当时经理他们的角色都非常的清晰,干什么,我们以前出了一些故障以后,网络掉了,你怎么去处理?一堆人都围着去看,现在我们都不要去了,该是谁去干活就谁干活,条例非常清晰,他打开知识库以后对照你的知识库,他会自动弹出来一些问题去分析,去解决问题,不需要很多老板关心。我们以前中控中心两三百人,现在都是这些角色在里面做事,不需要我们。我们也有很好的删减。同时我们做变更管理,是我们数据中心重要的管理手段,变更做的不好可能会引起故障的发生。我们每年做了变更以后,都是几万起,变更要做的好,它也是一种方法论的问题,我们在书里面怎么做变更,怎么掌握方法论确实是一个方面。

还有生产计划管理,把所有的生产计划都列出来,党的十九大你不能做生产,大的批次,小的批次。他有一个计划,每年在10月份都出来,下年的计划都排好,所以计划,生产活动管理,叫做全球统筹、科学安排、精细管理、实时跟踪。为什么讲全球呢?全球有45个国家,你说你变更了以后,你还跟统筹安排,找最小时间点去做变更,不做变更也不行。

还有技术管理,技术管理,我们在容量管理,问题管理,技术方案里面做一些技术管理,数据中心离不开数据技术,也离不开技术创新,我们运维以后,不论说传统的运维,今天看民生银行的处长来了,包括人民银行的倪总来了,这都是在生产搞运维有多少年的经验。这些测试管理,你的性能好不好,还要跟得上去,这都是我们必须要做的事情。创新管理,这些不说了。

我们还有一些流程管理工具,工具管理,这个工具管理以后,确实是我们提高我们整个运维水平最重要的地方,所以我们打造了这么多中心,我们今年中国银行搞了一个灾备中心,已经切换,工行一键切换,那么多流程以后,就一个工具就可以,系统就切过去了。我们做多少流程出来,每一个人都去掌控每一个环节,网络的,系统的,配置的,运行的等等等等,这些都不要了,我们有一键切换,这个技术来了,非常不错,这些流程工具也是重要的方面。

这些平台我们打造,我在这个书里面这一章写的最好,在数字化,自动化方面做数据的运维,说的非常不错,在里面有很多章节,我认为也是给大家来共享这些书。

总的来讲我们这本书出来了以后,我认为结合大家的经验去理解它,能用到你们生产管理中去,我认为是非常不错的,我不是说老杨的推荐,没关系,这个书你们去看,如果不好看你退回给我老杨,我再给你写一本。

非常感谢在座的各位专家,各位同事,各位朋友,你们来了,我把这些经验给大家传授,能够对大家有一点帮助我就已经感到满足了。谢谢大家。

新闻搜索

覆盖全国各省会城市及海外城市的网速测试
→选择要测试的地区
→选择目标测试点