首页 -> 新闻中心 -> 云计算 -> 正文
云霁科技CEO智锦:金融行业云运维知识库项目介绍
2017-04-25

W020170420397629215423

非常感谢有这样一个机会大家去分享,要从运维和云运维包括开源具体的事情,我们过去花了很长时间思考。

运维从我个人经历来讲,过去12年曾在互联网公司做运维,之后做管理工具,到云计算之后我有幸加入了中国建设银行,在建行体系里跟很多金融行业很优秀的专家前辈去探讨。之后从互联网到金融,干了十年运维之后发现,运维这个词在今天的含义和内涵是完全不一样的。传统运维大家会认为是一个技术含量很低的事情,是一个后台部门,会想到在机房搬服务器、敲命令、做一些事。但是实际上到了最近几年,随着云计算兴起,我们都会发现整个IT已经从一个后台部门变成一个科技部门或者是一个核心部门。这个里面IT以及运维已经成为了这些企业里业务经营的一个比较核心的点。今天像阿里、腾讯,我们发现除了他的业务很厉害之外,他的IT的敏捷、速度、按需提供服务。云计算之后,海量运维,我们发现这个里面一个很关键的因素,变成了我们今天的运维已经不再是以前人工做事了,而是建设开发团队,我们变成了需要能够把这些先进的思路以体系化、规模化、精细化的方式来做运维体系。在这个过程之中我们发现,实际上在云计算时代已经没有所谓互联网运维、传统运维的区分,而变成了只有根据业务特性、根据规模、根据业务种类来分。在这样的一个时代里面,我们就会发现,大家的需求是趋同的,都是说我要能够建设一支敏捷体系,有高度智能化的系统,更高效的支持业务。从这个里面很多同行、金融企业包括很多大型的国有企业、互联网公司,都在思考我的运维从人工方式变成一个运维工具、运维平台在运维体系。在运维体系这个过程之中我们就会发现,并不是简单说我们用一些工具,对大企业而言,我们需要的是一个自上而下,从用户出发,能够把用户的设备、资源能力整合在一起,提供一个资源服务能力。更重要的事情还是说我们要能够建立一个跟云运维相适应的流程制度、工具体系,以及把我们在新时代里IT部门和运维部门我们的服务定义出来。原来的模式里是说我们做IT做运维的就是为业务提供服务,工作的好坏很难衡量。但是在新的模式里,我们作为运维虽然是后台部门,我们要把我们的IT和运维能提供的服务、能力以精细化的方式提供出来,把我们对业务的一些贡献和对于这些成本、对于效益的体现度能够以精细化的方式量化出来。这里面我们会发现,管理思路的变革、体系变革是最重要的一步。其次,我们所谓的云管理平台、云运维平台的建设,这个里面我们运维发现在BAT做了运维工具之后,在银行体系做运维工具之后,会发现云管理平台和云运维平台这里面实际分成两个层面,一个是根据工具,我们平台能力很强,可以做自动化的事。第二块是跟内容,如果说我们一个平台能力很强,但是里面的操作步骤、操作内容还需要人工敲命令的方式,那这个平台实际上意义并不是很大。我们觉得有必要把互联网的经验,在金融行业跟很多专家前辈学习的经验能够整合在一起,是不是有可能以金融行业自己一个驱动点,把这些内容、需求、业务规范整合在一起,通过开源的方式来做这个事。

看一下核心的,当时为什么想做这个事。第一个,从这两年开始,不管是互联网公司还是国外的一些大的IT公司,这种因为人工误操作删除系统、删除数据库的问题非常多,云运维时代里,运维脚本化、自动化是大势所趋。但是大家很担心一个问题,如果说以前人工敲命令出问题影响一小片服务器,如果自动化出问题,所有的机器都会受影响。自动化是个双刃剑,我们必须要做,它提升效率的同时如何有效控制风险,不要出问题,也是我们关心的事。这里面我们会发现自动化底层做了这些脚本、命令,它目前的现状是缺乏规范,每个部门每个人是各自为政的方式,很难维护和审计。如果拿一套自动化平台去执行人工命令的脚本,风险非常大。第三个是云计算普及之后,这些OpenStack,这些新的SDN,它的这些软硬件接口很多,实际上对我们运维来说,学习它、掌握它程度也非常高。互联网行业整个效率非常好,体系非常好,但是在安全的控制这方面不如金融行业。传统企业又缺乏大规格、云计算实施的思路,所以我们想这个事情有没有可能通过一个社区的方式、开源的方式,通过我们的努力推动云计算和云运维。这里面是我们的一个分析,云和自动化需要一个标准化、体系化的思路,但是在目前的现实里在传统企业里,运维缺乏标准,其实还是一个各自为政的方式。这个对我们云计算公司去推解决方案和对用户困扰非常大,用户的出发点是觉得今天这么多新的异构设备、异构资源,它的管理成本非常高,风险非常大,对厂商而言,我们这么多行业用户,每一家的需求不一样,让我们定制化去适应每一家,这个成本也非常高。这两个事情限制了用户在云计算的使用和普及,也限制了厂商更好的把他的产品和服务推向一些用户。后来我们觉得,这个事情从核心来说,我们能不能通过工信部,通过云计算开源产业联盟,我们能够把这些金融用户为代表的企业用户聚集在一起,我们在去年发起了这个金融IT运维社区,把国内大的银行、保险、券商的运维专家聚集在一起,以社区化的方式沟通讨论探讨用户的需求。同时跟云计算开源产业联盟一起把一些厂商他们的想法、产品和他们的一些问题在一起探讨,最后通过云运维知识库这个项目,把需求、规范、标准甚至底层落地的平台内容聚合在一起,这是企业级运维知识库。为什么叫Enterprise,我们认为金融行业其实是有可能未来为其他行业的转型提供一个思路。

这次EOD的工作目标是五个大的方向,第一个我们是希望能够把金融行业的云计算、云运维脚本规范定义出来,脚本规范未来希望能够被各个管理平台作为工具调用的方式,能够解决脚本的效率和安全的问题。第二个我们希望能够开发一个开源的脚本管理平台,如果光有规范、光有标准,但是这个标准规范没有一个工具做载体,它的执行落地非常难。所以我们做这样一个脚本管理平台,这个平台里我们把一些安全规则放到里面去,通过它自动化去审核。第三个,既然规范也有了,平台也有了,是不是能够说通过大家行业的一起努力,把这些公共的操作脚本聚合在一起,因为这些脚本规范其实不涉及业务,但是如果自己去维护,其实是长期成本,而且风险比较大。如果我们通过开源的方式,共享共建,可以杜绝携程或者国外公司这样误操作的事情。未来我们希望能够通过EOD进一步的把金融行业乃至其他行业运维的需求、规范汇聚在一起,形成一个针对于非厂商的用户侧的需求和规范体系,最后希望形成企业级的云运维知识库。

非常感谢金融IT运维社区里的专家包括领导的大力关心和支持,这次这个项目通过三个月时间,跟这些主流的银行、保险、券商充分沟通,很多用户对我们表示关心和支持,是我们第一批发起用户。

EOD组织架构,我们往下分成用户委员会、技术委员会和董事会,本质上讲跟OpenStack的架构很像。我们希望用户能够主导这个事情,所以我们的用户都是在用户委员会里,他们会牵头去汇聚需求、去评审,包括把大家的痛点和需求提炼出来。希望各个厂商可以充分参与,我们希望通过技术委员的方式解决一些异构设备管理各种事。同时希望厂商把产品研发的需求带进来,将来他们的产品可以很容易推广和应用。第三个是董事会,这个项目必然是开源项目,董事会里必然要有人去把握发展需求和发展方向,希望在这里面充分参与的用户和厂商单位,经过评比可以加入董事会,可以更好把用户和企业、厂商连接在一起,让项目的目标和发展由行业的力量聚合在一起。项目子类,传统的服务器、存储、网络、操作系统、中间件数据库、应用系统、云计算,我们希望能够通过这样的一个方式,把这些用户需求,供给侧和使用侧能够打通。项目角色我们分成PTL项目组织者,同时有代码审核、代码贡献和代码测试,把需求、内容、操作以及实施测试在一起。

《金融行业云运维脚本规范》,这里面一部分标准该怎么样写,如何能够兼容。第二个,我们希望大家在一起把脚本规范定义出来,到底我们的脚本的类型,按照种类、厂商、型号、性质去做区分。第三个是共享脚本库,比如在企业里面,这些脚本如何统一存储、统一审核、统一发布、统一使用,把这块东西也是能聚合在一起,是规范层面的东西。第二个,脚本管理平台,这个脚本平台目前我们是以开源模式,在github发布出来了。它的方式除了按种类汇聚,之后我们还提供一个功能,用户可以审核,我们会通过自动检测的方式,把高危病毒区分出来,提醒用户操作风险以及密码泄露的风险体系。这个脚本管理平台我们当前是第一步,现在每个企业内部可以自己运转,帮助这些大企业把他已经有关的脚本、这些基本需求汇聚在一起。未来会在公网上建一个公共的脚本管理平台,从内部维护、内部使用的平台变成全社会全行业提供的公共维护的方式。

现在我们整个项目的思路包括背景就是这些,目前我们在金融IT运维社区的公众号里会持续发布一些内容、成果,也是希望大家能够充分参与。同时我们也希望我们这个所谓的EOD项目,它是一个中立型的,它里面阐述的内容、脚本、规范,我们希望未来可以给腾讯蓝鲸或者其他厂商他们的运维工具、运维平台里都可以充分使用,让大家可以按自己的方式选择适合自己落地实施的方向,谢谢大家!

新闻搜索

覆盖全国各省会城市及海外城市的网速测试
→选择要测试的地区
→选择目标测试点