首页 -> 新闻中心 -> 云计算 -> 正文
【2018可信云大会】胡罡:容器,发现无限可能
2018-08-18

为了进一步促进云计算创新发展,建立云计算信任体系,规范云计算行业,促进市场发展,提升产业技术和服务水平。由中国信息通信研究院、中国通信学会,中国通信标准化协会主办的“2018可信云大会”将于2018年8月14日-15日在北京国际会议中心召开。

现如今,云计算已经发展了10余个年头,并逐渐形成庞大的产业规模,企业“上”云也并非难事。但不断出现的信息数据泄露事件给火爆的云计算界敲响了警钟,企业开始逐渐意识到云计算的风险性,明白部署哪一种云都有可能受到黑客攻击。虽然云计算可带来显著的优势,但潜在风险也不容忽视。"2018可信云大会"邀请了行业内多位大咖与权重人物共同探索可信云与云计算的创新发展新路径。

以下是中国太平洋保险(集团)股份有限公司信息技术中心应用运行支持部副总经理胡罡:《容器,发现无限可能》演讲全文:

我是胡罡来自太平洋保险集团,非常感谢可信云给我这样一次机会讲太平洋保险在容器方面的实践。我带来6个方面的内容。2018年容器的知识就不讲了,为什么要用容器,去年银行业发布的三年规划里面已经提到了要使用容器这样轻量虚拟化的技术,说明云计算非常核心的技术在相对传统的行业里面已经形成共识去大规模的使用。

容器它的特点主要在应用层面能够发挥非常好的作用,我先讲讲太平洋保险跟业务相关的进展,太平洋保险是91年成立的,在03年之前系统主要分散在各地的机构,从它的数据库到应用系统都是分散的,在2003年启动了一个省级大集中的工作,把原来分散在各地的几十家或者近百家的系统全部集中到省会城市,叫省级分公司。寿险有30多家,财险接近40家,做了第一次的集中,这时候还是相对分散的,但是在这个时候整个应用系统都是由总部实现开发,物理分散部署,在03年以前这些系统是各地分公司自行开发的,所以整个管控没有03年以后这样强。在2008、09年的时候启动全国性的物理大集中,把所有的系统数据全部集中在上海数据中心,财险和寿险,在这个时候完成了集中的数据库、集中系统的部署,同时引入虚拟化的技术,让资源通过虚拟化的技术池化,提高运行的效率、提高交付的时效。在2016年的时候把容器的技术应用到生产实践当中,经过两年多的建设已经有100多个系统使用容器进行应用的部署,在今年启动了存量系统的全面推广容器化的技术,希望可以赶上互联网公司的发展步伐,会把我们几百个生产系统全部使用容器技术进行部署。

我们在15年的时候已经开始关注容器也做了实践的探索,16年的时候跟腾讯有个活动,春晚的时候发红包,给我们带来了非常大的挑战,当时有上亿用户会使用系统,几十亿的流量,并发量有十几万,核心业务系统大概只有几十的量级,所以差距非常大,大概接近一万倍,大胆使用容器的技术,包括相关的开源技术形成一个互联网的应用系统来支撑春晚红包活动。这次活动也奠定了对容器技术使用的基础和信心。在15年5月的时候,正好保险行业推动营改增,我们买的是软件包,相对传统的技术,传统的应用能不能用容器技术进行部署和支撑,花了一些时间做了落地的实践,在5月1号把软件包传统技术的架构搬到容器上进行运行管理,其实容器的应用不但支撑了互联网的应用,也支撑了像软件包传统的技术模式,持续两年时间对容器的平台不断的升级,逐步的推动在可靠性、安全性、扩展性、应用性方面做了大量的工作,不但在已有的基础上对各个周边非核心类的周边系统,及互联网式的系统大量使用,对开发环境、生产环境都一体化的运维管理,目前我们对容器技术平台在持续的升级,支撑太保所有系统的存量化的部署,今年初把容器作为生产应用部署的标准放在我们的架构里面,同时我们也形成了相关技术运营的团队、技术研发的团队,专门支撑容器平台进一步的应用。我们对容器技术也做了大量的改进工作,不管是用什么路线,对于应用的支撑能力都是有一定的限度的,在这方面也做了很多的优化,会形成独立的区域来支撑。一定数量的容器实例,保证在技术能力的上限之内很好的支撑它的稳定运行。同时大胆的实践DevOps实现流程编排、流程串接的能力,让容器平台无论运维的支撑还是研发支撑方面都起到了很好的效果。

通过容器化部署和传统的虚拟化带来了非常多的好处,一方面在资源使用率方面得到大幅的提升,像金融公司对可靠性、可用性的要求很高,为了保障支撑业务的连续性不中断可能会超配,让整个CPU资源使用率维持在一定范围之内,而不是要充分挖掘资源的利用率,舍弃一部分成本的考量浪费一些资源来支撑,用传统虚拟化的技术在应用快速的部署安装以及应对业务突变的快速支撑方面是有一定的局限性的,所以通过容器这样的技术面向业务快速弹性的扩展,可以更加大胆的提高资源使用率,业务高峰来的时候,自动的弹性扩缩,不需要人工支配,这样的方式让很好的提升资源使用率,曾做过估算,部署效率可以几十倍的提升,CPU的资源使用率,像把存量的资源看到了金矿,可以支撑更多的业务节约了成本。

安全性方面来看,原来如果发现业务快速的增长对用户的体验来说可能会发现服务的卡顿或者用户页面的白屏,如果去应对需要部署新的资源,接入到应用系统当中去,这个时间非常长,可以做业务的无缝连接,可以秒级分钟级应对,让业务变的正常。并且在服务检测自愈方面做了很多功能,让用户发现应用缓慢的情况做一些自愈的能力。

经济方面的效应,使用容器技术特别是对存量系统大规模推广,对我们带来非常大的效应,图上的金额不太准确,随着推广会超过这个金额,刚才提到对现有资源的挖掘是以前没有想象到的,所以我们通过这些技术的推动带来了非常大的经济效益。

对于今年开始的存量系统大规模推广也带来了非常多的挑战,一方面是应用多样性,大家知道传统的企业里面跟互联网不太一样,互联网以自研为主,大型的传统企业是自研+外包合作开发,它的技术栈甚至有些封闭式的软件包,技术架构也是非常多样的,平台要支撑这么多应用,大概是四五百个应用系统,这么多系统全要匹配难度很大,最初的推广方案是应用匹配平台的需求,让应用做改造,后来发现如果要快速推动这件事情是非常难的,要研发来配合,研发也有应对自己的业务需求,同时工作量也非常饱和,怎么做到这些呢?对平台做了很多的改造,更加的匹配各种各样的交易型批处理型的、软件包型的不同操作系统的要求、不同的中间件甚至数据库的要求做一些适配,只有适配各种各样的应用特点以后,平台才更有推广的价值,对平台本身的安全可靠、性能都提出了很大的挑战。

容器平台逐步变成一个基础平台以后,对业务连续性支撑的考验是非常大的,以前应用出问题只是一个节点,是用虚机隔离的,如果上面架了容器云的平台,一旦平台本身出现了问题,对于整个业务的连续性带来灾难性的影响,在这方面也做了很多的变化,把原来单一的平台和组件的模式变成多集群化独立的分而自治的模式,底下可能有几十个容器平台,但是让用户或者IT人员使用体验来说只有一个平台,通过potato进行集成和组合,每个平台每个集群都是相对独立的,它不会影响大面积的问题,对应用的部署也做了强制性的要求,不能布在一个物理节点或者虚机的节点上。第二它会有高可用的集群,不同的容器集群会分开部署。第三做一些业务的隔离,让不同的业务不会因为有相同的基础平台而受到关联的影响。另外对整个镜像也做了大量安全的工作,所有新的镜像都会进行安全的扫描,同时在每次上线之前也都会做各种安全检测,来提升它的安全性,这样也不会出现很多互联网公司因为一些镜像的安全漏洞导致生产的隐患,相对来说都会经过安全加固的,所以我们的镜像相对来说比较安全。

本身对它的运行管理也做了很多工作,让它能够更加敏感的监测到应用的运行状态,并且能够触发它故障自愈的机制,这样能达到金融级运行管理的要求。

2016年已经开始使用了,还是使用马拉松mesos这样一个基础组件进行的深度定制,当时因为Docker本身原生的那套体系比较单一,适配性可能不太好,(QuaverQneX)体系还没有成熟,基于这套技术进行深度定制,由于体系都是定制的,鉴定的往这方面走,有很多体系在进行支撑,同时新的技术也在进行发展,在新的版本里面支撑或者支持QuaverQneX集群管理的技术,应对一些新的应用的特点,这个平台相对来说不是单一的,是综合的,而且能够适应各种各样的场景。另外为了应对多中心的要求,做了多中心的能力。

随着目前的技术升级和改造,越来越多的利用微服务的技术栈和架构,此时平台也做了这方面的支持,比较好的用微服务,同时为了简化管理和操作,做了可视化的编程,让IT人员更容易使用。目前来说,这套平台经过努力,基本上两年多时间没有发生过一次故障也没有发生过因为平台不稳定带来的业务的影响,目前已经支撑了接近两百个系统,接近一万台主机,上面运行的七千多个实例,今年在大规模的推动,很快就会到上万个主机节点以及几万个实例。因为我们的实例不像互联网一样是单一应用大规模的实例,不同的应用,每个应用的实例数不是特别多,只有一些面向终端客户的应用实例数比较多一点,所以看起来不是几十万的量级但是复杂度很高,目前来看这一块的数量也算金融行业里面比较多的规模。

从去年开始非常有幸参与可信云标准的建设当中,回顾自己的经历,对保险行业容器标准进行了对标,有5个方面,平台本身的基础功能、基础设施能力的支撑、安全性方面都是能够达到标准的,同时在分域治理和高可用性架构方面也做了很好的匹配,容器平台对技术标准来说,应该说是能够达标的,也希望通过这样的实践推动保险行业容器技术全面的推动。

对于未来在不断的转型,不断的支撑我们的容器平台,虽然说是相对传统的公司,其实技术的步伐还是非常快的,这个平台在两年的时间升级了4个版本,不断的实现敏捷的方式,另外现在正在建造新的数据中心,在上海宝山这边,一个6倍于现在的数据中心的规模,这个平台需要更好的支撑新的数据中心,甚至今后会打造保险行业云的需求,刚才会议上很多提到,容器在应用PaaS层的支撑,比较好的让我们的业务更好的实现业务各种发展的可能,技术上可以支撑基础服务、流水线还有支撑AIGPU的设备、大数据的应用场景,所以我们围绕着容器技术打造了平台,让技术实现了各种各样的可能,让业务高速发展可以实现更多的可能。

新闻搜索

覆盖全国各省会城市及海外城市的网速测试
→选择要测试的地区
→选择目标测试点