首页 -> 新闻中心 -> 云计算 -> 正文
企业在云计算架构下的运维治理
2017-01-04

在12月20-22日的第十一届中国IDC产业年度大典上,网龙云计算架构师 阮少钧对企业在云计算架构下的运维治理进行了详细的探讨。

阮少钧

网龙云计算架构师 阮少钧

传统运维总是会遇到很多挑战。在过去,基础设施的运维是比较花钱的部门,而现在随着信息技术的日益进步,云计算下的运维治理成为企业减少成本的途径之一,那么,企业在云计算场景下的运维治理又是什么样子呢?

幻灯片5

在云计算时代,交付速度越来越快,成本越来越低,质量越来越高,这是一个趋势。在开放和运维两者间,源于这样的趋势会遇到业务故障时,损失可用性,这里存在一个运维墙,但其在质量、速度、成本三方面仍然难以改善状况。

为了协调开发和运维的矛盾,最近几年出现了DevOps,开发媒体化,它在运维治理的整个过程中又是如何发生的呢?

幻灯片6

将开发和运维放在一个大包里,同时负责一个可用性指标,在DevOps初期,运维的贡献相对比较大,既要做双活、储备,又要做预案。

由于中途会出现应用连接不到数据库的情况,而运维发现数据库是完好的,最后只能是代码打日志,因此,开发开始在应用层做预案。应用级的预案促使可用性提升,最终沉淀在人肉工具DEVOPS上。

由此可以看出,云计算时代,其实开发和运维是一体的,它们之间不断地转换。

最好的运维一定是服务化的,最好的服务也一定是产品化的,而最好的产品一定是标准化的。在云计算分层的情况下,运维也进行了分层,以下就是具体的分层情形:

幻灯片7

从端到云,会造成每个运维分散到每一层,中央运维团队被打散。每一层都有刚刚提到的架构跟运维两个部分,并且要向上一层承诺SLA,承诺质量。这里面每一层都要根据下面层提供的SLA承诺,再根据自己的质量需求去决定架构和运维到底要怎么做。在这一层需要两个动作,第一是需要制定一些规范做准入;第二是要做质量控制。

质量控制怎么做,无监控情况下,由API到容器、数据库、网络,检查是否有问题,这种定位故障,成本是比较高的。因此,之后大部分企业会提供一个第三方的工具,对每一层的服务做监控,形成量化的指标,即与云计算的分层相契合。发展到后期,质量控制由SDK需求演变到工具到架构。

控制如何做,引入CDN厂商进行解决。

以上是云计算运维的一些特点,接下来我们看看如何用一些架构来应对这些特点。   

首先我们来看运维的业务架构,这边引入一个三维模型。

幻灯片13

每个企业裁剪出来的业务架构模型不一样,应用架构必然也不一样。只提两点,第一点是网龙做的云,是为了能够飘在不同的IaaS云上。为了能做到这一点,网龙有抽象云的代理,把Docker引入进来做标准化的封装,解决互操作性的问题;第二点是这个平台本身对应用和开发者提供方便,所以还要做业务方面的运维。

在最佳实践中把供应商准入,根据业务模型把两个维度排进去,第一个是云计算维度,第二个是企业运维的维度。

幻灯片18

制定一些执行项,做一个准入标准和良好标准,然后列出未达到准入标准会有什么危险,最后有打分。这样做有三点好处:第一是对于很多做不出服务承诺的,没有服务承诺的服务提供商,进行准入可以量化供应商的能力,找出潜在的风险;第二是建立这个标准库以后,可以方便筛选供应商;第三是为了质量控制,打完分以后,哪些地方能够满足我们应用,哪些不满足,应用就知道了,它能根据这些标准去做自己架构运维上的调整。

幻灯片19

接下来是云软件成熟度选择,涉及隔离性、可配额、扩展性、可QOS、可计费、成本结构、商业规模等七个指标。

幻灯片20

这里面提到像第三级的成熟度实现逻辑物理隔离,做这个成熟度怎么用呢?主要用来识别在云的软件体系里面,每个软件到底在哪个成熟度,在哪个成熟度就要看七个指标哪些地方做的有问题。

幻灯片21

最后是关于整个运维的职业发展,分成三个层面,IT项目管理能力、架构开发能力、运维能力。在这里,着重提一下IT项目管理能力,它是传统IT工程师具备的一个能力,基本上每一个不同类型的企业对于工程师技能要求都不一样,这个运维职业发展也只是一个可供企业进行参考的模式。

新闻搜索

覆盖全国各省会城市及海外城市的网速测试
→选择要测试的地区
→选择目标测试点