首页 -> 新闻中心 -> 云计算 -> 正文
2019可信云大会 | 陈健源:农信互联混合云应用实践
2019-07-03

大家下午好!非常荣幸跟大家聊一聊混合云。我的分享主要是有三块:1.公司简介;2.业务上云历程;3.混合云实践。

第一、公司简介

农信互联是专注于为农牧大生态企业提供互联网服务的平台型企业,我们致力于成为全球最大的农业互联网平台运营商,推动农业智慧化转型升级,我们主要是为农牧企业提供四大赋能,数据、电商、金融、服务。农信云是公司的数据业务,主要是用大数据提升企业的经营管理效率。这块主要包含服务于生猪产业的猪联网、服务于种植产业的田联网、服务于涉农企业的企联网等,电商业务主要是以农信商城为载体,通过建立涉农的电子交易市场来解决企业交易链条过长、采购成本高的问题。金融主要是以农信金融为核心业务,依托于农信云和农信商城所积攒下来的大数据为基础,依托于我们自己开发的农信资信模型,创建一套区别于传统商业银行的,服务于涉农企业的金融体系。农信运营中心主要是统一承接企业线下的渠道以及产品服务。农信互联在2017年的时候完成了A轮融资,在2018年9月份已投前估值70亿完成了B轮融资。

第二、业务上云历程

我们在2015年的时候业务基本上全部跑在云上,当时是使用OpenStack,2017年把所有的业务都迁移到了Zstack平台上,并部署了混合云,在混合云上进行了部署实践,2017年获评了十大标杆案例。2018年对私有云进行了扩容,并完善了混合云的方案,私有云和公有云之间我们是增加了专线的连接,并多次进行了灾备的演练,为了获得更好的灾备能力,今年也在探索实现混合云应用的双活。

简单跟大家介绍一下我们使用过的两个私有云平台,这是我们部署OpenStack时候的拓扑。我们核心到万兆、到千兆,再到服务器的千兆卡和万兆,都是交叉冗余的部署方式。当时为什么考虑重构云平台?我们在使用OpenStack的时候确实遇到了一些问题,比如说系统不够稳定,经常会出现一些问题,部署运维是比较复杂的,必须要有专业的团队才行,我们当时是依托服务厂商,升级比较困难,要是想在线的情况下不影响业务,去升级云平台几乎不太可能,我们评估多次也不敢进行尝试,因为所有生产环境在上面跑,我们是有三个环境:测试、预生产和生产环境。在OpenStack的时候,我们是只做到了网络层的隔离,没有做到物理隔离,这个时候要做一个压测,或多或少会对生产环节产生影响。

这是后来部署Zstack,同样是测试、预生产、生产三个环境,做到了物理隔离,三个集群是用同一个管理节点去管理。计算节点和存储节点是分开来部署的,单独部署,生产集群是单独用一套存储,存储节点加入SSD作为缓存盘,在IOPS上有大大的提升,物理连接上还是一样,我们有一个全冗余的设计,没有单点故障。

这是Zstack提的4s标准,我主要是想跟大家提两点,一个简单、一个智能。简单就是安装部署简单,相比OpenStack来讲,确实要简单太多,而且产品化也做得比较好,这样大大地降低了我们部署人员的门槛。智能,我最想说的就是无缝升级,这也是OpenStack没办法比拟的,我们用Zstack两年多的时间了,我们升级了很多次,Zstack的升级基本上就是一条命令就可以升级完了,在升级的过程中,业务完全不受影响,只有管理的界面上是不可用,在升级的时候,大概10分钟左右基本上就可以升级完版本,而且可以跨版本升级。

第三、混合云实践

混合云管理。我们部署的是Zstack的混合云版本,是和阿里公有云在数据和控制层面打通的,我们在一个控制台就可以管理我们的私有云和阿里公有云。在资源申请方面,我们自己开发了一个项目发布系统,项目负责人在项目发布系统上创建项目,填写你所需要的资源,比如说你需要私有云资源、测试、预生产、生产环境,你需要多少台机器,公有云需要多少台机器,等它创建完项目以后,这个工单就会到达资源管理人员,如果审核通过了他就会通过API自动地在私有云和公有云上创建出相应的虚机,并且自动注册到堡垒机上。虚机的管理全都是通过堡垒机进行的,堡垒机可以对这个进行权限的控制和行为的审计。

这是混合云的拓扑。我们现在有两个数据中心,线下的北京的IDC是我们的主数据中心,天津是灾备数据中心,主要是用于数据库的灾备,公有云上我们部署了我们的应用灾备。公有云使用VPC的网络,可以完全掌控自己的虚拟网络,包括IP地址、划分的网段、配置的路由和网关。混合云通过专线和VPN互联实现高速、稳定、安全的私网通信。VPN作为备用链路,在线下的机房和公有云也有VPN的连接,给它放在最低的配置,比如我们需要使用的就让它保持这个连接,如果专线出现问题的时候,我们会切到VPN上去跑这个流量。阿里云+物理IDC的混合架构实现了跨数据中心容灾。同时,双业务入口的模式也确保了完整的业务高可用性,混合云架构在保证资源弹性的同时也确保了安全。

我们在公有云只创建了生产环境的所有虚机,比如Web服务器、代码管理、部署管理等ECS常开,其余ECS采取停机不收费的方式,这样可以降低成本。数据库根据公司的要求是不上到公有云上,全部跑在线下的数据中心里,可以根据故障级别进行灾备切换。

举几个例子,比如北京的主数据中心出口出现了问题,只是出口出现的问题,这样的话我们就可以启用阿里的公有云Web服务器,阿里公有云Web服务器通过专线指向我们的私有机房的应用,这种方式也是最高效、最快速的,也是影响面最少的,实在了互联网入口的容灾。

如果我们的私有云出现问题,我们的数据库还在的话,我们就起用阿里云的灾备云的应用,通过专线访问私有云的数据库。整个机房都挂掉的话,我们会同时启动灾备数据中心的应用,也启用天津的灾备数据库。这样就可以根据故障级别进行灾备切换,不同的级别有不同的切换方案。

通过两年多的使用,总结了混合云的注意事项,第一,一定要有成熟的私有云平台在混合云方案里面,成熟的私有云平台是实现混合云的前提条件,否则混合云就会顾此失彼,首尾难顾。第二,就是带宽和网络延迟,混合云的场景下网络延迟是不可避免的,因为就需要从连接方式上尽量选择专线,同时优化我们的应用,减少带宽的占用。第三,要有很好的API接口的支持,良好的API接口方便公有云对接,也可以提升效率,比如创建虚机基本上是通过API创建,迁移的时候也是通过API批量创建几百台虚机,手工创建就比较麻烦。第四,要注意IO性能,在公有云上性能差别还是比较大的。第五,稳定性,云服务器需要流量调度机制足够灵活,一旦出现问题我们可以立即切换。第六安全性,将公有云和私有云进行整合以后,这个混合云方案,公有云机器就相当于进入了企业的数据中心,一定要做好安全方面的工作。

最后跟大家说一下混合云的优势。一,高效容灾,混合云不管在数据层面还是在企业里,在业务的连续性上都可以提供高效的容灾能力;二,架构灵活,混合云允许公司最有效的方式去分配任务、分配应用,根据业务的需求去整合和配置混合云,比较灵活,根据不断变化的业务需求,在公有云和私有云之间可以切换资源、基础设施、数据部署和网络;三,可扩展性,公有云总是可以轻松扩展的,所以混合云也能够得到简单快速的可扩展性,满足突发的临时的资源需求,突发临时需求不在私有云上配置,可以在公有云上快速创建出来;四,成本效益,混合云可以帮助企业降低成本,利用计算资源成本消除购买本地资源的需求,我感觉现在混合云已经到了高速的发展期,我相信会有更多的企业选择混合云方案,通过混合云的应用解决企业中遇到的问题。

谢谢大家。

新闻搜索

覆盖全国各省会城市及海外城市的网速测试
→选择要测试的地区
→选择目标测试点