数字化转型方略 第6期 2019/06/28

公有云选型系列:蜂鸟网渐进式混合云之路(上)

文/邹大斌
对于那些有些历史的企业,它们既想拥抱云计算,同时原有的传统IT架构又无法割舍,如何兼顾它们,通过合理的组合采用混合云模式搭建起一个真正适合自己的IT新平台,是一个挑战。蜂鸟网就经历了这一过程,并最终找到了适合自己的最佳模式。

云计算就像一列滚滚向前的列车,越来越多的企业或自愿或被裹挟纷纷登上了这趟列车,享受到了云计算带来的技术红利。与此同时,也有不少企业在观望和犹疑。它们既想拥抱云计算,同时原有的传统IT架构又无法割舍,如何兼顾它们,通过合理的组合采用混合云模式搭建起一个真正适合自己的IT新平台?或者,简单直接,让这些系统一步到位全部上云,这都是需要CTO、CIO认真考量的问题。本期介绍的蜂鸟网就经历了这一过程,并最终找到了适合自己的最佳模式。

蜂鸟网(fengniao.com)成立于2000年,是中国影像互联网平台领军企业。在为广大摄影用户提供专业、丰富的摄影资讯的同时,围绕“影像生活”为用户提供互动交流、二手摄影器材交易平台,以及提供专业的摄影培训课程和高品质的影像输出等服务。

在上云路上,蜂鸟网走得不算早。在2015年1月蜂鸟网从原来所属集团中独立运营之前,一直采用传统IT架构,IT系统运行在原集团托管的数据中心中。随着公司独立,公司对IT部门提出了新的需求,特别是云计算的流行,让蜂鸟网有些心动。“本着满足业务需求,同时降低成本”这样朴素的想法,蜂鸟网开始了上云之旅。

蜂鸟网的几条业务线却有着完全不同的业务特征。一类是媒体业务,对图片的存储和访问需求很大;第二类是摄影在线教育业务,对视频及直播的需求很大;第三类是二手摄影器材的交易业务,对实时性和安全要求很高。这直接导致了对云服务有着不同的需求,最后选了两家云服务商来提供服务。另一方面,蜂鸟网还有一些核心业务目前还不能迁移到公有云上,比如数据库和公司内部的一些业务系统。这让蜂鸟网面临着与一些大公司同样的挑战:多个公有云+私有云,如何管理和进一步优化,是留给蜂鸟网未来的课题。

但令人高兴的是,通过与云服务商的共同努力,蜂鸟网建起一个适合自己的IT平台,节省了开支,还极大地简化了运维工作,同时提高IT的灵活性,可以快速响应业务需求,为蜂鸟网的业务运营提供了更好的支撑。

以下为至顶网对蜂鸟网CTO郭枫的独家专访。

郭枫 蜂鸟网CTO,蜂鸟网技术资源的管理者,15年的互联网行业经验,主导了蜂鸟网相关的技术创新产品的设计和研发。郭枫关注行业技术发展动态,从用户和业务的角度制定产品、技术的发展战略规划,为公司技术发展提供决策性建议。

至顶网:请您介绍下蜂鸟网的主营业务以及这些业务对IT提出的要求?

郭枫:蜂鸟网成立于2000年,2015年1月蜂鸟网独立运营,是中国影像互联网平台领军企业。在为广大摄影用户提供专业、丰富的摄影资讯的同时,为器材厂商和经销商提供卓越有效的互联网营销解决方案。围绕“影像生活”为用户提供互动交流、二手摄影器材交易平台,以及提供专业的摄影培训课程和高品质的影像输出等服务。

就业务线而言主要有三条:第一条是我们从2000年建站开始一直到现在都有的媒体业务:主要有编辑主导的评测和采编文章,另一个是论坛部分,有大量摄影爱好者在这个论坛交流。

蜂鸟的媒体业务给IT带来的主要挑战是图片的存储,一方面我们这么多年积累了大量的图片,达到100TB了,还在不断增长。另一方面,摄影图片本身就比较大。比如,一台1万像素相机拍摄出来的图片很可能达几百兆。这些年网站对单张图片大小上线一直在提高,现在我们允许20M,编辑手里的很多样张原图都已经是50M、100M了。

大量的图片给后台的存储带来很大压力。不仅如此,我们网站要用到各种各样尺寸的缩略图,它们大量存在占用了大量存储空间,能达到原图的2倍。为了存储这些数据,我们用了几个盘柜,图片存储和备份占了几个机柜,硬盘也经常会有损失去换。另外,CDN的开销也主要服务于图片浏览上。因此降低存储的成本很有必要。

第二部分是我们的二手业务,相当于电商部门,主要是摄影器材的买卖、回收、租赁、维修。这项业务的开展是因为摄影器材一般比较保值,属于光学仪器,贬值率非常低,在二手东西里它的流通率非常高。最开始我们蜂鸟网在中间提供担保帮助网友达成这种交易,这两年我们逐渐把业务扩充到租赁、维修。这个业务背后是我们的电商平台在支持。

第三部分是摄影在线教育业务,我们提供摄影的在线教育、摄影培训服务,主要以视频体现,包括直播、视频文件录播等,需要直播后台支持。

至顶网:面对上述业务的需求,IT部门如何满足它们?

郭枫:我们选择了多云加私有云的混合云模式。对于图片存储方面,我们选择七牛云。这是我们最早尝试的公有云服务。选择七牛云,一方面是因为七牛云主打存储,能很好地满足我们的存储需求。而且,它只存原图,缩略图是自动生成的,不占存储空间,这样存储空间得到很大节省。它对外提供了一个缩略图的接口,我们只要把自己业务端的逻辑调整下,调用它的接口就好了。调整业务逻辑需要花点时间,但这个工作量并不算大,整体对我们来说收益还是非常高的。

选七牛云的另一个重要原因是,七牛云当时和我们都把服务器托管在同一个机房里面,这意味着我们存储的图片不用通过公网,可以在内部直接转移到七牛云上,不用占用我的带宽。

我们双方合作过程中彼此磨合,最后赢得了一个让我们满意的结果。当然,在这个过程中,我们有些需求七牛云并不是都能马上满足,有些也没有那么完善,比如我们的大图片的缩略图对七牛云也是很大压力。后来他们根据我们的一些业务需求做了些调整,现在相对来说就非常完善了。

今天我在七牛云上做直播、视频方面的业务,要调用七牛的一些功能。因为本身前面的合作已经非常好,也建立了很多信任的关系,所以说它们有一些新的服务,我们也愿意尝试。

至顶网:对于二手交易的电商业务和直播业务,IT系统是如何满足业务需求的?

郭枫:我们的二手电商平台放到了另外一个公有云,前端资源和业务逻辑等都放到了云上,但其中的后台ERP和电商数据部分由于是非常敏感的数据,我们放到了托管的IDC里面。这公有云用的就是UCloud(优刻得)。

由于采用了这种混合云的部署方式给我们带来了一个挑战,就是我们在公有云上的业务逻辑要访问存放在IDC里面的数据,这里处理不好会有延迟,会影响用户体验,可能直接导致用户直接放弃交易。这里有两段要打通,一段是从托管数据中心到UCloud POP点(相当于网络汇聚点),一段是从POP点到UCloud机房。后来通过专线的方式解决了,确保了访问的低延时。

关于我们的知识付费部分,有两个后台:一个是我们的APP,自己开发,运行在UCloud,访问文件存放在七牛云上。另外一个是直接用七牛云的直播平台,七牛云对于直播提供一些功能支持,比如推流等。

至顶网:为什么你们没选择把服务器托管到云服务商的机房而是托管到另外一个IDC?

郭枫:这里主要还是风险和收益的平衡。我要进行这种搬迁,最好的办法是在新的托管机房配置一样的设备,租好、配置好、热同步都做好了,这边切断瞬间迁移过来,业务马上起来,这样保证业务不间断。实际上,我们不可能这样,成本太高。我们只能把业务中断,把设备搬过来。这里面就存在一个风险,业务可能会中断很长时间,这对我们的影响会很大。

我们之前曾经有过一次IDC搬迁的经历,当时要把服务器从原来的机房迁移到现在托管的这个数据中心。即便我们之前做了很多次演练,但中间还是出现了一些问题,原来预计部分业务停机12个小时就能搞定,到最后用了16个小时,中间还是出现了一些访客感觉不到的问题,折腾了很久。

原因很多,一个原因是我们原来依赖上级集团的IT基础设施,很多设备都给你分好、配好,而现在需要重新搭自己的网络、防火墙、交换机等,相当于要重新搭架构。另外,我们从2000年成立到现在这么多年了,IT系统有很多变迁,文档资料不全,要梳理清楚很不容易。第三,有些机器运行了很久了,现在突然关机,启动不起来了。记得当时,为了避免这种情况我们所有的服务器和备件都做了备份。那是一段痛苦的经历。

至顶网:如果你未来要对IT进行扩容,你会选择UCloud进行服务器托管,还是会继续选择放在IDC?

郭枫:从整体来看我还是倾向于维持现状,托管在现有的IDC。因为通过我们测试以及现在的实际运行效果看,通过专线的方式连接IDC和公有云,能够满足我的业务需求。而且成本可控,专线成本不太高,能够保证数据的足够安全。

虽然看起来,把服务器直接托管在UCloud的机房里,与UCloud上的云主机相连,管理更方便些。但鉴于我们IT架构相对比较复杂,移过去并没有省多少费用,还存在很多未知的风险。所以目前来看,我还是会坚持这种以专线打通IDC内的私有云和UCloud公有云的部署方式。

顺便一提的是,这种专线在一定程度上提升了安全性。我们在这个专线两端分别设立了相对独立的、不同的子网。比如,在UCloud有几个子网,分别对外提供服务的Web端应用和不需要对外提供服务(内部的服务有队列机和Redis、Memcached等)分别属于不同的子网段,通过这种方式实现一定程度的隔离,提高了安全性。

至顶网:前面介绍了现在的上云情况,接下来请您谈谈当时为什么要上云?

郭枫:之所以会上公有云,有一个外部大环境的影响,也就是外因。这些年,随着云计算概念的普及,不管是我们这些做IT的还是我们的领导,都或多或少的听说过云计算,给大家的印象是能省钱,因此,公司领导也要求我们关注。这是外因。

而内因是,我们的业务需要有一些弹性,尤其是像“双十一”这样的大促,我们的物理服务器并不是总能很好地满足我的业务需求。比如,遇到“双十一”我到底要备着多少台物理机?准备少了,不能满足业务需求,多了浪费资源。而公有云的方式可以提供很好的弹性。另外,在存储方面,原因前面也提到了,云存储可以直接降低我们的存储成本。

我们上云还有一个契机,就是我们托管的物理机大多数是2015年公司独立时采购的,到2018年时候陆续都过保了。过保之后意味着成本有了很大不确定性。当时就两个选择,一个是采购新的服务器,另一个就是公有云。综合选择,我们决定上公有云。

至顶网:目前,在UCloud上用了哪些云服务?

郭枫:目前在Uclould上主要用的是云主机、负载均衡ULB等。有些服务虽然云服务商也提供,但我们选择在托管服务器自己搭,比如队列机、缓存数据库Memcached、Redis等。我做过一个简单的测算,认为这样我们可能更划算。我认为,云服务有这个特点,就是一定量级以下比较划算的,过了那个量级之后感觉成本节省就不太大。当然,公有云服务的便捷性是没法比,想用马上可用。我更多的是从成本上考虑,一个是成本,还有一个就是自己可扩展。

至顶网:你们现在在数据备份方面是怎么做的?

郭枫:我们的数据库运行在托管机房的服务器上,对于这些数据每天都会做备份。如果出现问题,我们现在可以回滚到任何时间点。在图片备份方面,我们就依赖于七牛云本身,只是定期做异地备份。

(未完待续)

本文章选自《数字化转型方略》杂志,阅读更多杂志内容,请扫描下方二维码

《数字化转型方略》杂志