英特尔至强处理器E7 v4产品家族全球发布会
时间:2016年6月6日下午
地点:中国大饭店宴会厅
主持人:尊敬的各位来宾,现场以及观看网络直播的各位媒体朋友,合作伙伴,以及IT主管们,非常高兴大家莅临今天的英特尔至强处理器E7 v4产品家族全球发布会。我是这次活动的主持人,来自英特尔中国市场部的杨光。6月6号,按照中国的传统文化是一个非常吉利的日子。在今天我们也将在这里一起迎来精彩,所以下面请大家一起跟我一样,摒住呼吸,全球同一时间揭开发布会的序幕。】
(播放视频短片)
让我们掌声欢迎英特尔公司数据中心事业部中国区总经理周晓梅女士。
周晓梅:哇!非常的震撼,正可谓信息滚滚云中藏,智能服务已启航,数据洞察企业变,致胜云端靠至强。
各位尊敬的用户、合作伙伴的代表、媒体和分析师朋友们,大家下午好!热烈欢迎大家在百忙之中抽出您宝贵的时间来参与和见证我们英特尔全新一代至强处理器E7 v4的产品家族发布会。今天是6月6号,是传统中国中大喜大吉的日子,今天是英特尔进入中国31年来,在中国举行的服务器产品首次首发仪式,这对英特尔中国处理器E7 v4具有特别的吉祥意义,祝英特尔创新与中国、与世界同行!】
大家知道,智能互联技术正在改变着我们每一个人的生活,与云相连接的智能设备呈现爆发式的增长,万物数字化和云计算正在成为发展创新的引擎。数据洞察必将成为企业业务转型的关键,作为计算创新的领导者——英特尔,我们义不容辞的贡献我们的技术和创新,为企业转型升级助力,让云计算、智能互联成为企业的核心竞争力。】
作为全球瞩目的中国市场,中国产生的数据总量已经超过全球总数据量的1/5,在这次智能互联、云计算的大潮中,中国的企业更需要借助实时的数据洞察来实现创新,提高竞争力。
在今天的发布会上,大家会看到全新一代英特尔至强处理器E7 v4的产品家族,这是我们为企业关键业务实时处理器打造的计算引擎,这代产品延续摩尔定律的创新节奏,能够在多个方面满足企业转型和可持续发展的要求。“合作共赢”是在英特尔入华31年来最重要的经验之一,今后我们将继续加强合作,推动大众创业、万众创新“双创”的步伐,为中国的用户提供优秀的技术和体验。】
今天我们非常荣幸的邀请到两位远道而来的全球领军人物,为大家详细的展示英特尔至强处理器E7 v4的技术亮点,同时,我们还请到杰出的行业代表来分享他们的应用实例,敬请期待。
在此,我要再次感谢大家莅临本次发布会,也希望大家能够对英特尔未来的创新保持持续的关注,让我们一同见证科技创新给企业转型带来的巨大价值。我们相信,致胜云端靠至强!谢谢大家!
现在请允许我隆重向大家介绍刚才提到的两位重量级嘉宾,让我们以热烈的掌声欢迎他们上场,Donald D.Parker和Patrick Buddenbaum先生。】
这位是英特尔数据中心事业部副总裁兼数据中心应用工程部总经理Donald D.Parker,这位是英特尔数据中心事业部企业应用总经理Patrick Buddenbaum,下面把舞台留给你们两位。谢谢。
Donald D.Parker:我叫Donald D.Parker。
Patrick Buddenbaum:我是数据中心业务部的总经理,我是属于数据中心品牌和业务设计部门的,感谢今天下午与大家分享的宝贵的时间。待会儿会有我们的终端用户与大家分享他们使用我们的产品,这些产品是如何帮助他们实现业务型的应用。他们来自于电信、能源、医疗,不同的行业,还有来自于大学、交通运输行业的客户,我们还有来自于银行业的客户,来看至强处理器是如何在不同的行业获得应用,同时我们也非常感谢我们这些合作伙伴,这些合作伙伴既有来自于国外的,也有来自中国的厂家,我们非常荣幸成为中国生态系统中的一个,成为创新的组件。我们的合作伙伴会在至强处理器的平台之上打造系统,让企业客户智胜未来。今天给大家开场介绍的是企业目前面临的业务挑战,这些挑战有些不是全球的,是仅针对中国的,我们来看一下企业目前需要做的转型,需要他们拥抱云计算,拥抱分析技术,获得新的业务洞察,能够更好的通过自己的多元化的产品和服务吸引客户,客户有实时的需求和期待,就像人们使用智能手机一样。比如我们用手机打开一个应用,我们希望随时获得,而不希望等5分钟。同样竞争,比如说创业型的企业,他们也造成了对传统企业的竞争压力,这也要求企业做更多。当我们去思考,现在创业非常容易了,我有一个新的点子,我可以通过云服务,即时获取基础设施的资源。因为事实上我们手机现有用户已经有20亿了,这就是你们潜在客户的基础,比如说支付宝还是PayPower,还是用户的电子银行系统,这些对银行都造成了压力,这些银行必须转型。】
我们再来看一下中国,中国的市场规模非常之大,有6亿多的互联网用户。我们再来看一下物联网,IDC的预测,有54亿的事物或者设备连到企业的网络,对于企业来说,如何分析他们,如何与这样一个大规模的客户群交互,这就是企业要面临的挑战。我们看到三大迫切的任务是企业IT必须要做的,第一是用云服务,拥抱混合云,不管是打造自己的私有云,还是做自己的公有云服务做测试开发,来去应对更好的工作负载的增减,混合云是第一个领域,第一个迫切的任务。第二个是分析,也就是说机会在于不要总是回溯性的历史数据的分析,不要总是去看已经发生的,而是要抓住机遇、技术,做实时分析,了解当下发生的事情,比如说高性能计算,还有一些仿真建模的功能,利用它们做预测性的分析,不要只是了解已经发生的,而是要去了解正在发生什么,预测未来将会发生什么。当然,还有机器学习的能力,来让自己的系统更加的智能。第三个迫切的任务就是关键业务型的计算,每一家企业都有他们的关键的基础设施,不幸的是,有些是基于大型机、传统的小型机,Unix的系统,有些时候这些传统的系统无法面临现在大量的计算任务,成为了一种制约因素。所以,要是能够与创业型的公司、初创公司竞争的话,我们相信置于英特尔至强产品平台的系统将是极富竞争力的。在3月31日的时候,我在北京为合作伙伴推出了至强E5 v4产品家族,可以说这是能够提供最佳的性能和TCO,非常适合于混合云,也就是私有云和公有云的使用场景。可以说,它是云环境下总拥有成本最佳的性能和成本比的一个产品家族,包括像我们的E3,至强E5,它能够满足各种各样丰富多彩的企业工作负载的需求。第二个迫切的任务也就是分析,分析已经存在于业务的各个领域,不光是内部的效率,运营的优化,打造新的服务交付方式,分析成为一个根本面的实现差分的因素,这确实是势在必行的一项工作。
在这里为大家举一个例子,CaixaBank,这家公司主要是使用分析打造新的产品和服务,针对00后。下面放这段视频。
(播放视频)】
所以这是非常有意思的一个例子,这家银行如何使用大数据的分析来去覆盖下一代00后的消费者,这是在银行金融服务领域来进行,比如说欺诈检测以及银行交易监控风险分析等等一些应用。我们看到这些分析作为工具已经是迫切的任务了,当然,还有一些做分析是为了获得进行一些转型式的改变,我们和像SAS,SAS今天也来了,还有甲骨文、微软、SQL Server2016、SAP他们Hana的平台,今天所有的合作伙伴都光临了现场,非常感谢他们。也就是把分析引入到这些交易型的数据库,关键业务型的应用环境中,我们看到这些引擎正在转型企业消费这些服务的方式。确实,它已经成为关键业务了,比如我们看电信行业,电信运营商,他们来分析网络流量,或者使用大数据分析来进行IDS,也就是网络入侵的检测,防止恶意网络侵入网络,当然在银行我们谈到了分析交易,实现实时的欺诈检测。还有在能源的电网方面,如何实时分析和应对,比如说断电了怎么办。接下来我想请徐戟,他是南瑞集团信息集团集成分公司首席技术官,他们为电脑开发了一套分析的系统,有请徐戟,感谢您的光临。
徐戟:各位来宾,大家下午好。我是南瑞集团信息系统集成分公司的技术总监徐戟,下面我给大家分享一下南瑞集团和英特尔在新技术创新方面的一些成果。】
大家都知道,随着全球互联网这个概念的提出和发展,能源行业在数据处理上面临着一种新的挑战,在随着全球能源互联网的建设以及泛在智能电网的建设,这些建设对原网上的互动提出了一些新的需要。举个例子,比如以前我们做一个电力调度,可能可以按照年、按照月去做计划,随着泛在智能电网建设,这种原网的互动可能是实时的。举一个例子,今天可能有一阵风,可能会下雨,这对于新能源来说,对于像太阳能这样的能源来说可能就会有一定的衰减,这种情况下怎么样调整整个网络的负荷,怎么样适应能源基地的一些反馈,以及我们在负荷端、负荷基地的反馈。以前我们在采集数据的时候,可能我们可以在15分钟采集一个数据点,目前国家电网在用电端的采集是按照每天96个点采集的,但是随着我们需要对负荷中心进行深度的分析,我们可能要做到每5秒钟、10秒钟采集一个数据点,我们传统的采集方案和现在来比较的话,可能会有100倍甚至几百倍的数据差异。这种情况下,我们传统架构如何适应新业务需求的发展,这是一个新挑战。】
因此,在这种新形势下,我们提出了八个字,我们以前是在做传统的集成,把高端小机、高端存储和企业级数据库直接拿到企业来进行组合就可以进行应用了。但是,随着业务的发展,这种模式不可持久,因此我们提出了八个字,叫做“按需定制、深度集成”,深度集成的概念是有区别于传统集成的。今天分享的是瑞腾高性能数据平台,用的是英特尔E7高性能x86服务器,加上P3700PCI-E SSD卡、高性能网络设备等IT基础设备,经过深入定制,按照业务需求定制参数、配置参数,形成超融合架构的服务器。在这个服务器下面可以适应国家电网在用电信息采集这样一些大数据量、高负载的场景下,能够进行准实时甚至实时的数据分析。】
这是一台瑞腾高性能一体机,里面使用了高性能的x864路服务器作为计算节点,在4路服务器里面我们采用DAS架构,直接插入P3700SSD卡,在本地可以提供超过100万的IOPS的处理能力,同时IO也是相当低,只有零点几个毫秒。另外,我们为了适应像国家电网这种高可靠性要求的计算,我们实现了高可用备机,实现数据零丢失。整个系统按照一种平台化的设计,可以从一个机柜扩展到一个机房。南瑞集团针对这个服务器还加入了自己的一些经过多年积累的在行业应用中的优化经验,这些经验可以使这台服务器更加适应国家电网这些应用的需求。】
大家来看一下我们在这台服务器上的应用成果,我们用国家电网最典型的一个应用案例做测试,比如说用电信息采集的系统,在应用不做任何修改和优化的前提下,我们用它和传统的RISC架构的小机进行比较。在这个配置下我们配置成本可以减少到一半以下,但是性能可以提升3倍到5倍。同时,瑞腾并不是一个仅仅是为高性能计算而设计的平台,事实上瑞腾可以做任何计算任务,包括高性能的,甚至一些小型的数据库资源池也可以在瑞腾上跑。根据不同的应用场景,我们会设计不同的应用需求,可以设计不同的硬件。在瑞腾整个平台里面,我们在底层使用了全x86化的设计,在最底层使用我们自己的定制化服务器,目前南瑞已经拥有了自己品牌的南瑞牌服务器。同时在定制化服务器基础上,我们会组建我们分布式存储系统,使用了南南瑞自己研发的NStorage系统的分布式存储软件,可以组织存储系统,这个存储系统作为整个数据中心底层的存储架构、存储资源池使用。上面可以插入一些高性能组件,也可以插入一些普通的组件,用它形成一个能够覆盖整个业务的资源池,这个资源池是计算资源池,里面既可以支撑高性能的计算,也可以支撑普通的小型计算。同时在两边,我们集成了大量的在多年来行业应用中积累的经验,比如数据中心管理系统,这是我们和英特尔基于IPMI合作的一个成果,它可以管理整个数据中心底层的硬件。同时我们在数据中心调度方面可以实现多个数据中心之间的资源调度。另外,通过应用性能监控,可以掌握整个系统的健康状况,随时进行调度。这样我们可以把瑞腾变成一个支撑企业核心业务的平台。前面我简单分享了一下我们跟英特尔在这方面的合作,我总结一下。】
南瑞和英特尔在IT基础方面是全方面的合作,包括我们有一些团队,来自于全球,我们通过微信群随时在一起工作,这是一个7×24小时的工作团队。我们也有定期的,比如每个月一到两次的技术交流,把最新的技术怎么样在行业应用进行一些分享。我们通过这样的合作为传统行业的技术创新提供一种新的方式,我觉得这种方式是值得其它企业去思考的。
“青青子衿,悠悠我心”,这是我们南瑞集团子衿团队的口号,子衿团队是一个跨行业的联盟,这个行业联盟里面也有英特尔的一份功劳。今天我的分享就到这里,谢谢大家!】
Donald D.Parker:非常感谢。再向大家介绍一下我,我叫Donald D.Parker,我是英特尔数据中心事业部的副总裁,负责数据中心平台应用和设计部门。我来到中国,可以说中国也是世界上最大的一个市场,在IT的市场方面也是增长最快的。今天我要为大家展示一下我们第一次发布的14纳米制程所生产出来的E7 v4的产品。14纳米的产品,也是我们首款14纳米E7的产品,我们非常兴奋以及激动为大家发布今天的产品,这是产品实际的芯片。
这款芯片有什么值得令人兴奋得地方呢?正如刚才Patrick Buddenbaum已经介绍过的,对于关键业务型的应用场景、业务分析的使用场景,当我们来分析这些使用场景的时候,有几个这个平台非常关键的点是能够为终端用户带来他们所需要的价值。第一,实时内存的大容量。第二,可扩展的性能。第三,先进的可靠性。它是我们所说的7×24小时,一周七天,一年365天的可能性。我们看一下世界领先的内存容量,多达24太字节,也就是说每路有3个太字节,这是非常高可伸缩的,比以前的产品容量翻了一番。我们看一下可扩展的性能,我们与合作伙伴一起实现这一点。我们来看一下与上一代产品相比,也就是一年之前,我们实现了分析查询数的两倍,也就是它最多可以支持256路。再有,可靠性,实现五个9,保证这个平台能够是全时正常运转。还有我们的可靠运行技术,它也是我们一些平台上已经好几年的技术,这些技术在一起打造和高可靠性,不光能够检测到平台中的一些错误,同时还能够纠错,来保证平台的长期稳定运转。同时我们谈到了,能够对于那些高性能的关键业务型的应用支持五个9的可靠性。】
我们在这里非常兴奋的去恭喜使用E7 v4打造了新的世界记录,大家看一下,有27项新的世界记录被创造,都是通过E7 v4的CPU来实现的。这是与OEM的合作伙伴在我们这个平台之上所打造的,大家在我们的英特尔官网上可以发现这些世界记录的细节,我想恭喜我们这些合作伙伴,也感谢你们能够与我们合作,来实现这些世界记录。】
不光是精准的测试,这很关键的让我们了解平台的特性,但是更关键的是现实的使用场景的性能。比如最终用户数据中心的这些用户,他们觉得最重要的是什么。在这里给大家举几个例子,当然实际的例子还是有很多的。比如说我们的E7 v4的项目,东软利用我们的平台展示了在一个具体的终端用户的场景里实现了非常高的性能,支持的客户数量来表现。我们可以实现同样的时间,但是交付服务客户的数量增加了30%,从而实现更高的效率。还有亚信,亚信主要是做客户关系,主要是为电信运营商实现OLTP系统的搭建,他们发觉在每时间单位处理OLTP交易数量增加高至1.27倍。当然,我们关注的是对最终用户,对他们来说最为关键的业务场景性能的提升,这是我们E7 v4为他们带来的非常好的增益。这个幻灯片上只是我们在生态系统中的合作伙伴几个小的例子,还有更多的例子。
我们再来看一下现有的安装基础,我们知道一年之前我们发布上一代产品,事实上我们已经有很多现有的客户,他们在扩展自己的数据中心,提供更多的服务,在你的数据中心部署更多关键业务型应用的能力。当他们在扩容的时候会增加更多的服务器,有很多服务器可能已经有三到四年了,我们看到使用E7 v4的系统与大概五年之前的E7 4870产品相对比,在内存容量方面有12倍的提升,这对于实时分析来说非常关键。还有虚拟化方面,目前大家的环境在虚拟化,在服务器的整合,也就是说虚拟机的支持方面能够实现3.7倍的增加。再来看一下关键业务应用的部署,比如SAP一些基准测试,它能够实现每个服务器的销售和分销用户增加多达2.9倍。所以终端用户确实在E7 v4方面非常优秀。
接下来我将邀请来自清华大学生命科学学院的杨涛,与我们分享一下在至强E7方面的使用经验。】
杨涛:各位来宾,下午好,我是来自清华大学的杨涛。现在我给大家分享一下我们的一些工作。
首先我们看一下生命科学与蛋白质计算有些什么HPC或者BigData的亮点。可以看到,现在比较火的是基因组学,基因组学主要是跟每个人的健康息息相关,因为每个人都有自己的基因序列,现在不管是个性化医疗,还是精准医疗,其实主要是瞄准人的基因组学来做的。而我们看到还有一块是很重要的,就是蛋白组学,实际上人类所有的疾病都是跟蛋白质的功能有关,或者跟它的结构有关,如果这些发生了一些改变,疾病就会产生,这也是我后面会介绍的,我们科研机构研究的重点。另外我们也会看到有一些精准医疗,还有一些转化医学。在这里我给大家大概说一下什么叫转化医学。特别是在美国,前面好几十年在生命领域的投入是非常巨大的,但是有些老百姓或者有些公众会问,这么大的投入,没有看到我们在医院里面的医疗手段有什么实质性的飞跃和提升,这些钱都花到哪里去了?这样转化医学就诞生了,转化医学就是为了基础的科学研究和最终临床之间搭一座桥,把真正的医学方面的技术研究转化成临床上的成果,这是转化医学,这也是大数据和高性能计算的热点。
我们再看一下蛋白质基础设施,我们这个设施是国家发改委批准建立的一个国家级的大的科学设施,挂靠在清华大学里面的。实际上它是来源于2006年的“凤凰工程”,“凤凰工程”设置的初衷是为了治疗中国的肝病,大家知道中国是肝病大国,如果能把肝病进行突破性的治疗,这会解决很大的中国人的医疗上的问题。
我们主要分为九大平台,有冷冻电镜平台、细胞冷冻电镜平台、生物计算平台等等。这张照片是李克强总理专门去清华,去我们那个设施呆了一个小时,我们的大BOSS,现在也是清华大学副校长,他在给李总理演示我们实验的过程。在去年我们大概有5篇《自然》的文章。
我们再看一下蛋白质科学研究为什么面临一些变革,主要有两个大的技术革命,都是在最近三年之内发生的。第一,直接电子探测器,右边这个不太起眼的电子设备,这个设备的售价并不高,大概60万美金,但是它的发明给我们整个科学研究做了一个非常大的变革,主要是把数据的采集规模提升了整整100倍,数据处理方方面面都带来了很大的问题,包括数据的存储和数据最后的处理。第二,来自于软件或者叫算法的改进。这是一个来自于剑桥的MIC研究所的著名教授,他做了大规模并行计算,软件的名字就叫Relion,在现有的几千个CPU核的集群里都跑的是这一个软件,这个软件确实是一个非常大的突破,它也因此获得了2014年的自然十大科技进展年度人物。
我们再看一下英特尔E7系列在我们那里直接的应用场景,我们是在做Polishing过程,Polishing很简单,就是我们在拍照的情况下,要对这些拍出来的图像进行打磨,如果打磨成功的话,会得到一些更精细的蛋白质的结构。我们可以看到右上角的这些图,箭头的左边是没有打磨过的蛋白质的结构图,右边是打磨过的,我们会看到有很多细的结构在打磨以后得到了分辨率的提升。这里面主要采用的是联想x3950 的8路服务器完成的任务。
最后看一下我们整个中心未来的规划和展望。首先,我们在广度的维度上,我们计算能力在五年之内预期会有超过5万CPU核的规划,存储上也会有大概100PB五年的规划。在深度上,因为我们跟国外最一流的,特别是剑桥大学的差距主要在于方法学的创新,这块我们也在进行工作。最后,人才方面的储备,因为我们知道科学竞争最终还要靠人来完成,所以在这块我们也在做一些相关的布局。包括一些卓越学者、领军人物,相关人才项目的设置。我们在预期,因为现在国家逐渐意识到生物安全已是一个非常重要的国家战略,我们知道现在在深圳,国家建了一个基因库,现在在生命科学领域,在非编码安A领域,国家也要建一些国家的库,这块我们很有可能会做一部分的承担工作。
我的分享到此结束,谢谢大家!】
Donald D.Parker:谢谢。感谢你们对于医药科学的贡献。非常重要的一点,就是看一下整个生态系统,只有这样才能够为终端用户提供完整的系统,我们需要英特尔的芯片以及我们OEM和软件合作伙伴的创新,也需要跨业界的合作,打造基于开放标准的系统。也就是说,我们要更好的助燃生态系统创新之火。我们在上面白色的框里都是业界的合作伙伴,而下面主要是软件业的合作伙伴,上面是OEM合作伙伴,我们看到有18个OEM厂商交付51个独一无二的平台,这就是可能的协同合作在中国的诞生,来更好的推动市场的发展。感谢诸位的光临,非常谢谢你们。下面我就请Patrick Buddenbaum回来。
Patrick Buddenbaum:谢谢Donald D.Parker。最后一部分,我们把重点放在关键业务计算,以及在这个领域围绕着合作伙伴的创新的这些机遇,OEM等等,帮助企业级客户摆脱原来既有传统系统的孤岛,比如说小型机的孤岛,我们知道中国的规模是极其之大的,这些企业级的客户也希望这些规模化的打造。我们经常说客户的要求是不能折中的,我们有很多基于至强平台的高性价比的系统,我们会谈到性能,会谈到可伸缩性,这也是整个客户所需要的。我们在可靠性方面是不会折中的,我们可以实现五个9的可用性。同时,整个业界也在推动创新,有的时候这些正常运行时间是依靠系统来维持,有的时候是通过应用堆栈来实现,它们并不依附于高可用的系统堆栈。所以,应用的可用性是由云服务供应商来提供的,比如说PaaS平台即服务。
我们下一位演讲嘉宾是来自于Ameco北京,也就是北京飞机维修工程有限公司,这家公司一直在寻找下一代ERP系统,更好的进行库存管理。有请高级项目经理刘巍。】
刘巍:大家下午好,我是来自北京飞机维修工程有限公司信息管理部的刘巍。北京飞机维修工程有限公司是在1989年,由中国国际航空公司和德国汉莎航空公司共同出资成立的飞机维修企业,主要从事飞机维修和机体改造工作,可以为波音和空客全系列机型提供飞机维修服务,小到附件维修,大到极体改造,均在我们的业务范围之内。现在是国内最大的飞机维修企业,现有员工11000人,总部设在北京,在天津、上海、杭州、广州均有我们的分公司。除了为国内所有航空公司提供服务外,我们还为世界上接近100家航空公司提供过维修服务,比如说美联航、汉莎、阿联酋航空等等。
每年我们可以进行重型维修200架次,就是将飞机完全拆解开维修、改装、组装回去,就像左上角的图片一样。每天我们迎来送往检修飞机1600架次,每年平均维修和大修发动机65台。我们具有2万项附件的维修和翻修能力。航空附件维修就是除了机体结构以外其它子系统的维修结构,大的比如说起落架、雷达,小一点的比如说水平仪。2万数字,左边图片里的是自动驾驶仪,2万上面的是黑匣子。我们还拥有亚洲最大的飞机维修机库,A380机库,可以同时容纳4架A380飞机在里面同时维修。而且我们是国内唯一通过欧洲航空安全局(EASA)147任务的机构,我们不光自己修飞机,同时教授别人如何修飞机。上述所有业务都是基于我们两个核心系统,ICP ECC系统,主要负责公司所有人事、财务以及物流工作,而航空维修系统负责公司所有的飞机维修计划的制定和维修手册以及工序的编写等等,是所有飞机维修工作展开的基础。
飞机维修事关航空安全,事关千万旅客的生命安全,所以上述两套系统对于我们的重要性不言而喻。在上述两套系统的运维过程中,我们主要面对三个挑战,首先是稳定性,二是性能,三是成本。
在2013年,我们当时的RISC架构平台已经经过了6年的使用,不能满足我们的业务需求。根据当时的情况,我们有两个方案,一是维持原有的RISC架构,二是将原来的业务系统迁移到基于英特尔CPU的x86架构下面。首先从稳定性上看,在经过过去多年的系统运维,我们发现在良好的可用性架构设计下,基于英特尔CPU的x86架构下的硬件可靠性完全是可以满足我们需求的。其次,业务系统的稳定性,主要取决于是否有完善的运维体系,是否有专业的运维团队,而且根据我们的经验,我们发现其实绝大部分的业务系统的非计划停机主要是来自于错误的变更,还有网络和机房等因素,而由于硬件所带来的非计划停机只占其中的很小一部分。】
再看性能,英特尔CPU的性能已经足够满足我们的需求,当时在PUC测试的过程中,英特尔E7CPU给我们展现了非常良好的性能,而且跟其它产品相比,它具有很高的性价比。用节省的成本,我们在我们的异地机房建立了非常完善的容灾架构,通过这个容灾架构,我们从另一个方面提高了系统的可用性,也提高了系统的稳定性。同时,由于较低的服务器价格,我们可以将我们的测试环境、开发环境建设得和我们的生产环境非常相似,在我们将来的运维和项目过程中可以非常容易的模拟生产环境的情况。举一个例子,在我们之前的一次SAP版本升级项目中,整个项目进行得非常顺利,但是由于测试环境和生产环境的巨大差异,从IO性能到CPU性能,一直到内存性能都存在巨大差别,导致我们很难去评估真正项目切换时需要多长的停机时间,所以我们只能尽量往大了去评估,这给我们之后和公司高层去确认停机时间带来了很多麻烦。
除了采用英特尔CPU为基础的x86架构以外,在节省成本方面我们还采用一些其它办法,比如说在我们的航空维修系统的迁移过程中,我们发现采用传统的数据库迁移方式,我们需要24小时的停机时间,这对我们来说是完全不能接受的。但是,通过一些其他的软件、工具或者产品,确实可以加速迁移过程,减少停机时间,但通常需要购买昂贵的软件费用。说句题外话,我们用的软件全部都是正版的。但是这些软件对于我们来说只是一次性使用,非常不划算,所以我们经过多方的咨询和打听,后来我们采用了戴尔的SharePlex服务,我们一次性使用工具,我们用很少的成本完成了数据库迁移,停机时间仅仅需要3.5个小时。综合上面的稳定性、性能和成本,我们最后在2013年和2014年将我们的两个核心系统,SAP、ECC系统和航空维修系统全部迁移到了英特尔E7 CPU为基础的x86架构下。最终凭借着良好的高可用性和容灾环境的设计,我们让两套系统的可用性达到了4个9,从生产环境将业务切换到灾外环境仅仅到小于15分钟,而且业务数据恢复点目标小于5分钟,两套系统响应时间提高了3.5倍,备份时间缩短为原来的1/2,足可以满足从当时算起未来五年的业务需求。硬件的投资成本大量下降,硬件购置成本节省超过50%,总体拥有成本下降了46%。从2013年、2014年一直到今天,以英特尔E7为基础的x86架构一直支持着我们飞机维修业务稳定高效的运行。谢谢大家!】
Patrick Buddenbaum:非常感谢。感谢您的分享,您与我们分享了您的经验,还有您谈到了能够实现的性能和经济性,感谢您与我们的这种合作关系。其实这是另外一个非常好的例子,也就是我们看到客户持续去选择至强的平台,这已经好几年了,这是一个IDC的图片,从2005年到现在已经跨十年的时间,我们看到持续的至强平台采纳的提升,所以55%的提升与2005年相比,IBM的Power看起来就不是这么成功的市场了。所以我们看到在这个市场上机会确实是越来越小,机会就在于与我们合作伙伴,不管是开发传统的2路、4路的这些系统,而是进入更大规模的关键业务系统,刚才Donald D.Parker也谈到了18家OEM的合作伙伴推出了市场上独一无二的51套的像4路、8路、16路等各种系统平台,在这里我想特别感谢诸位合作伙伴,感谢你们在你们的互联芯片设计上进行投资,来去实现16路,甚至16路以上的系统。有一些是跨国公司,像SGI,他们沿用自己高性能计算的传承,但是他们看到了一些内存计算应用的机遇,把这些系统引入到了高端的数据库分析的关键业务系统。还有HPE,HPE是利用了自己的传承,是Integrity的传承,他们把它引入到了使用至强的平台,推出了Superdomex服务器。华为也是推出了互联的服务器,最近在德国CeBIT展示上,华为的32路系统确实把至强引入到了高端高性能计算的市场,像可热插拔的CPU、内存等等。因此,我们看到这么多的合作伙伴共同助力创新,不光是在原来4路、8路,现在已经进入到了16路、16路以上的系统。所以,可靠性、经济性,性能上,不管是什么样的应用,都满足了客户的需求。感谢我们的合作伙伴,希望你们持续的投资以及支持我们。
我们确实在去利用生态系统合作伙伴的关系,我们能够为终端用户提供什么呢?这是一个至强的8路系统,它与IBM Power的配置是类似,从性能方面可以看到,至强平台的性能是引领的,与Power8相比,是实现1.4倍于Power8的性能,在数据衷心的环境下,像制冷,以及功耗都是有局限性的,所以至强的系统能够去实现更低的运营成本,这是8路的至强的系统,也就是它是20万美元。如果是IBM Power的8路的话,需要200万美元的价格,所以对于终端用户来说,每美元的经济性,我们是10倍于Power8,这就是真正至强平台为客户所带来的。我们看到中国强调本土创新,IBM有OpenPOWER,我们来看一下英特尔至强处理器E5 v4与OpenPOWER测试的对比,首先对比OpenPOWER性能高达2倍,对比OpenPOWER,功耗方面是它的一半,同时在每美元的性能上是2.8倍于OpenPOWER。所以对于你的核心的企业负载或者关键业务型应用,可以说至强8路的系统是非常好的,我们不断与合作伙伴合作,给客户交付更好的可靠性、更高的性能和经济性。在这里有一段视频,叫做university health,是美国做医疗的公司,他们使用至强的平台,在医疗档案病历管理上E7的应用。
(播放视频)】
我非常喜欢这样一些例子,还有刚才清华大学的应用案例,主要是看对于人的科技影响,也就是社会性的影响,这是英特尔与我们的合作伙伴共同带来的社会影响力。接下来邀请最后一位客户演讲嘉宾,他来自于中国移动,也就是唐辉,我们与他已经多年合作了,我们知道你有1.8亿的用户,做NGBOSS项目。非常感谢您的分享。
唐辉:尊敬的各位嘉宾,我是来自广东移动的唐辉,现在由我跟大家分享一下广东移动在IT系统方面x86化的一些经验。首先,广东移动给大家做一个简单的介绍,广东移动有1.8亿在网用户,相当于一个中等国家的用户水平。支撑产品总量超过190万,但是我们的IT系统承载的业务量非常多,每个月办理的业务量有3亿多笔,还有后端的自动控制请求有12亿笔。最多的业务来自于大家手机使用的不管是语音、短信还是上网,发生的一些使用记录的处理,每个月光广东全省就有4000多亿条话单。大家看一下大屏幕,左边是网络整体的架构,右边这个图是六个运营节点其中一个节点机器的部署架构,所以我们系统现在Boss这一侧,传统小型机有200多台,其中我们有一年还是IBM最大的单一的小型机的客户。
广东的IT系统从2000开始,现在已经升级了3代左右。每次升级,作为项目经理最主要的事情是要规划整个体系的架构,规划整个体系的规模,其中有一些问题一直得不到很好的解决。首先这个系统要支持多大的业务量,大家知道我们的语音通话有时段性的,语音按照我们经验来说,是每天晚上8点到9点的时候是语音话务的高峰,到了中秋和春节,大家都想给家里或者亲朋好友打电话,高峰期是平均水平的10倍,这样就带来了一个问题,我们规划的水平按照什么值进行选定,如果按照最高值进行选定,大量的资源就会闲置,没法提供服务。如果按照平均值进行提供服务的话,大家就知道关键的时候想给朋友打电话、发短信都发不出去,这样就会对移动的服务产生抱怨。这是一方面,规划完业务量之后,我们还要规划整个体系的购买量。比如我买多少硬盘,这是很简单的算法。但是在传统的架构中,硬盘的使用量并不是像大家想象得那样。举一个例子,为了买一份硬盘,首先要做一个Raid0+1,做柜间镜像,为了容错,需要买4块。还要主备机系统保证更高的可用性,就要买8块。再加上其他的远程复制需要要买到10块到16块,才能用上1块硬盘。这样对我们系统的规划和建设就产生了很大的问题,成本都用到哪里去了。还有要建设多少子系统,大家知道生产系统要高可用,要主备双机,需要两倍的容量。在系统升级或者发生故障的时候,不管小机多么可靠,它迟早要发生故障,所以这时候我们要给客户开机、停机,做一些功能调整,我们要有一个应急系统,这个应急系统是一直要存在的,给大家提供服务。现在又要求达到5个9、6个9,我们就要异地容灾水平,发生故障的时候一般都是话务高峰的时候,所以容灾量不可能是很小的,要达到和生产1:1的生产体系才能够达到比较好的效果。大家会看到,这三个问题在传统小机的水平下一直困扰着我们。如果事件不发生变化、业务需求不发生变化,我们系统经过打磨会慢慢完善。可惜现在是一个飞速发展的世界,大家也知道互联网发展很快,而我们原来支撑体系所有的业务机构,“三户一品”,客户、用户、账户和产品都发生了很大的变化。举个例子,在刚才所说的计费系统这一侧的,对流量和语音、短信进行算费,国家为了保护移动,4G推出的时间比国外迟了一年到两年,当时移动拿到4G牌照进行建设的时候发现,这个用户拿了4G手机,开通了4G业务,流量就会翻10倍以上,这样就需要我们后端的IT系统4-6倍的处理能力。通过流量的结构来看,我们广东省这边网页浏览量是19.8%,而全球是8.6%,这就说明视频的使用还有相关习惯的养成我们还处于起步阶段,这样带来对后端IT压力的增长并不是10%、20%的增长,而是100%、200%的增长。如果我们还采用原来的传统小机架构,我们初步估算了一下,到了2016年,我们投资就要买上百台小型机,投资超过10个亿。大家也知道,李克强总理要求移动运营商提高上网速度,要降资费,我们不可能把成本直接投入到用户的身上,就要追求一个变化。我们当时也到网上和同行进行交流,惊喜地发现x86的CPU,像E5、E7达到了小机可以比拟的程度,刚才英特尔也做了介绍,他们的E7都已经和Power的CPU达到1:1的水平。这样给我们带来了一个很好的技术的支撑,我们和我们的合作伙伴一起,对计费这个最核心的模块做了变化。大家看到这张图,我们采用集群式的模式,首先我们有一个业务分发的节点,把所有外来的业务按照分单进行分发,同时我们还有负荷检测,如果有一个节点宕机了,有其它节点自动把它的任务接管过来。同时还有一个实时的备份过程,把用户已经完成的业务,把你已经扣到的钱或者已经使用到的信息备份出去。这样在坚实的硬件基础上,再加上软件的系统功能灵活性的调整,我们就把核心系统完全进行了x86化。实施之后,经过线网测试,发现成本降到小型机模式的26%,相当于1/4,而峰值支持的CAPS值是小机的330%,变成了三倍,这个三倍是在现有基础上支持的三倍,这样我们对于4G,或者以后5G的推出,移动这边提供了一个很好的支撑模式。
同时,大家也知道大数据的水平会影响到方方面面,大家看一下左上角这张图,大家使用话单之后,在我们IT系统的流转图。其实大家使用完话单之后首先要进行算费,然后进行扣费,然后要进行结算,比如北京的用户去了广东,还要给广东结算,如果出国了还要国外进行结算。其中有一个环节,就是大家经常用到的,手机使用记录的查询,在我们内部叫计费详单子系统,以前在小机的模式下因为成本限制,所以我们只能提供7个月的查询,这在业务上是做了规定的。在原有系统的时候,我们用两台p595,在加上关系型数据库,再加上两台磁阵(音)做的支撑。广东当时是8000万用户,查询量是非常大的,特别是在月底和月初扣完费之后,一开始我们把它放到内存里处理,只能放一个月,并发数只能达到1000,后来我们特意在业务上加了限制,每个用户一天只能查三次自己的详单。2012年的时候我们和英特尔工程师交流的过程中,发现英特尔当时为了推出x86集群化,推出了分布式的Hadoop体系,我们就拿这个作为我们的试点,购买了133台2路8核至强服务器,同时还有英特尔Hadoop版本,建立了一个很好的分布式体系,它给我们带来的惊喜,成本只原来的20%,同时并发查询数是原来的20倍,同时我们还可以根据机器的增加进行线性的增加,来给用户提供更好的服务。
这个小试点成功之后给我们带来一个信心,在2015年第二期,我们把其他的6个系统都迁移上去了,同时把Hadoop升级到2.6版本,增加了Spark、Stream等分布式体系。同时把网络从千兆升级到万兆,对于大数据体系来说,内部的网络互联性严重制约了性能的发挥,同时我们也会把各个用户的标签,比如每个用户的使用状况,每个用户的业务状况,还有实时的接触信息都放到大数据体系进行处理。
对于广东移动来说,x86总体化的原则是这样的,新建的系统原则上都采用x86的体系,在加上云计算技术。对于大数据来说,还有计费系统都已经得到很好的验证,我们就严格采用x86体系,加上内存数据库,还有一些Hadoop的分布体系。另外,因为要利用原有的资源,所以对账户体系保留现有的小型机体系。给我们带来的收益有六个方面:大数据能力的处理得到了飞速上升。系统建设成本也得到了下降,一般是1/4到1/5左右。实时处理能力得到很好的提升,系统运营成本也得到了下降,大家可能会感到奇怪,因为有的时候x86机器多了管理会非常麻烦,其实x86的机器大家也知道,CPU性能已经提升很多了,和小机达到1:1点几的比例了。我们以前用传统小机建设,一般扩容或者更改周期都是以年为单位,但是对于x86的系统,我们一般以周或以月的方式,很快的购买,可以很快的弹性扩容管控。下面是系统的可扩展性得到提升,系统的建设周期也变低。
从技术经验的分享一共有三块,第一,对核心业务来说E7提供了非常好的性能和功能,改变了传统行业对x86机器的印象。第二,强大的计算能力和高速的网络能力,特别是第四联(音)的网络能力结合在一起。第三,在系统发生问题的时候,我们得益于英特尔提供的免费技术支持,能够迅速定位问题并解决问题。
这里非常感谢英特尔的工程师免费给我们提供了这些最新的资讯,让我们从传统行业走出来,能够及时拥抱变化,给客户提供更好的服务。非常感谢各位的聆听!】
Patrick Buddenbaum:谢谢。我又上来了,我来总结一下。创新,一直是我们遵循的核心原则,我们与合作伙伴、OEM,与ISV的合作伙伴一起,我们都认为创新是我们的根本原则,我们知道中国的“十三五”规划也是强调中国未来发展的强有力引擎就是来自于创新。因此,我们英特尔携手中国的合作伙伴推动创新,更好的助力中国“十三五”规划的执行。我们从1985年就来到中国市场,我们也是与中国的政府和企业合作,来使用技术,实现技术突破。感谢诸位能够给予英特尔这样参与中国的机会。我想再次感谢诸位合作伙伴和今天光临本次新闻发布会的嘉宾们,我们看到在各个行业都出现了转型式的机遇。
Patrick Buddenbaum英特尔公司数据中心事业部企业应用总经理
Donald D. Parker英特尔数据中心事业部副总裁兼数据中心应用平台工程部门总经理
周晓梅英特尔公司数据中心事业部中国区总经理