面向未来 Arm v9架构瞄准下一个计算十年
计算架构的“新黄金十年”已经开启。上世纪世纪80年代,体系结构创新频频推出,计算机性能得到大量提升,迎来了第一个黄金时代。今天,随着大数据、人工智能、边缘计算等技术的发展,计算产业正在迎来新的发展机遇。
近日,Arm今日宣布推出Arm v9架构,以满足全球对功能日益强大的安全、人工智能(AI)和无处不在的专用处理的需求。Arm v9立足于Arm v8的成功基础,是这十年来最新的Arm架构。
Arm首席执行官Simon Segars表示,“在展望由AI定义的未来时,我们必须夯实先进的计算基础,以应对未来的独特挑战。Arm v9就是我们给出的答案。在通用计算所具备的经济性、设计自由度和可及性的基础上,市场需要普适专用、安全而强大的处理能力,这将驱动下一个3000亿个基于Arm架构的芯片发展,而Arm v9就是这些芯片的技术先驱。”
面向人工智能、安全和专用计算的未来
基于Arm架构的芯片出货量在持续加速,过去五年基于Arm架构的设备出货量超过1000亿。按照目前的速度,无论是在终端、数据网络还是云端,全球100%的共享数据很快将会通过Arm技术进行处理,如此广泛的应用让Arm肩负更多的责任和使命。
在新的时代机遇下,计算架构的革新迫在眉睫,而Arm v9架构给出了自己的答案,基于通用计算具备的经济性、设计自由度和可及性的优势,提供更多的安全性和性能,顺应AI、物联网和5G在全球范围内的强劲发展,加速每个产业应用从通用计算转向专用计算。
Arm高级副总裁、首席架构师兼技术院士Richard Grisenthwaite告诉记者,Arm v9架构是基于Arm v8既往成功的基础,并增添了针对矢量处理的DSP、机器学习、安全等技术特性。此外,Arm v9一个很重要的特点就是可伸缩矢量扩展(SVE2),SVE2增强了对在CPU上本地运行的5G系统、虚拟和增强现实以及ML工作负载的处理能力。
众所周知,现在人工智能工作负载已经成为主流。AI工作负载的普遍性和广泛性需要更多样化和专用的解决方案。据估计,到21世纪20年代中期,全球将有超过80亿台搭载AI语音辅助的设备 。且90%或更多设备上的应用程序将包含AI元素以及基于AI的界面,如视觉或语音 。
为了满足这一需求,Arm与富士通合作开发了可伸缩矢量扩展(Scalable Vector Extension,SVE)技术,并驱动了世界上最快的超级计算机“富岳”。在此基础上,Arm为Arm v9开发了SVE2,以便在更广泛的应用中实现增强的机器学习和数字信号处理能力。
SVE2增强了对在CPU上本地运行的5G系统、虚拟和增强现实以及ML工作负载的处理能力,例如图像处理和智能家居应用。在未来几年,Arm将进一步扩展其技术的AI能力,除了在其Mali GPU和Ethos NPU中持续进行AI创新外,还将大幅增强CPU内的矩阵乘法。
如今我们面临海量数据,除了有效处理数据外,数据安全问题也非常重要。为了解决当今最大的技术挑战——保护全球数据安全,Arm v9架构路线图引入了Arm机密计算架构(Confidential Compute Architecture,CCA)。机密计算通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。
Arm CCA将引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,以实现保护数据安全的目的。例如,在商业应用中,机密领域可以保护系统中商用机密数据和代码,无论它们正被使用、闲置或正在传输中。事实上,在最近一项针对企业高管的Pulse调查中,超过九成的受访者相信,机密计算可以帮助降低企业在安全方面投入的成本,如此一来,他们可以转而大量的投入工程创新。
微软Azure Edge和平台部门企业副总裁兼首席技术官Henry Sanders表示,“随着从边缘到云的用例越来越复杂,我们已经不能用一个放之四海而皆准的方案来解决所有用例。因此,异构计算正变得越来越普遍,这需要硬件和软件开发商之间加强协同。Arm与微软密切合作开发的Armv9机密计算功能就是硬件和软件之间协同的一个很好的范例。Arm处于独一无二的位置,可以在生态系统的核心加速异构计算,在驱动数十亿设备的计算架构上促进开放创新。”
下一个计算十年的愿景
在过去的五年,Arm技术每年都以超过业界的速度提升CPU性能 。Arm在新一代架构Arm v9上将保持这个速度,预计未来两代移动和基础设施CPU的性能提升将超过30%。
然而,随着行业从通用计算向普遍的专用处理发展,每年两位数的CPU性能提升是不够的。除了增强专用处理能力,Arm的全面计算(Total Compute)设计方法将通过集中的系统级硬件和软件优化以及用例性能的提高,加速总体计算性能。
通过将全面计算的设计原则应用在包含汽车、客户端、基础设施和物联网解决方案的整个IP组合中,Arm v9系统级技术将遍及整个IP解决方案,并改善个别IP。此外,Arm还在开发多项技术以提高频率、带宽、缓存,并降低内存延迟,从而最大限度地提升基于Arm v9的CPU性能。
当前,Arm v8正在当今需要计算的领域中驱动最佳的每瓦性能表现。Arm确保了在64位上的v8架构中的所有功能均将在v9架构中得到支持。此外,从应用的角度来说,v9架构也将支持在32位上的v8架构功能。
从某种意义上看,Arm v9架构是Arm推出新特性和功能的第一步,这些新特性和功能将提供更高的性能、DSP和ML功能以及增强的安全性,这些功能也将以令人惊叹的方式展现计算强大的变革能力。
“这个强大的变革能力的核心是我们庞大的合作伙伴生态系统和共享成功的商业模式。更复杂的基于AI的工作负载需求,正在推动更安全和专用处理的发展,这将是打开新市场、抓住新机遇的关键。Arm v9将赋能开发者通过弥合软硬件之间的关键差距,构建和编程未来的可信计算平台,同时实现标准化,帮助我们的合作伙伴在更快的上市时间和成本控制之间取得平衡,同时能够创建自己独特的解决方案。”Richard Grisenthwaite如是说。
本文章选自《数字化转型方略》杂志,阅读更多杂志内容,请扫描下方二维码