Gaudi2中国市场发布,英特尔与伙伴要抄GPU的后路
大模型驱动的AIGC对于算力需求是巨大的,这直接带动了AI基础设施的发展,而AI服务器更是成为抢手货。这次Gaudi2在国内发布,并由浪潮信息进行相关服务器的销售,无疑为当前火爆的AI服务器市场带来新的变化。
新闻事件
2023年7月11日,英特尔正式于中国市场推出第二代Gaudi深度学习加速器——Habana Gaudi2。 同时,英特尔正与浪潮信息合作,打造并发售基于Gaudi2深度学习加速器的浪潮信息AI服务器NF5698G7。
新闻分析
在笔者看来,这一新闻看点着实多,我们不妨从中挑选出几个看点,与大家分享。
01 新选择,AI服务器的新变量
众所周知,现在AIGC如此火爆,直接带动了算力需求的激增,进而推动了AI服务器的发展。
根据IDC统计,2022年预计全球生成式人工智能对AI服务器的新增需求规模为8.2亿美元,预计到2026年其新增需求规模将达到109.9亿美元,2022年至2026年的年复合增速高达91.34%。
AI服务器通常拥有一个或多个协处理器,比如GPU、FPGA或ASIC协处理器,而CPU与GPU的组合是最为主流的组合,例如英特尔或者AMD的处理器加上英伟达的GPU。
现在随着Gaudi2的推出,AI服务器迎来新的组合模式。Gaudi2深度学习加速器暨Gaudi2夹层卡HL-225B,以第一代Gaudi高性能架构为基础,以多方位性能与能效比提升,加速高性能大语言模型运行。该加速器具备:
- 24个可编程Tensor处理器核心(TPCs)
- 21个100 Gbps(RoCEv2)以太网接口
- 96GB HBM2E内存容量
- 2.4TB/秒的总内存带宽
- 48MB片上SRAM
- 集成多媒体处理引擎
Gaudi2加速器的出色性能在6月公布的MLCommons MLPerf基准测试中得到了充分认证,其在GPT-3模型、计算机视觉模型ResNet-50(使用8个加速器)、Unet3D(使用8个加速器),以及自然语言处理模型BERT(使用8个和64个加速器)上均取得了优异的训练结果。与市场上其他面向大规模生成式AI和大语言模型的产品相比,Gaudi2拥有卓越的性能与领先的性价比优势,能够帮助用户提升运营效率的同时,降低运营成本。
此外,Gaudi2可为大规模的多模态和语言模型提供出色的推理性能。在最近的Hugging Face评估中,其在大规模推理方面的表现,包括在运行Stable Diffusion(另一个用于从文本生成图像的最先进生成式AI模型之一)、70亿以及1760亿参数BLOOMz模型时,在行业内保持领先。
在Stable Diffusion训练上,Gaudi2展示了从1张卡至64张卡近线性99%的扩展性。此外,MLCommons刚刚公布的MLPerf训练3.0结果,亦验证了Gaudi2处理器在1750亿参数的GPT-3模型上,从256个加速器到384个加速器可实现令人印象深刻的接近线性的95%扩展效果。
英伟达的GPU现在不光卡的价格暴涨,关键是一卡难求。从Gaudi2的表现看,我们有理由相信Gaudi2会成为AI服务器的新选择,而GPU不再是唯一首选。
而具体到中国市场,由于不管是NVIDIA还是AMD都是为中国客户提供“特供”版本的芯片,所以不缩水的Gaudi2有望成为中国企业的新选择,这无疑为市场增加了新的变数。
02 坚冰松动,中美的算力博弈
众所周知,中美之间在半导体领域展开博弈。NVIDIA与AMD的芯片在中国出货受限,但是这次Gaudi2却可以在国内发布上市。而且浪潮集团被美国列入实体名单,而出乎意外的是浪潮信息居然可以发布基于Gaudi2的服务器产品。
这些说明了什么?我们只能说这背后英特尔是做足了工作的,我觉得话只能说到这里。我这样的猜想与英特尔的相关人员沟通后也得到了确认。
Gaudi2作为AI加速器在中国销售是符合监管规定,特别是美国。除了商业考虑,这次Gaudi2能够在中国市场发布,应该是得到了高层的默认,这是不是预示着中美在科技领域的坚冰有松动的迹象了?这不好说。但是至少说,Gaudi2在中国上市是利好消息。
03 敏感时刻为什么选择浪潮信息?
英特尔选择浪潮信息首发相关的服务器产品,也肯定是经过深思熟虑的,就像前面说的,浪潮信息的母公司浪潮集团处于敏感时刻,而英特尔在AI服务器方面还是一如既往选择浪潮信息,肯定是看到了浪潮信息的过人之处。
这里要重点说的是浪潮信息,据IDC数据报告显示,浪潮信息在中国AI服务器市场份额连续六年保持第一。
我想这也是英特尔选择与浪潮信息推出Gaudi2服务器产品的重要选择,要知道浪潮信息在服务器市场的产品工程能力和市场拓展能力那是业界有目共睹的。浪潮信息在服务器市场的表现那可是可圈可点,所以Gaudi2选择浪潮的这样合作伙伴进行国内市场的拓展,还是非常值得期待的。
比如浪潮信息这次推出的NF5698G7服务器在6U空间支持8颗基于开放加速模组OAM高速互联的Gaudi2 AI加速器,每颗Gaudi2芯片配置96GB HBM高速内存,共提供2.1Tbps的P2P互联带宽,支持全互联拓扑,满足大模型训练张量并行的通信需求;搭载2颗第四代至强处理器,支持AMX/DSA等AI加速引擎。
NF5698G7基于全球开放计算OCP开放加速器规范OAM/UBB进行产品设计,支持PyTorch、TensorFlow等主流AI框架和Megatron/DeepSpeed等流行开发工具,为生成式AI提供成熟、高性价比的开放生态产品方案。
除了Gaudi2,浪潮信息与众多芯片厂商有广泛的合作,比如英特尔、AMD、Arm、Ampere、NVIDIA、国内的AI创新公司等。这其实也是浪潮信息在AI服务器方面的能力体现。
04 依靠伙伴,英特尔打个AI翻身仗
Gaudi2是英特尔布局AI的重要棋子。或许借助Gaudi2,英特尔可以在AI领域打个翻身仗。至于这样的论断是否成立,这要看Gaudi2后面的市场表现。
在AI市场,英特尔并没有占据太大的优势。虽然英特尔一直在为至强处理器打“AI补丁”,但是相比GPU的强势地位,效果并不明显。比如第四代英特尔至强可扩展处理器继承了英特尔AMX加速引擎,可以更好地运行AI工作负载。
创新的硬件必不可少,软件的生态建设同样重要。就像NVIDIA在AI市场,除了GPU,CUDA是其构建护城河的重要因素。
对于英特尔也是如此,英特尔构建了从云到端产品组合,同时提供Geti商用软件平台和OpenVINO开源深度学习平台等。
此外,英特尔的一大优势是开放生态,秉持赋能全栈软件的开放生态战略,几十年来持续投入从硬件到软件各个层面的开源开放,建立了充满活力的生态系统,其传承自x86架构的庞大合作伙伴体系可以为英特尔带来巨大的能力。英特尔在Gaudi2推出后,新华三、超聚变等英特尔的铁杆伙伴也讲推出相应的服务器产品。
在NVIDIA和AMD芯片无法供应中国市场的情况下,英特尔联合合作伙伴推动Gaudi2 AI加速器的AI服务器,无疑是具有想象空间的。
结论
大模型驱动的AIGC对于算力需求是巨大的,这直接带动了AI基础设施的发展,而AI服务器更是成为抢手货。这次Gaudi2在国内发布,并由浪潮信息进行相关服务器的销售,无疑为当前火爆的AI服务器市场带来新的变化。
如今是一个多元化的时代,不光AI芯片,还有大模型乃至AI框架,呈现出百花齐放的态势。Gaudi2在中国市场如果表现出色,无疑会给整个市场带来变革,这是中国市场对于AI算力的强大需求所决定的。
本文章选自《数字化转型方略》杂志,阅读更多杂志内容,请扫描下方二维码