这次”料“更多 NVIDIA黄仁勋的GTC 2021”厨房“发布会再度上演-至顶网

这次”料“更多 NVIDIA黄仁勋的GTC 2021”厨房“发布会再度上演

文/李祥敬

转眼今年的GTC大会再次来临，黄仁勋的”厨房“发布会再度上演。虽然场景没有变，但是发布的内容确实”料“更多，涉及了AI、汽车、机器人、5G、实时图形、协作和数据中心等。

如果大家有印象的话，去年NVIDIA GTC大会，NVIDIA首席执行官黄仁勋在自家厨房进行大会演讲应该是无出其右了。转眼今年的GTC大会再次来临，黄仁勋的”厨房“发布会再度上演。虽然场景没有变，但是发布的内容确实”料“更多，涉及了AI、汽车、机器人、5G、实时图形、协作和数据中心等。

黄仁勋说，NVIDIA会一如既往在CPU、DPU和GPU方面大力投入，并使其能够用于研究人员和企业的全新数据中心级计算解决方案。硬件只是NVIDIA的一方面，作为一家软件公司，NVIDIA提供一系列基于NVIDIA AI，以及用于仿真、协作和自主机器训练的软件。

组合拳——CPU、DPU和GPU

我们知道GPU是NVIDIA的”主业“，但是凭借一系列的收购，NVIDIA也在向其他XPU拓展，在本次大会上，NVIDIA推出了CPU、DPU和GPU的”组合拳“，帮助用户打造完全可编程的单一AI计算单元。

CPU与GPU一直是好朋友，NVIDIA GPU作为加速计算组件，其实扮演了与CPU一起工作的角色。如今NVIDIA也推出了自己的首款数据中心CPU——Grace，Grace是一款高度专用型处理器，主要面向大型数据密集型HPC和AI应用。

Grace是高度专业化的处理器，工作负载面向例如训练具有超过1万亿个参数的新一代NLP模型等。当与NVIDIA GPU紧密耦合时，搭载Grace CPU的系统速度比如今基于NVIDIA DGX 打造的最先进的系统（在x86 CPU上运行）快10倍。从这样的成绩可以看出，NVIDIA推出自有CPU芯片意在更好地实现与GPU的协同处理，让性能表现更优秀。

Grace基于第四代 NVIDIA NVLink互联技术，支持LPDDR5x内存子系统，并可以得到NVIDIA HPC软件开发套件以及全套CUDA和CUDA-X库的支持。据悉，瑞士国家超级计算中心将构建一台名为Alps的超级计算机。这台计算机将使用Grace和NVIDIA下一代GPU。美国能源部下属的洛斯阿拉莫斯国家实验室也将在2023年推出一台基于Grace的超级计算机。

除了自研的CPU，凭借收购而来的Arm，也让NVIDIA在CPU方面有了更多的话语权。在云计算、企业和边缘数据中心、超级计算、PC等其他市场中，Arm也开始崭露头角。黄仁勋也宣布与多家重要的Arm合作伙伴展开合作，包括云计算领域的AWS、科学和云计算领域的Ampere Computing、超融合边缘服务器领域的Marvel、以及将打造Chrome OS和Linux PC SDK与参考系统的联发科。

DPU（Data Processing Unit，数据处理单元）是NVIDIA在收购Mellanox推出的创新产品，其可实现具有突破性的网络、存储和安全性能。作为业内首款400G以太网和NDR InfiniBand DPU，BlueField-3具有出色的网络性能。相比上一代产品，它具有10倍加速计算能力、16个Arm A78 CPU核，和4倍的加密速度。BlueField-3也是首款支持第五代PCIe总线并提供数据中心时间同步加速的DPU。

此外，BlueField-3利用NVIDIA DOCA（集数据中心于芯片的架构）软件开发包的优势，为开发者提供一个完整、开放的软件平台，开发在BlueField DPU上开发软件定义和硬件加速的网络、存储、安全和管理等应用。目前服务器制造商戴尔、浪潮、联想和超微正在将BlueField DPU集成到他们的系统中，云服务供应商也在使用BlueField DPU来加速他们的业务，如百度、京东和UCloud。

黄仁勋还提到了NVIDIA的AI-on-5G计算平台，该平台充分利用 NVIDIA Aerial软件开发套件与NVIDIA BlueField-2 A100——一种包含NVIDIA “5T for 5G”解决方案的、集成GPU和DPU的融合型卡，创建高性能5G RAN和AI应用。富士通、Google Cloud、Mavenir、Radisys和Wind River等合作伙伴都在开发适用于NVIDIA AI-on-5G平台的解决方案。

不管是CPU还是DPU、GPU，很明显，NVIDIA正在将自己业务边界不断延展，也就是不再局限于以GPU为中心，而是以计算为核心，覆盖多样化的计算工作负载。随之而来的就是客户选择的灵活性，同时整个计算芯片市场也将迎来新的格局。

NVIDIA是软件平台公司

除了更富的硬件产品，NVIDIA在软件方面的布局也业界有目共睹的，比如CUDA。所以，我们通常会在GTC大会上看到一系列的软件更新。

在本届大会上，NVIDIA发布了用于训练Transformers的框架—— NVIDIA Megatron。Transformers在自然语言处理领域具有至关重要的位置，其在生成文档摘要、将电子邮件中的短语补充完整、对测验进行评分、生成体育赛事现场评论、甚至生成代码等领域有着广泛的应用。

此外，NVIDIA还发布了用于计算药物研发加速库Clara Discovery的一些新模型，以及与Schrodinger的合作；用于对话式AI的NVIDIA Jarvis已经可用，其能够实现语音识别、语言理解、翻译和表达性语音；加快推荐系统的NVIDIA Merlin现可通过NGC（NVIDIA的深度学习框架容器目录）获取。

为帮助客户将自身专业知识应用于AI领域，黄仁勋发布了NVIDIA TAO，其可以运用客户和合作伙伴的数据，对NVIDIA预训练模型进行微调和适配，同时保护数据隐私。

量子计算也是当下的热点，NVIDIA cuQuantum能够为量子电路模拟器提供加速，以助力研究人员设计出更完善的量子计算机。

为了保障现代化数据中心的安全，黄仁勋发布了NVIDIA Morpheus数据中心安全平台，其基于NVIDIA AI、NVIDIA BlueField、Net-Q网络遥测软件和EGX而构建，能够对完整的数据包进行实时检测。

开箱即用的产品

有了硬件又有了软件，NVIDIA为用户打造更加开箱即用的解决方案，其中包括专为工作组打造的“便携式AI数据中心”——NVIDIA DGX Station，以及NVIDIA专为密集型AI研发打造的AI数据中心产品——NVIDIA DGX SuperPod。

全新DGX Station 320G借助320GB超快速HBM2e连接至4个NVIDIA A100 GPU，内存带宽达到每秒8TB。然而，仅需将其插入普通的壁装电源插座即可使用，耗电量只有1500瓦。此外，NVIDIA还发布了一种适用于NVIDIA DGX Station A100的订阅服务。DGX Station A100是世界上唯一支持 NVIDIA多实例GPU技术的适用于办公室场景的工作组服务器设备。

DGX SuperPOD是配备20套或以上NVIDIA DGX A100系统和NVIDIA InfiniBand HDR网络的AI超级计算机。DGX SuperPOD使用全新80GB NVIDIA A100，将其HBM2e内存提升至90TB。目前它已经升级至采用NVIDIA BlueField-2，且NVIDIA如今还为该产品提供配套的NVIDIA Base Command DGX管理和编排工具。

为进一步实现AI民主化，黄仁勋发布了来自顶尖制造商的新系列NVIDIA认证系统，即大容量企业级服务器。它们现在已通过认证，可运行NVIDIA AI Enterprise软件套件，该套件得到了全球应用最广泛的计算虚拟化平台——VMware vSphere 7的独家认证。

NVIDIA于今日发布多款新系统，以扩大NVIDIA认证服务器生态系统。这些新系统配备用于主流AI和数据分析的NVIDIA A30 GPU，以及用于AI图形、虚拟工作站以及混合计算和图形工作负载的NVIDIA A10 GPU。

最后，NVIDIA推出推理服务器NVIDIA Triton，它可以从进入客户EGX服务器或云实例的连续数据流中获取洞察。这包括任何在cuDNN上运行的AI模型，也就是几乎所有的AI ，包括来自TensorFlow、Pytorch、ONNX、OpenVINO、TensorRT等的任何框架。

其他——仿真协作与自动驾驶

在大会上，NVIDIA还公布了其他产品更新，比如NVIDIA Omniverse，其旨在创建共享虚拟3D世界，特点包括：可以扩展至多个GPU、具有高物理精度、能够充分运用RTX实时路径追踪和DLSS、可以使用NVIDIA MDL模拟材料、可以使用NVIDIA PhysX模拟物理学并且与NVIDIA AI完全集成。

3D制作团队通常规模庞大、应用技术繁多且所在地点分散，NVIDIA Omniverse Enterprise使其能够在复杂的项目中开展无缝协作。设计师、艺术家和审核人员可以在任何地点、任何设备上进行线上实时协作，而不需要召开面对面会议或就大量文件进行交流和迭代。

Omniverse Enterprise是一个全新的平台，它包含NVIDIA Omniverse Nucleus服务器（管理客户端之间的共享数据库）和NVIDIA Omniverse Connectors（业内领先的设计应用程序插件）。

它还包含两个终端用户应用：NVIDIA Omniverse Create，可加速场景构成，用户可通过实时互动来装配、点亮、模拟和渲染场景；NVIDIA Omniverse View，支持无缝设计协作，并能通过逼真的渲染技术实现建筑和工程项目的可视化。该平台还包含NVIDIA RTX Virtual Workstation（vWS）软件，它能让协作者在任何地方自由地运行各类图形密集型3D应用。

Omniverse Enterprise经测试和优化后，适合专业人员在NVIDIA RTX笔记本电脑及台式电脑上运行，或在NVIDIA EGX平台上的NVIDIA认证系统上运行。因此，从使用本地台式电脑、笔记本电脑的小型工作组，到使用各种设备访问数据中心的全球分布式团队，任何规模的组织都可以部署该工具。

自动驾驶汽车领域是“机器学习和机器人技术所面对的最严峻的挑战之一，NVIDIA构建模块化的端到端解决方案，其自动驾驶汽车计算系统级芯片——NVIDIA DRIVE Orin将于2022年投产。与此同时，NVIDIA新一代车载系统级芯片NVIDIA DRIVE Atlan正式发布，其集NVIDIA在AI、汽车、机器人、安全和BlueField安全数据中心领域的所有技术之大成，为汽车带来真正的数据中心。Atlan可以达到每秒超过1000万亿次（TOPS）运算次数，致力于应用到2025年的车型。

NVIDIA第八代Hyperion汽车平台也同期发布，包括参考传感器、自动驾驶汽车和中央计算机、3D地面真实数据记录仪、网络以及所有必要的软件。在软件方面，正如Omniverse能够构建汽车生产工厂的数字孪生一样，DRIVE Sim也可用于创建自动驾驶汽车的数字孪生，并将其用于自动驾驶汽车的开发。

总结划重点

”厨房“发布会全程看下来，应该说看点颇多。但是总结一下，无外乎以下几点：

如今是一家能够提供GPU、CPU和DPU三种芯片的公司。

NVIDIA是一家软件平台公司。

NVIDIA是一家AI公司，提供Megatron、Jarvis、Merlin、Maxine、Isaac、Metropolis、Clara和DRIVE、以及各种可使用TAO进行定制化的预训练模型。

NVIDIA正在通过用于研究的DGX、用于云的HGX、用于企业级和5G边缘的EGX以及用于机器人技术的AGX来扩展AI。

总之，NVIDIA正在变得越来越”重“，基于已有产品，其业务领域不断扩展。我们对于NVIDIA的定位和认知也正在刷新。

本文章选自《数字化转型方略》杂志，阅读更多杂志内容，请扫描下方二维码