Google宣布第七代张量处理单元(TPU)芯片即将向云客户开放租用,可提供256或9216芯片的集群。新一代TPU在内存带宽、算力和能效方面都有显著提升,专为大语言模型推理设计,每个芯片具有192GB高带宽内存。Google称9216芯片集群的AI算力可达42.5 exaFLOPS,远超现有超级计算机。
人工智能(AI)和机器学习(ML)技术的飞速发展,正深刻地改变着我们的生活和工作方式。为了满足日益复杂的 AI 应用对计算能力的迫切需求,半导体行业正经历着一场前所未有的变革。传统的 CPU 虽然在通用计算方面表现出色,但在面对大规模并行计算任务时,其性能瓶颈日益凸显。