性能优化文章列表第1页-至顶网频道 - 至顶网

/

性能优化关键字列表

Google 推出第七代 Ironwood TPU 芯片，借助 AI 进行性能对比

人工智能

张量处理器

性能优化

2025-04-10

Google 推出第七代 Ironwood TPU 芯片，借助 AI 进行性能对比

Google宣布第七代张量处理单元(TPU)芯片即将向云客户开放租用，可提供256或9216芯片的集群。新一代TPU在内存带宽、算力和能效方面都有显著提升，专为大语言模型推理设计，每个芯片具有192GB高带宽内存。Google称9216芯片集群的AI算力可达42.5 exaFLOPS，远超现有超级计算机。

联发科发布新芯片，使 Chromebook 具备 AI 助手运行能力

人工智能

芯片架构

性能优化

2025-04-03

联发科发布新芯片，使 Chromebook 具备 AI 助手运行能力

MediaTek 推出新一代 Kompanio Ultra 芯片，专为 Chromebook 设计。这款芯片不仅提升了性能和电池续航，更重要的是增强了生成式 AI 能力，使得价格亲民的 ChromeOS 笔记本电脑也能运行先进的 AI 助手。MediaTek 与 Google 密切合作，确保新芯片能充分发挥 Chromebook Plus 设备的下一代 AI 功能。

Nvidia 新推出的工具让本地 AI 计算变得轻而易举

人工智能

本地计算

性能优化

2025-03-28

Nvidia 新推出的工具让本地 AI 计算变得轻而易举

Nvidia 推出全新 AI 工具套件 NIM 微服务，让拥有 RTX 显卡的用户能够在本地轻松运行 AI 模型。这套工具支持文本、图像和代码生成等多种功能，不仅可以节省长期使用成本，还能确保数据安全性。该举措体现了 AI 本地化运算的发展趋势，也展示了 Nvidia 在 AI 领域的领导地位。

AMD 发布第五代 Epyc 嵌入式处理器，面向网络、存储和工业边缘领域

高性能计算

嵌入式系统

性能优化

2025-03-12

AMD 发布第五代 Epyc 嵌入式处理器，面向网络、存储和工业边缘领域

AMD 发布第五代 Epyc 嵌入式处理器，采用 Zen 5 架构，专为网络、存储和工业边缘计算优化。新处理器在性能、能效和嵌入式特性方面均有提升，可支持高达 192 核心，内存容量达 6TB，并提供 7 年产品制造支持。多家行业合作伙伴已开始采用这一新产品。

Meta 通过 eBPF 技术实现服务器计算效率提升 20%

分布式系统

性能优化

内核技术

2025-03-10

Meta 通过 eBPF 技术实现服务器计算效率提升 20%

Meta公司通过使用基于eBPF的Strobelight性能分析套件，成功将其主要服务的CPU使用率降低20%。这一成果不仅大幅减少了服务器需求，还展示了eBPF在系统优化和效率提升方面的巨大潜力。eBPF作为一种创新技术，正在revolutionizing操作系统内核级编程，为企业带来显著的性能提升和成本节约。

M3 Ultra GPU 性能对比 M4 Max：究竟快多少？

芯片性能

GPU 计算

性能优化

2025-03-10

M3 Ultra GPU 性能对比 M4 Max：究竟快多少？

Apple 最新推出的 M3 Ultra 芯片 GPU 性能表现出色，比 M4 Max 快 38%，比上一代 M2 Ultra 快 16%。在 Metal 测试中得分高达 259668。CPU 性能方面，M3 Ultra 多核性能小幅领先 M4 Max 8%。新款 Mac Studio 已开启预订，将于 3 月 12 日正式发售。

OpenAI 的 GPT-4.5 AI 模型向更多 ChatGPT 用户开放

人工智能

大语言模型

性能优化

2025-03-06

OpenAI 的 GPT-4.5 AI 模型向更多 ChatGPT 用户开放

OpenAI 已开始向其 ChatGPT Plus 用户推出最新的 AI 模型 GPT-4.5。OpenAI 在 X 平台上发布的一系列帖子中表示，此次推出将持续“1-3 天”，并预计速率限制会有所变化。

PEAK:AIO AI 数据服务器性能峰值达到 120 GBps

人工智能

存储技术

性能优化

2025-03-06

PEAK:AIO AI 数据服务器性能峰值达到 120 GBps

PEAK:AIO推出了一款新的2RU 1.5 PB AI 数据服务器产品，使用戴尔硬件，数据传输速率达到120 GBps。PEAK:AIO是一家专注于人工智能的英国存储初创公司，提供基于第三方硬件的软件定义存储，密切管理和控制以降低延迟并提高吞吐量。其2RU服务器已为中型GPU集群提供40 GBps的传输速率，现可实现三倍的速度。

ChatGPT 4.5 震撼发布：更大、更智能，但也更贵

人工智能

大语言模型

性能优化

2025-03-05

ChatGPT 4.5 震撼发布：更大、更智能，但也更贵

OpenAI 最近推出了 GPT-4.5，这款新模型在准确性测试中表现优于之前的版本，能够更好地理解细微差别。尽管面临 GPU 短缺的挑战，OpenAI 仍然致力于将这一模型推向市场，并计划在未来推出更先进的推理能力模型。

新型 AI 文本扩散模型突破速度瓶颈，从噪声中提取文字

人工智能

自然语言处理

性能优化

2025-02-28

新型 AI 文本扩散模型突破速度瓶颈，从噪声中提取文字

Inception Labs 于周四发布了 Mercury Coder，这是一种新的 AI 语言模型，利用扩散技术比传统模型更快地生成文本。与逐字生成文本的传统模型（如 ChatGPT）不同，基于扩散的模型（如 Mercury）能够同时生成完整的响应，并将其从最初的遮蔽状态逐步精炼为连贯的文本。

Inception 从秘密研发中推出新型 AI 模型

生成式 AI

扩散模型

性能优化

2025-02-27

Inception 从秘密研发中推出新型 AI 模型

Inception是一家位于帕洛阿尔托的新公司，由斯坦福大学计算机科学教授Stefano Ermon创立，声称开发了一种基于“扩散”技术的新型AI模型，称为扩散基础的大型语言模型（DLM）。目前备受关注的生成AI模型大致可分为两类：大型语言模型（LLMs）和扩散模型。Inception的模型结合了传统LLMs的功能，如代码生成和问答，但性能显著更快，计算成本更低。

Qualcomm 和诺基亚贝尔实验室展示多供应商 AI 模型如何在无线网络中协同工作

人工智能

无线通信

性能优化

2025-02-27

Qualcomm 和诺基亚贝尔实验室展示多供应商 AI 模型如何在无线网络中协同工作

高通和诺基亚贝尔实验室成功展示了多厂商AI模型在无线网络中的互操作性。通过序列学习技术，他们实现了编码器和解码器模型的无缝协作，提高了网络效率和用户体验。这项突破性成果为AI在无线通信领域的应用开辟了新的可能性，有望显著提升网络容量、可靠性和能源效率。

GenAI 时代的计算引擎策略

人工智能

服务器架构

性能优化

2025-02-26

GenAI 时代的计算引擎策略

随着生成式人工智能和 GPU 加速 AI 训练与推理的兴起，数据中心仍需关注 CPU 的重要性。现代化 CPU 不仅可以提升传统工作负载性能，还能帮助企业为昂贵的 AI 基础设施投资节省成本。高性能 CPU 可以显著提升 AI 推理和训练效率，同时在某些场景下直接运行 AI 算法。企业应考虑采用单插槽服务器等创新方案，以优化数据中心架构。

英特尔推出搭载性能核心的至强 6 处理器，AI 处理性能提升两倍

人工智能

处理器架构

性能优化

2025-02-25

英特尔推出搭载性能核心的至强 6 处理器，AI 处理性能提升两倍

Intel 发布新一代 Xeon 6 处理器，采用性能核心设计，大幅提升数据中心工作负载性能，AI 处理性能最高提升 2 倍。新处理器还集成了 vRAN Boost 技术，可将无线接入网络处理能力提升至 2.4 倍。此次发布对 Intel 重塑市场地位至关重要，公司希望通过技术创新和美国芯片法案支持，重振昔日辉煌。

Voltron Data 与埃森哲合作，解决 AI 领域最棘手的难题之一

人工智能

GPU 加速计算

性能优化

2025-02-21

Voltron Data 与埃森哲合作，解决 AI 领域最棘手的难题之一

Voltron Data 与埃森哲建立战略合作，推出 GPU 加速分析引擎 Theseus，旨在解决 AI 数据处理的瓶颈问题。该技术能以更快速度处理海量数据，显著提升 AI 项目效率，降低基础设施成本。这一合作将帮助企业应对 AI 带来的数据处理挑战，为金融、零售等行业带来巨大价值。

DDN 发布 Infinia 2.0 对象存储，加速 AI 数据流水线

人工智能

对象存储

性能优化

2025-02-21

DDN 发布 Infinia 2.0 对象存储，加速 AI 数据流水线

DDN 发布新一代 Infinia 2.0 对象存储系统，专为 AI 训练和推理设计。该系统号称可将 AI 数据加速提升 100 倍，数据中心和云计算成本效率提高 10 倍。Infinia 2.0 采用键值对架构，集成多项先进技术，旨在消除 AI 工作负载瓶颈，加速数据流，并实现无缝扩展。

Micron 推出迄今最快的 PCIe 5.0 OEM 客户端 SSD

人工智能

存储技术

性能优化

2025-02-19

Micron 推出迄今最快的 PCIe 5.0 OEM 客户端 SSD

美光发布新一代PCIe 5.0 SSD - 4600系列,性能翻倍,主打AI PC、游戏玩家和专业用户市场。采用276层TLC NAND和PCIe 5.0接口,读写速度分别达14.5GB/s和12GB/s,随机读写IOPS达210万,延迟大幅降低。搭载多项安全功能,适用于数据密集型AI应用场景。

高通瞄准游戏市场推出骁龙 6 代 4 移动芯片

处理器技术

移动计算

性能优化

2025-02-18

高通瞄准游戏市场推出骁龙 6 代 4 移动芯片

高通推出骁龙 6 Gen 4 移动处理器平台，旨在提升游戏和生产力性能。该平台具备强大性能、长续航和超快 5G 连接，首次支持 Gen AI。预计多家知名手机厂商将在未来几个月推出搭载该芯片的智能手机，为中端市场带来全面升级。

HPE Alletra X10000 重新定义横向扩展存储硬件

存储系统

分布式架构

性能优化

2025-02-14

HPE Alletra X10000 重新定义横向扩展存储硬件

HPE 的 Alletra MP X10000 对象存储系统代表了一种新型的可扩展存储硬件，采用了 VAST Data 首创的解耦共享一切（DASE）架构。HPE 的全球技术与战略架构师 Dimitris Krekoukias 在博客中详细列出了其主要特性，并解释了这些特性为何被纳入设计中。

Nvidia 表示 Spectrum-X 自适应路由可提升存储网络带宽

人工智能

网络架构

性能优化

2025-02-06

Nvidia 表示 Spectrum-X 自适应路由可提升存储网络带宽

Nvidia 推出 Spectrum-X 以太网网络技术，结合 InfiniBand 自适应路由功能，可显著提升存储网络性能。测试表明，在大规模 AI 训练和推理场景中，该技术能将存储网络读取带宽提高近 50%，有效缓解网络拥塞，加速 AI 工作负载。

1
2

白皮书

更多

数字化转型方略

更多

当ERP长出AI神经，胜负手在于业务扎根

CES 2025：沉浸AI

大模型落地，你还缺怎样的“工具箱”？

2024 AI创新者大会

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

友情链接

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn

网上有害信息举报专区：https://www.12377.cn

安全联盟认证