内存优化 关键字列表
Kioxia 开源 AiSAQ 技术以减少 RAG 中的 DRAM 使用量

Kioxia 开源 AiSAQ 技术以减少 RAG 中的 DRAM 使用量

Kioxia 发布开源 AiSAQ 技术,旨在降低生成式 AI 系统中的 DRAM 需求。该技术为 SSD 优化的近似最近邻搜索算法,可直接在 SSD 上搜索,无需将索引数据放入 DRAM,从而实现检索增强生成 (RAG) 的可扩展性能。这一创新有望大幅提升大规模 RAG 应用的性能范围。

Microsoft 提出管理保留内存技术以应对 AI 工作负载

Microsoft 提出管理保留内存技术以应对 AI 工作负载

微软研究人员提出了一种新的内存技术——管理保留内存 (MRM),旨在解决 AI 基础模型工作负载的存储和 IO 问题。MRM 具有短期数据持久性,可优化 AI 推理性能,同时降低能耗和成本。这一创新概念有望填补现有内存-存储层级中的空白,为 AI 时代的内存技术发展开辟新方向。