记忆层规模 关键字列表
突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型

突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型

目前,Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。“记忆层”提出了新的高效查询机制替代了传统的查询方法,通过比较查询键与两个较小集合中的键,可以快速找到最相关的键,而无需遍历模型的整个记忆层。