预训练模型文章列表第1页-至顶网频道 - 至顶网

/

预训练模型关键字列表

突破算力限制！Meta开源“记忆层”，重塑Transformer架构大模型

大模型

预训练模型

记忆层规模

2025-01-06

突破算力限制！Meta开源“记忆层”，重塑Transformer架构大模型

目前，Transformer架构的预训练大模型在存储、查询数据时，随着参数的变大对算力的需求呈指数级增长。“记忆层”提出了新的高效查询机制替代了传统的查询方法，通过比较查询键与两个较小集合中的键，可以快速找到最相关的键，而无需遍历模型的整个记忆层。

NLP

阿里云

预训练模型

2022-04-27

阿里云机器学习PAI开源中文NLP算法框架EasyNLP，助力NLP大模型落地

EasyNLP是PAI算法团队基于PyTorch开发的易用且丰富的中文NLP算法框架，支持常用的中文预训练模型和大模型落地技术，并且提供了从训练到部署的一站式NLP开发体验。

白皮书

更多

数字化转型方略

更多

杨晓东眼中的AI"中国速度"，希捷如何跑赢这场数据竞赛？

当ERP长出AI神经，胜负手在于业务扎根

CES 2025：沉浸AI

大模型落地，你还缺怎样的“工具箱”？

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

友情链接

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn

网上有害信息举报专区：https://www.12377.cn

安全联盟认证