大型模型文章列表第1页-至顶网频道 - 至顶网

/

大型模型关键字列表

阿里提出LLaVA-MoD架构！利用MOE技术让小模型也能大显身手！

大型模型

多模态

知识蒸馏

2024-10-30

阿里提出LLaVA-MoD架构！利用MOE技术让小模型也能大显身手！

多模态大型语言模型（MLLM）通过在大型语言模型（LLM）中集成视觉编码器，在多模态任务中取得了有希望的结果。然而，大型模型的大小和广泛的训练数据带来了显著的计算挑战。例如，LLaVA-NeXT的最大版本使用了Qwen-1.5-110B，并且使用128个H800 GPU训练了18小时。

白皮书

更多

数字化转型方略

更多

CES 2025：沉浸AI

大模型落地，你还缺怎样的“工具箱”？

2024 AI创新者大会

智算“筑基”AI未来

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

友情链接

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn

网上有害信息举报专区：https://www.12377.cn

安全联盟认证