训练策略文章列表第1页-至顶网频道 - 至顶网

/

训练策略关键字列表

NJU联合腾讯提出VITA-1.5！GPT-4o级别的实时视觉语音交互框架！

语音转语音

训练策略

多模态大型语言模型

2025-01-09

NJU联合腾讯提出VITA-1.5！GPT-4o级别的实时视觉语音交互框架！

本文提出了一种精心设计的分阶段训练方法，逐步训练大型语言模型以理解视觉和语音信息，最终实现流畅的视觉和语音交互。我们的方法不仅保留了强大的视听能力，而且无需单独的自适应语音识别（ASR）和文本到语音（TTS）模块，就能实现高效的语音转语音对话能力，显著加快了多模态端到端的响应速度。

DeepSeek-VL：深度求索的多模态大模型

开源

DeepSeekVL

多模态模型

训练策略

2024-03-12

DeepSeek-VL：深度求索的多模态大模型

DeepSeekVL是一款开源多模态模型，通过对训练数据、模型架构和训练策略的联合拓展，构建了7B与1.3B规模的强大模型。相关资源可通过论文链接、模型下载页面和GitHub主页获取。

白皮书

更多

数字化转型方略

更多

杨晓东眼中的AI"中国速度"，希捷如何跑赢这场数据竞赛？

当ERP长出AI神经，胜负手在于业务扎根

CES 2025：沉浸AI

大模型落地，你还缺怎样的“工具箱”？

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

友情链接

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn

网上有害信息举报专区：https://www.12377.cn

安全联盟认证