开源模型 关键字列表
这款开源文本转语音模型只需几秒音频就能克隆你的声音

这款开源文本转语音模型只需几秒音频就能克隆你的声音

人工智能初创公司Zyphra推出了两款开源文本转语音模型,声称只需5秒样本音频就能克隆声音。测试显示,使用不到30秒的录音即可生成逼真效果。这项技术虽然存在滥用风险,但也有积极应用前景,如帮助失声者重获声音。该模型采用开源许可证发布,为语音合成领域带来新的可能。

书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型

书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型

上海人工智能实验室对书生大模型进行重要版本升级,书生·浦语3.0(InternLM3)通过精炼数据框架,大幅提升了数据效率,并实现思维密度的跃升。仅使用4T训练数据的InternLM3-8B-Instruct,其综合性能超过了同量级开源模型,节约训练成本75%以上;同时,书生·浦语3.0首次在通用模型中实现了常规对话与深度思考能力融合,可应对更多真实使用场景。

强推理模型书生InternThinker开放体验:自主生成高智力密度数据、具备元动作思考能力

强推理模型书生InternThinker开放体验:自主生成高智力密度数据、具备元动作思考能力

上海AI实验室的研究团队创新性地设计了元动作思考范式来引导模型的搜索空间,使模型更高效地习得和产生多样化的推理策略组合;基于通专融合的方式进行数据合成,并通过构建大规模沙盒环境获取反馈,在不依赖o1这类已有强推理模型的情况下,实现高质量思维链的独立构建,并大幅提升模型的复杂任务处理性能。

国产模型炸裂登场,国外赞不绝口!OpenAI-o1级性能,免费使用

国产模型炸裂登场,国外赞不绝口!OpenAI-o1级性能,免费使用

这个模型的最大特色便是深度思维链推理,尤其是在数学、代码以及各种复杂推理任务上,可以生成数万字的推理流程,让用户深度了解模型生成内容的全过程。