xAI 公司发布了新一代大语言模型 Grok-3,具备模拟人类思维的推理能力。该模型比前代产品计算能力提升 10-15 倍,可在数学、科学和编程领域超越竞争对手。Grok-3 包含大型复杂模型和小型快速模型,能进行逐步推理并提供深度搜索功能。未来还将推出语音交互模式。
2023年和2024年,不少初创公司都推出了令人印象深刻的AI服务,但很快就被微软和谷歌等能够直接触达客户的巨头所覆盖。以Jasper.ai为例,这是一款曾经备受推崇、用于编写文本的AI工具。
上海AI实验室的研究团队创新性地设计了元动作思考范式来引导模型的搜索空间,使模型更高效地习得和产生多样化的推理策略组合;基于通专融合的方式进行数据合成,并通过构建大规模沙盒环境获取反馈,在不依赖o1这类已有强推理模型的情况下,实现高质量思维链的独立构建,并大幅提升模型的复杂任务处理性能。
Llama3.1 版本模型提供了更好的推理能力、更大的 128K token 上下文窗口,并改进了对8种语言的支持。