DeepSeek公司最近发布的开源推理AI模型R1在开发者和研究人员中迅速流行,引发科技股大幅抛售。R1的出现以及同期宣布的Stargate项目,凸显了AI投资和商业模式的深度不确定性。这些事件引发了关于开源vs闭源AI系统、硬件vs软件优化、以及AI公司盈利模式等多方面的争议和思考。
Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。
DeepSeek 发布了新的大语言模型系列 R1,专为推理任务优化。该系列包括两个主要模型 R1 和 R1-Zero,采用混合专家架构,拥有 6710 亿参数。R1 在多项推理基准测试中超越了 OpenAI 的 o1 模型,而 R1-Zero 则代表了机器学习研究的重大进展。DeepSeek 已在 Hugging Face 上开源了这些模型的源代码。
在 CES 2024 上,Nvidia 发布了名为 Cosmos 的生成式 AI 技术,旨在加速物理 AI 开发。该技术通过生成准确的物理感知视频来模拟虚拟环境,可大幅减少机器人 AI 训练所需的资源。Cosmos 与 Nvidia 的 Omniverse 数字孪生平台配合使用,为机器人和自动驾驶领域提供了全栈解决方案,有望推动 Nvidia 在这些领域的业务快速发展。