OpenAI 推出代号"Orion"的 GPT-4.5 模型,这是公司迄今最大规模的 AI 模型。GPT-4.5 在计算能力和训练数据方面均超越以往版本,但 OpenAI 并不认为它是前沿模型。该模型将逐步向付费用户开放,但运营成本高昂。尽管在某些基准测试中表现出色,但 GPT-4.5 在部分任务上仍落后于其他 AI 推理模型,凸显了传统预训练方法的局限性。
IBM 公司今天推出了新的 Granite AI 模型系列,具备实验性推理、视觉和预测能力,旨在在企业人工智能市场中占据一席之地。所有 Granite 模型均在 Apache 2.0 开源许可证下开放,现已在 Hugging Face 和 IBM watson.ai 等平台上提供。新系列的旗舰产品是 Granite 3.2 Instruct 变体,支持文本处理,能够执行摘要、问题解决和代码生成等任务,并设计为遵循指令。
埃隆·马斯克的人工智能公司 xAI 推出了备受期待的旗舰 AI 模型 Grok 3。新模型推出后,Grok 应用的下载量和活跃用户数大幅增长。然而,近期围绕 Grok 3 的争议可能会影响用户的热情。能否保持增长势头并留住用户,成为 xAI 面临的重要挑战。
Google 宣布扩展 Gemini AI 模型系列,增加现有模型的可用性。公司推出了更新的 Gemini 2.0 Flash 模型,并发布了 2.0 Pro 和 2.0 Flash Thinking 的实验版本。此外,Google 还推出了新的 2.0 Flash-Lite 模型,旨在提供最具成本效益的 AI 解决方案。这些举措旨在提升 AI 性能,并为开发者和用户提供更多选择。
OpenAI 发布了其 o3-mini 大语言模型,这是一款低成本、高速的推理优化模型。它在 ChatGPT 多个版本中可用,并通过 API 向开发者开放。o3-mini 在性能测试中表现出色,显示出 OpenAI 在推理模型领域的持续进展。
OpenAI正寻求400亿美元新一轮融资,估值或达3400亿美元。软银可能领投150-250亿美元,并协助寻找其他投资者。这笔资金将用于支持亏损业务运营和建设AI数据中心网络,以应对来自竞争对手的挑战,推动AI技术进步。
Mistral AI 和艾伦人工智能研究所发布了新的开源大语言模型。Mistral Small 3 拥有 240 亿参数,可在某些 MacBook 上运行。AI2 的 Tülu 3 405B 是基于 Meta 的 Llama 3.1 405B 模型改进而来。两个模型都声称在各自类别中处于领先地位,并以开源许可发布。
文章深入探讨了 AI 技术的快速发展趋势及其未来影响。作者通过分析量级增长 (OOM)、AI 能力跃升以及模型的情境意识等方面,论证了 AI 即将迎来重大突破。特别强调了到 2027 年 AI 可能具备 AI 研究员/工程师的工作能力,以及 AI 系统在获得持久记忆和更广泛上下文后将产生质的飞跃。
谷歌正在向人工智能公司Anthropic追加投资超10亿美元,总投资额已达30亿美元。Anthropic还将从其他投资者筹集20亿美元,估值可能达到600亿美元。该公司开发的Claude大语言模型在某些任务上据称优于GPT-4,并计划进一步提升模型能力和基础设施,以应对不断增长的需求。