模型优化文章列表第2页-至顶网频道

2025-02-28

OpenAI 发布迄今最大规模的 AI 模型 GPT-4.5 "Orion"

OpenAI 推出代号"Orion"的 GPT-4.5 模型，这是公司迄今最大规模的 AI 模型。GPT-4.5 在计算能力和训练数据方面均超越以往版本，但 OpenAI 并不认为它是前沿模型。该模型将逐步向付费用户开放，但运营成本高昂。尽管在某些基准测试中表现出色，但 GPT-4.5 在部分任务上仍落后于其他 AI 推理模型，凸显了传统预训练方法的局限性。

IBM 发布新的 Granite 3.2 系列模型，实现按需推理能力

IBM 公司今天推出了新的 Granite AI 模型系列，具备实验性推理、视觉和预测能力，旨在在企业人工智能市场中占据一席之地。所有 Granite 模型均在 Apache 2.0 开源许可证下开放，现已在 Hugging Face 和 IBM watson.ai 等平台上提供。新系列的旗舰产品是 Granite 3.2 Instruct 变体，支持文本处理，能够执行摘要、问题解决和代码生成等任务，并设计为遵循指令。

人工智能

自然语言处理

模型优化

2025-02-26

Grok 3 似乎正推动 Grok 使用量创下新高

埃隆·马斯克的人工智能公司 xAI 推出了备受期待的旗舰 AI 模型 Grok 3。新模型推出后，Grok 应用的下载量和活跃用户数大幅增长。然而，近期围绕 Grok 3 的争议可能会影响用户的热情。能否保持增长势头并留住用户，成为 xAI 面临的重要挑战。

人工智能

深度学习

模型优化

2025-02-06

Google 扩大 Gemini 2.0 AI 模型的使用范围并推出实验版本

Google 宣布扩展 Gemini AI 模型系列，增加现有模型的可用性。公司推出了更新的 Gemini 2.0 Flash 模型，并发布了 2.0 Pro 和 2.0 Flash Thinking 的实验版本。此外，Google 还推出了新的 2.0 Flash-Lite 模型，旨在提供最具成本效益的 AI 解决方案。这些举措旨在提升 AI 性能，并为开发者和用户提供更多选择。

人工智能

机器学习推理

模型优化

2025-02-05

OpenAI 发布 o3-mini 推理模型供公众使用

OpenAI 发布了其 o3-mini 大语言模型，这是一款低成本、高速的推理优化模型。它在 ChatGPT 多个版本中可用，并通过 API 向开发者开放。o3-mini 在性能测试中表现出色，显示出 OpenAI 在推理模型领域的持续进展。

报告：OpenAI 有望通过 400 亿美元新融资使估值翻倍至 3400 亿美元

人工智能

大语言模型

模型优化

2025-02-04

报告：OpenAI 有望通过 400 亿美元新融资使估值翻倍至 3400 亿美元

OpenAI正寻求400亿美元新一轮融资，估值或达3400亿美元。软银可能领投150-250亿美元，并协助寻找其他投资者。这笔资金将用于支持亏损业务运营和建设AI数据中心网络，以应对来自竞争对手的挑战，推动AI技术进步。

人工智能

大语言模型

模型优化

2025-02-03

Mistral 和 Ai2 发布新的开源大语言模型

Mistral AI 和艾伦人工智能研究所发布了新的开源大语言模型。Mistral Small 3 拥有 240 亿参数，可在某些 MacBook 上运行。AI2 的 Tülu 3 405B 是基于 Meta 的 Llama 3.1 405B 模型改进而来。两个模型都声称在各自类别中处于领先地位，并以开源许可发布。