大语言模型 关键字列表
Grok 3:可能重新定义 AI 行业的模型剖析

Grok 3:可能重新定义 AI 行业的模型剖析

xAI公司推出的Grok 3模型在各项关键基准测试中表现出色,匹敌或超越了目前最先进的AI模型。尽管训练尚未完成,Grok 3已展现出强大实力。本文探讨了Grok 3可能对AI行业产生的影响,包括加速模型发布周期、验证大规模计算投资的价值,以及推动开源文化的发展等方面。

Google 推出"AI 科研助手",为科学研究插上加速的翅膀

Google 推出"AI 科研助手",为科学研究插上加速的翅膀

Google 推出了一款名为"AI 协作科学家"的系统,旨在加速科学发现。该系统基于 Gemini 2.0 构建,可以生成新颖的可测试假设、详细的研究概述和实验方案。早期测试显示,它能在短时间内解决困扰科学家多年的难题。这一工具目前仅对参与 Google 可信测试计划的研究人员开放,有望显著提高科研效率。

Enso 与 LangChain 合作推出 AI 代理市场

Enso 与 LangChain 合作推出 AI 代理市场

Enso 与 LangChain 合作推出 AI 代理市场,提供超过 300 个 AI 代理,帮助企业自动化业务任务。用户可通过每月 49 美元的订阅访问这些代理,为中小企业提供 AI 解决方案。此举不仅使 AI 技术更易获取,还为开发者提供了更便捷的商业化途径。

AI 巨头 OpenAI 的 GPT-5 路线图正式公布

AI 巨头 OpenAI 的 GPT-5 路线图正式公布

OpenAI 首席执行官 Sam Altman 宣布了公司发布 GPT-5 的路线图,这是对 2023 年 GPT-4 AI 语言模型的期待已久的后续版本。Altman 在 X 上表示,GPT-5 将在“几个月内”推出,预计在 2025 年晚些时候发布。公司计划在“几周内”发布 GPT-4.5,作为最后一个非模拟推理模型。GPT-5 将整合 OpenAI 当前 AI 模型的多种特性,并为不同用户提供不同的智能级别。Altman 还提到,简化产品线是公司的目标之一。

DeepSeek 在科技界引发争议与质疑

DeepSeek 在科技界引发争议与质疑

中国人工智能公司DeepSeek的突然崛起震动了全球科技市场,引发了对其性能声明和开源承诺的质疑。尽管其低成本模型引起了业界关注,但在开放性、性能真实性和安全性方面仍存在争议。这一事件也引发了对中国AI技术发展的深入思考。

让你的职业生涯与生成式 AI 同行的 5 个理由

让你的职业生涯与生成式 AI 同行的 5 个理由

近期一项调查显示,大型企业正大幅增加对生成式人工智能的投资和应用。本文分析了五个原因,解释为何生成式人工智能的实施将主要由业务部门而非IT部门主导,包括应用范围广、培训需求大、业务导向强等。这意味着技术主管需要做好准备,以更灵活的模式为多样化的需求提供支持。

报告:OpenAI 有望通过 400 亿美元新融资使估值翻倍至 3400 亿美元

报告:OpenAI 有望通过 400 亿美元新融资使估值翻倍至 3400 亿美元

OpenAI正寻求400亿美元新一轮融资,估值或达3400亿美元。软银可能领投150-250亿美元,并协助寻找其他投资者。这笔资金将用于支持亏损业务运营和建设AI数据中心网络,以应对来自竞争对手的挑战,推动AI技术进步。

Mistral 和 Ai2 发布新的开源大语言模型

Mistral 和 Ai2 发布新的开源大语言模型

Mistral AI 和艾伦人工智能研究所发布了新的开源大语言模型。Mistral Small 3 拥有 240 亿参数,可在某些 MacBook 上运行。AI2 的 Tülu 3 405B 是基于 Meta 的 Llama 3.1 405B 模型改进而来。两个模型都声称在各自类别中处于领先地位,并以开源许可发布。

Alibaba 发布 Qwen 2.5-Max AI 模型,称性能超越 DeepSeek-V3

Alibaba 发布 Qwen 2.5-Max AI 模型,称性能超越 DeepSeek-V3

阿里云发布最新大语言模型 Qwen 2.5-Max,声称性能超越当前最强 AI 模型。该模型采用专家混合架构,经过 20 万亿 token 预训练和后续强化学习,在多项基准测试中超越 DeepSeek-V3 等模型。Qwen 2.5-Max 目前通过阿里云 API 提供服务,但尚未开源。

OpenAI 推出 ChatGPT Gov 加速政府部门采用 AI

OpenAI 推出 ChatGPT Gov 加速政府部门采用 AI

OpenAI 推出专为政府机构定制的 ChatGPT Gov 版本,通过 Azure 云平台提供更高安全标准的服务环境。该版本保留了 ChatGPT Enterprise 的核心功能,同时确保政府数据的安全性和隐私保护,目前已获得多个联邦机构的采用,体现了 OpenAI 深化与美国政府合作的战略意图。

Galileo 发布新平台用于评估 AI 代理系统

Galileo 发布新平台用于评估 AI 代理系统

Galileo 发布了 Agentic Evaluations 平台,用于评估基于大语言模型的 AI 代理性能。该平台提供全生命周期框架,支持系统级和步骤级评估,帮助开发者快速定位inefficiencies和错误。平台使用专有的 LLM-as-a-Judge 指标,支持 LangGraph 和 CrewAI 框架,现已向所有 Galileo 用户开放。

Databricks 完成 100 亿美元融资轮并筹集 52.5 亿美元债务融资

Databricks 完成 100 亿美元融资轮并筹集 52.5 亿美元债务融资

Databricks公司完成了创纪录的100亿美元融资轮和52.5亿美元债务融资。这笔资金将用于开发新的AI产品、进行收购和扩展国际业务。公司CEO表示,此次融资将加深与Meta在AI领域的合作,特别是在大型语言模型方面。Databricks计划最早在2025年下半年上市。

Google 据报道向 OpenAI 竞争对手 Anthropic 投资超 10 亿美元

Google 据报道向 OpenAI 竞争对手 Anthropic 投资超 10 亿美元

谷歌正在向人工智能公司Anthropic追加投资超10亿美元,总投资额已达30亿美元。Anthropic还将从其他投资者筹集20亿美元,估值可能达到600亿美元。该公司开发的Claude大语言模型在某些任务上据称优于GPT-4,并计划进一步提升模型能力和基础设施,以应对不断增长的需求。

商汤推出“日日新”融合大模型,勇夺“双冠王”

商汤推出“日日新”融合大模型,勇夺“双冠王”

商汤“日日新”融合大模型性能上文理兼修,在SuperCLUE年度评测中,文科成绩以81.8分位列全球第一,超越OpenAI的o1模型;理科成绩夺得金牌,其中计算维度以78.2分位列国内第一。

2025年值得关注的5大生成式AI趋势

2025年值得关注的5大生成式AI趋势

随着生成式AI逐渐成为企业应用的核心,它将显著提升运营效率、推动创新,并重塑组织与技术的交互方式。本文梳理了2025年5大关键趋势,包括AI优先的应用开发、服务即软件模式、语音实时交互、生成式用户界面,以及企业级AI代理的深度集成。这些趋势将为企业带来机遇与挑战,需要决策者深入了解并提前布局。

Anthropic 据报道正以 600 亿美元估值融资高达 20 亿美元

Anthropic 据报道正以 600 亿美元估值融资高达 20 亿美元

据报道,人工智能公司 Anthropic 正寻求融资 20 亿美元,估值或达 600 亿美元,是去年估值的三倍多。该公司开发的 Claude 大语言模型在性能测试中表现出色,年化经常性收入达 8.75 亿美元。此轮融资或将支持更先进模型的开发,并应对基础设施成本上升的挑战。

AI 工作同事来临:技术巨头争霸 2025

AI 工作同事来临:技术巨头争霸 2025

OpenAI创始人Sam Altman预测,到2025年AGI(通用人工智能)将实现,AI将加入劳动力大军,彻底改变企业运作方式。然而,这一大胆预测引发争议。虽然AGI短期内难以实现,但AI确实将以各种形式融入工作场景。微软、Salesforce等巨头凭借数据和用户优势占据有利地位,OpenAI则专注于提升AI推理能力。未来企业需要重视员工AI培训,以适应这场科技变革。

2025 年 AI 预测:没有 AGI,但会出现"杀手级应用"

2025 年 AI 预测:没有 AGI,但会出现"杀手级应用"

本文是2025年AI预测系列的第一篇。尽管AGI和技术奇点引发了广泛讨论,但作者认为2025年不会出现AGI。相反,大型语言模型将找到其"杀手级应用"。文章分析了当前AI技术的局限性,预测2025年将出现更多专用AI解决方案,提高生产力并在某些领域超越人类表现,但这并不等同于AGI。作者呼吁关注AI的实际风险和机遇,而非陷入AGI争论。

生成式 AI 和大语言模型即将实现近乎无限内存带来的惊人可能性

生成式 AI 和大语言模型即将实现近乎无限内存带来的惊人可能性

本文探讨了生成式 AI 和大语言模型 (LLMs) 即将实现的近乎无限记忆能力这一重大突破。通过新的架构设计,AI 系统将能够存储和检索几乎无限量的对话历史,实现持续性的上下文理解和个性化交互。这项技术将彻底改变 AI 的应用方式,但同时也带来了隐私保护等方面的挑战。

人工智能教父:大语言模型并不是简单的词汇预测机器,具有理解能力,还有主观体验

人工智能教父:大语言模型并不是简单的词汇预测机器,具有理解能力,还有主观体验

大语言模型并不是简单的词汇预测机器,这些模型实际上具有理解它们所生成内容的能力。如果大语言模型只是简单地基于统计概率来预测下一个词汇,那么它们不可能在处理复杂问题时表现出色。