大语言模型 关键字列表
"渐进,然后突然":AI 对就业岗位的冲击是否正在遵循这一模式?

"渐进,然后突然":AI 对就业岗位的冲击是否正在遵循这一模式?

AI 正在迅速改变我们的工作方式,无论是通过自动化任务、作为副驾驶还是生成文本、图像和软件。虽然目前尚未出现大规模的劳动力替代,但多项研究预测未来几年内 40% 的全球就业岗位可能面临 AI 自动化的冲击。这可能是暴风雨来临前的宁静。

腾讯放缓 GPU 部署步伐,从更少的加速器中榨取更多性能

腾讯放缓 GPU 部署步伐,从更少的加速器中榨取更多性能

腾讯放缓了GPU部署速度,原因是DeepSeek技术的突破使得现有GPU的生产力大幅提升。公司预计2025年资本支出将占收入的"低teens百分比",远低于微软和亚马逊的支出。腾讯强调效率和GPU服务器的高效利用,认为这不会影响技术开发的最终效果。公司计划在微信中加入AI驱动的搜索、语言输入和内容生成功能,并考虑引入智能AI服务。

谷歌推出全新可及的轻量级 Gemma 3 系列模型

谷歌推出全新可及的轻量级 Gemma 3 系列模型

Google 发布新一代轻量级开源大语言模型 Gemma 3,提供多种参数规模选择,可在单个 GPU 上运行。该模型基于 Gemini 技术,性能优异,具备多模态能力和大上下文窗口。同时推出 ShieldGemma 2 用于图像安全检查,为开发者提供更多 AI 应用开发选择。

专家链模型 (CoE):一个提高效率和准确性的低成本大语言模型框架

专家链模型 (CoE):一个提高效率和准确性的低成本大语言模型框架

专家链(CoE)是一种新型大语言模型框架,通过顺序激活专门化的模型元素来提高资源效率和推理任务准确性。与传统方法相比,CoE允许专家元素相互传递中间结果,逐步建立推理链,从而在推理密集型应用中实现更高效的计算和更好的用户体验,同时大幅降低企业运行大型语言模型的成本。

微软据报道开发出可与 OpenAI、Anthropic 模型媲美的大语言模型系列

微软据报道开发出可与 OpenAI、Anthropic 模型媲美的大语言模型系列

微软公司据报道已开发出一系列大型语言模型,可与 OpenAI 和 Anthropic 的算法相媲美。这个名为 MAI 的 LLM 系列可能使用了微软内部开发的 AI 芯片 Maia 100。测试结果显示,MAI 在性能上具有竞争力,可能用于支持微软的 Copilot AI 助手系列。此举或将减少微软对 OpenAI 的依赖,同时公司也在开发专注于推理任务的第二个 LLM 系列。

为什么使用多个 AI 成为当前趋势

为什么使用多个 AI 成为当前趋势

随着AI技术的发展,企业和个人用户越来越倾向于使用多个AI模型和工具。这一趋势源于单一AI模型难以满足多样化需求,专业化AI可以在特定领域发挥更好的效果。多模型组合不仅可以提高性能和效率,还能避免对单一供应商的依赖。然而,管理和协调多个AI也带来了新的挑战。

Turing 获得 1.11 亿美元融资,估值达到 22 亿美元,为 OpenAI 等大语言模型公司提供关键代码支持

Turing 获得 1.11 亿美元融资,估值达到 22 亿美元,为 OpenAI 等大语言模型公司提供关键代码支持

图灵公司作为OpenAI等大语言模型公司的重要合作伙伴,刚刚完成1.11亿美元E轮融资,估值翻倍至22亿美元。公司原本专注于远程开发人才招聘,现已转型为AI代码生成服务商,为多家基础AI公司和应用开发商提供支持。图灵拥有400万名全球开发者资源,年化收入达1.67亿美元,已实现盈利。

ChatGPT 在新功能发布后半年内周活用户翻倍增长

ChatGPT 在新功能发布后半年内周活用户翻倍增长

根据风险投资公司 Andreessen Horowitz 的最新报告,OpenAI 的旗舰 AI 聊天机器人 ChatGPT 在 2024 年下半年实现了强劲增长。ChatGPT 从 2023 年 11 月的 1 亿周活跃用户增长到 2024 年 8 月的 2 亿用户用了 9 个月,而现在仅用不到 6 个月就再次实现了用户数量翻倍。报告还分析了竞争对手的影响,以及 AI 应用在移动端和网页端的排名情况。

Google 在其搜索引擎中推出 Gemini 2.0 和 AI 模式

Google 在其搜索引擎中推出 Gemini 2.0 和 AI 模式

谷歌今天推出了两项新的人工智能功能,旨在帮助用户更快速地找到信息。第一项是增强版的 AI 概述功能,该功能在标准搜索结果上方显示自然语言响应。谷歌将这一功能切换到最新的 Gemini 2.0 大型语言模型系列。该系列的最强算法 Gemini 2.0 Pro 支持多达 200 万个标记的提示,能够更好地理解复杂查询、生成代码并进行推理。AI 概述功能预计将为美国用户提供更准确的响应。

A-MEM 框架如何支持强大的长上下文记忆,使大语言模型能够处理更复杂的任务

A-MEM 框架如何支持强大的长上下文记忆,使大语言模型能够处理更复杂的任务

研究人员在罗格斯大学、蚂蚁集团和 Salesforce Research 提出了一个新框架,允许 AI 代理通过整合环境信息并创建自动链接的记忆来处理更复杂的任务。

OpenAI 的 GPT-4.5 AI 模型向更多 ChatGPT 用户开放

OpenAI 的 GPT-4.5 AI 模型向更多 ChatGPT 用户开放

OpenAI 已开始向其 ChatGPT Plus 用户推出最新的 AI 模型 GPT-4.5。OpenAI 在 X 平台上发布的一系列帖子中表示,此次推出将持续“1-3 天”,并预计速率限制会有所变化。

ChatGPT 4.5 震撼发布:更大、更智能,但也更贵

ChatGPT 4.5 震撼发布:更大、更智能,但也更贵

OpenAI 最近推出了 GPT-4.5,这款新模型在准确性测试中表现优于之前的版本,能够更好地理解细微差别。尽管面临 GPU 短缺的挑战,OpenAI 仍然致力于将这一模型推向市场,并计划在未来推出更先进的推理能力模型。

ChatGPT 对手 Anthropic 估值 615 亿美元融资 35 亿美元加速 AI 研发

ChatGPT 对手 Anthropic 估值 615 亿美元融资 35 亿美元加速 AI 研发

人工智能公司 Anthropic PBC 今日宣布已完成一轮 35 亿美元的融资,估值达到 615 亿美元。这轮 E 轮融资在公司从 Google LLC 筹集 10 亿美元不到两个月后进行。两个月前,亚马逊公司将对 Anthropic 的投资翻倍至 80 亿美元。亚马逊网络服务自去年九月起成为该人工智能提供商的主要云服务商。

OpenAI 发布 GPT-4.5,但表示这并非前沿 AI 模型

OpenAI 发布 GPT-4.5,但表示这并非前沿 AI 模型

OpenAI 今日推出最新最大的 AI 语言模型 GPT-4.5。该模型将首先向 ChatGPT Pro 用户提供研究预览。虽然 OpenAI 称其为"最具知识性的模型",但也警告 GPT-4.5 并非前沿模型,可能无法超越 o1 或 o3-mini 的表现。GPT-4.5 在写作、知识储备和个性方面有所提升,但不会引入足够的新功能被视为前沿模型。

OpenAI 发布迄今最大规模的 AI 模型 GPT-4.5 "Orion"

OpenAI 发布迄今最大规模的 AI 模型 GPT-4.5 "Orion"

OpenAI 推出代号"Orion"的 GPT-4.5 模型,这是公司迄今最大规模的 AI 模型。GPT-4.5 在计算能力和训练数据方面均超越以往版本,但 OpenAI 并不认为它是前沿模型。该模型将逐步向付费用户开放,但运营成本高昂。尽管在某些基准测试中表现出色,但 GPT-4.5 在部分任务上仍落后于其他 AI 推理模型,凸显了传统预训练方法的局限性。

最热门的 AI 模型:它们能做什么以及如何使用

最热门的 AI 模型:它们能做什么以及如何使用

近期AI模型层出不穷,从谷歌等科技巨头到OpenAI、Anthropic等初创公司,都在不断推出新模型。本文梳理了2024年以来发布的最先进AI模型,介绍它们的功能特点和使用方法,帮助读者了解最新AI发展动态,选择适合的模型使用。文章将持续更新,跟踪最新模型发布情况。

DeepSeek:关于这款 AI 聊天机器人应用你需要知道的一切

DeepSeek:关于这款 AI 聊天机器人应用你需要知道的一切

DeepSeek是一家中国人工智能实验室,其聊天机器人应用最近在应用商店排名飙升。该公司通过高效的计算技术训练AI模型,其表现引发了业界对美国AI领先地位和AI芯片需求的质疑。DeepSeek的崛起源于量化对冲基金,其模型性能出色且价格低廉,正在对AI行业产生重大影响。

Google AI 负责人呼吁员工对 DeepSeek 保持冷静

Google AI 负责人呼吁员工对 DeepSeek 保持冷静

Google DeepMind 首席执行官 Demis Hassabis 在内部会议上回应了员工对中国 AI 初创公司 DeepSeek 的担忧。他强调 Google 拥有更高效、性能更强的 AI 模型,对公司战略充满信心。Hassabis 认为 DeepSeek 的成本可能被低估,并可能依赖西方公司的先进模型。

给人工智能更多"思考时间"如何陷入过度思考的陷阱

给人工智能更多"思考时间"如何陷入过度思考的陷阱

本文分析了当前AI业界的一种普遍观点:只需增加生成式AI和大语言模型的"思考时间"就能获得更好的回应。作者认为,虽然这种方法有时有效,但并非万能良药,实际上是回避了当代AI面临的更大问题。文章通过多个示例,深入探讨了增加AI处理时间的优缺点,以及可能带来的潜在风险。

Grok 3:可能重新定义 AI 行业的模型剖析

Grok 3:可能重新定义 AI 行业的模型剖析

xAI公司推出的Grok 3模型在各项关键基准测试中表现出色,匹敌或超越了目前最先进的AI模型。尽管训练尚未完成,Grok 3已展现出强大实力。本文探讨了Grok 3可能对AI行业产生的影响,包括加速模型发布周期、验证大规模计算投资的价值,以及推动开源文化的发展等方面。