AI 行业正在努力将“代理”——能够代表用户执行多步骤操作的 AI 驱动软件——变为现实。包括谷歌在内的多家科技公司最近强调了代理功能,OpenAI 首席执行官山姆·阿尔特曼在一月份表示,2025 年将是 AI 代理“加入劳动力”的一年。
OpenAI 发布了新的 Responses API,简化了创建和部署能独立执行任务的 AI 代理的过程。这项技术允许开发者构建具有文件搜索和互联网搜索能力的 AI 代理,以提高模型的准确性。尽管仍处于早期阶段,但 OpenAI 希望通过这一工具扩大其语言模型的市场份额,并推动 AI 代理技术的普及。
OpenAI于周二发布了新工具,旨在帮助开发者和企业使用公司的AI模型和框架构建AI代理——能够独立完成任务的自动化系统。
无论你是独立创业者、商业领袖、社交媒体影响者,还是在组织中逐步晋升的员工,培养个人品牌都是至关重要的。在罗马共和国时期,尤利乌斯·凯撒通过手工撰写的文章和演讲来塑造自己作为不可动摇的领导者的形象。幸运的是,对于今天雄心勃勃的领导者和专业人士来说,AI 代理使得通过自动化、内容创作和互动来提升个人品牌变得比以往任何时候都更容易。除了简单的聊天机器人,AI 代理还可以自主行动,利用先进的 AI 算法模拟人类的推理和解决问题的能力。
OpenAI 推出新的 Responses API,简化开发者创建和部署 AI 智能体的过程。该 API 支持 AI 智能体搜索公司内部数据集和互联网,提高模型准确性。尽管搜索功能改善了 AI 的表现,但仍存在一定错误率。OpenAI 同时发布了开源 Agents SDK,为开发者提供集成和管理 AI 智能体的工具,旨在扩大其语言模型的市场份额。
新加坡航空计划引入 Salesforce 的 Agentforce AI 代理平台、Einstein 服务云和数据云,以优化客户服务体验。通过自主 AI 代理,该航空公司旨在简化客服流程,使客服代表能够专注于提供更加个性化的服务。这项技术整合了多种先进功能,包括统一客户视图、智能推理引擎和生成式 AI,有望提高服务效率并树立航空业服务新标准。
最近,中国人工智能公司Monica推出的Manus引发了广泛关注。然而,与DeepSeek等有实质性突破的中国AI不同,Manus并无革命性创新。它宣称具有自主性,实际上只是执行预设流程的大语言模型。Manus的唯一新颖之处在于它来自中国,但这并不足以证明它的先进性。AI的成功取决于应用,而非产地。
Google 推出基于 Gemini AI 的新功能,可自动识别 Gmail 邮件中的活动详情并添加到 Google 日历。用户只需点击新增的"添加到日历"按钮,即可快速完成日程设置。这项功能目前已向企业、教育用户和 Google One AI Premium 订阅者开放,旨在简化日程管理流程,提高工作效率。
Databricks 推出多项新产品和功能升级,旨在帮助企业更轻松地部署和扩展 AI 代理。新功能包括扩展 Mosaic AI Gateway 支持更多模型、推出 AI/BI Genie 对话 API 套件、升级 Agent 评估审查应用等。这些举措旨在解决企业在关键场景中部署 AI 代理时的顾虑,提高 AI 代理的可控性和可追踪性。
Google 为 Workspace 用户推出由 Gemini AI 驱动的新功能。用户现可直接从邮件中添加事件到 Google 日历。Gemini 自动检测邮件中的日历相关内容,并显示"添加到日历"按钮。该功能目前仅支持英语和网页版,不包含其他宾客,也不适用于已提取事件的邮件。
当前,AI模型的推出速度令人眼花缭乱,从谷歌等大型科技公司到OpenAI和Anthropic等初创企业都在不断推出新模型。跟踪最新的AI模型可能会让人感到不知所措。AI模型通常根据行业基准进行宣传,但这些技术指标往往无法真实反映人们和公司如何实际使用它们。为了帮助读者理清思路,TechCrunch汇总了自2024年以来发布的最先进的AI模型概述,包括如何使用它们及其最佳应用场景。我们也会持续更新这个列表,添加最新的发布信息。
谷歌在周三的博客中表示,正在将 AI 概述扩展到美国更多用户,并对其进行 Gemini 2.0 升级。
Motorola 在巴塞罗那世界移动通信大会上宣布升级 Smart Connect 工具。新版本将支持所有 Windows 10 和 11 电脑,以及更多 Android 设备,实现跨设备无缝集成。用户可通过语音或文本命令轻松在手机、平板和电脑间传输内容。AI 技术的应用使搜索和设备管理更加智能化,大大提升了用户体验。
Google 正在测试一种全新的 AI 搜索模式,将搜索引擎转变为由 Gemini 2.0 驱动的定制聊天机器人界面。用户可以通过这个界面提问、获取答案,并深入探讨特定主题。这一模式目前作为小规模实验推出,但可能预示着 Google 搜索的未来发展方向:一种以 AI 为主导的搜索体验,可能会改变信息呈现和获取的方式。
谷歌正在推出一项新的“AI 模式”实验性功能,旨在与 Perplexity AI 和 OpenAI 的 ChatGPT 搜索等流行服务竞争。该科技巨头在周三宣布,这种新模式旨在让用户能够在谷歌搜索中直接提出复杂的多部分问题和后续问题,以便更深入地探讨某个主题。
在巴塞罗那的移动世界大会上,OpenAI董事会主席布雷特·泰勒在与CNN主持人安娜·斯图尔特的对话中并没有给出“AI代理”的明确定义。他回避了关于“代理AI”与“生成AI聊天机器人”之间区别的问题,指出人们对前者的反感与对AI代理“富有同情心”回应的喜爱。泰勒表示,他对大型语言模型和当前技术浪潮的兴奋程度超过了他记忆中的任何技术,甚至自他青少年时期发现互联网以来。
Google Cloud 推出两项新的 AI 功能:一是面向数据科学家的 Data Science Agent,可在 Google Colab 中快速进行数据分析;二是面向医疗专业人士的 Vertex AI Search 多模态搜索功能,可更全面地分析患者健康信息。这些 AI 创新旨在提高数据分析效率和医疗诊断准确性,推动 AI 在科技和医疗领域的应用。
自2022年末ChatGPT推出以来,专家们一直在讨论人工智能语言模型将如何影响世界。几年后,情况逐渐明朗。根据斯坦福大学领导的新研究,分析了跨多个行业的超过3亿条文本样本,发现人工智能语言模型现在在各行业的专业沟通中提供了高达四分之一的写作支持,尤其是在美国教育水平较低的地区影响显著。
Zoom Communications的研究团队开发了一种突破性技术,能够显著降低人工智能系统在处理复杂推理问题时所需的成本和计算资源,可能会改变企业大规模部署AI的方式。该方法称为草稿链(Chain of Draft,CoD),使大型语言模型能够用最少的文字解决问题——所需文本仅为当前方法的7.6%,同时保持或甚至提高准确性。研究结果上周在arXiv研究库中发表。
Opera浏览器现在拥有“代理AI”,用户可以请求内置的AI模型执行需要一系列浏览器内操作的任务。虽然这项技术展示可能有趣,但实际上它只是将网络浏览委托给一个能力有限的个人助手。AI代理被称为浏览器操作员,可以帮助用户找到可购买的12双10码Nike袜子。尽管用户可以在15秒内通过访问Walmart在线商店完成相同操作,但这项技术的推出标志着浏览器角色的转变。