商汤“日日新”融合大模型性能上文理兼修,在SuperCLUE年度评测中,文科成绩以81.8分位列全球第一,超越OpenAI的o1模型;理科成绩夺得金牌,其中计算维度以78.2分位列国内第一。
随着生成式AI逐渐成为企业应用的核心,它将显著提升运营效率、推动创新,并重塑组织与技术的交互方式。本文梳理了2025年5大关键趋势,包括AI优先的应用开发、服务即软件模式、语音实时交互、生成式用户界面,以及企业级AI代理的深度集成。这些趋势将为企业带来机遇与挑战,需要决策者深入了解并提前布局。
据报道,人工智能公司 Anthropic 正寻求融资 20 亿美元,估值或达 600 亿美元,是去年估值的三倍多。该公司开发的 Claude 大语言模型在性能测试中表现出色,年化经常性收入达 8.75 亿美元。此轮融资或将支持更先进模型的开发,并应对基础设施成本上升的挑战。
OpenAI创始人Sam Altman预测,到2025年AGI(通用人工智能)将实现,AI将加入劳动力大军,彻底改变企业运作方式。然而,这一大胆预测引发争议。虽然AGI短期内难以实现,但AI确实将以各种形式融入工作场景。微软、Salesforce等巨头凭借数据和用户优势占据有利地位,OpenAI则专注于提升AI推理能力。未来企业需要重视员工AI培训,以适应这场科技变革。
本文是2025年AI预测系列的第一篇。尽管AGI和技术奇点引发了广泛讨论,但作者认为2025年不会出现AGI。相反,大型语言模型将找到其"杀手级应用"。文章分析了当前AI技术的局限性,预测2025年将出现更多专用AI解决方案,提高生产力并在某些领域超越人类表现,但这并不等同于AGI。作者呼吁关注AI的实际风险和机遇,而非陷入AGI争论。
本文探讨了生成式 AI 和大语言模型 (LLMs) 即将实现的近乎无限记忆能力这一重大突破。通过新的架构设计,AI 系统将能够存储和检索几乎无限量的对话历史,实现持续性的上下文理解和个性化交互。这项技术将彻底改变 AI 的应用方式,但同时也带来了隐私保护等方面的挑战。
大语言模型并不是简单的词汇预测机器,这些模型实际上具有理解它们所生成内容的能力。如果大语言模型只是简单地基于统计概率来预测下一个词汇,那么它们不可能在处理复杂问题时表现出色。
我们介绍了EMMA,一个端到端的自动驾驶多模态模型。基于多模态大型语言模型的基础,EMMA直接将原始相机传感器数据映射到各种特定于驾驶的输出中,包括规划器轨迹、感知对象和道路图元素。EMMA通过将所有非传感器输入(例如导航指令和自我车辆状态)和输出(例如轨迹和3D位置)表示为自然语言文本,最大化了预训练大型语言模型的世界知识效用。
专业社区关注大语言模型(LLM)如微软&OpenAI、百度文心一言、讯飞星火的发展。OpenAI计划推出性能远超GPT-4的Orion模型,但首席执行官Sam Altman否认相关消息。网友质疑Sam的辟谣,认为Orion项目的存在已被暗示。微软可能在Azure云上提供Orion服务。Sam的推文和ChatGPT-o1的解读进一步加深了Orion即将发布的猜测。
LangGraph是LangChain生态系统的新框架,专为构建基于大语言模型的有状态、多代理应用程序而设计。它支持循环流程,提供精细的控制能力,具备持久性特性,并能与人类协作。LangGraph适用于个人助理、AI教师、软件用户体验优化、空间计算和构建智能操作系统等多种场景。
生成式人工智能在企业中的一个突出用例就是客户服务和支持。大多数读者可能都曾作为客户经历过与传统自动客服系统打交道的沮丧。但这种情况正在发生变化,这要归功于时下强大的大型语言模型和自然语言聊天机器人。虽然有报告显示,我们在处理复杂或敏感的咨询时仍然更愿意与人类交谈,但在提供简单的帮助时,机器人的能力已经越来越强了。
过去30多年来,AELTC一直与IBM合作。作为其主要技术合作伙伴,蓝色巨人也将此作为最新技术的展示良机,每年都会增添新的内容与形式。而在2024年这转折性的一年,闪亮登场的自然是技术界的绝对明星、当今时代的至高母题——生成式AI。
当我们还在惊叹于 ChatGPT 引发的 AI 应用热潮时,技术迭代的巨轮却从未停止转动。Anthropic 新近推出的 Claude 3.5 Sonnet,如同一位技艺精湛的“代码吟游诗人”,以其在代码生成、视觉处理和推理能力方面的显著提升,再次将我们带到了 AI 应用的新疆域。
M 的人工智能和数据平台 Watsonx 将用于支持温布尔登 2024 年草地网球锦标赛的 Catch Me Up 功能。Catch Me Up 功能可以通过 Wimbledon.com 和 Wimbledon 2024 App 显示赛前和赛后的球员卡片以及人工智能生成的球员故事和分析。
Palo Alto Networks 公司和 IBM 公司今天宣布建立新的合作伙伴关系。Palo Alto Networks 将收购 IBM 的 QRadar 软件即服务资产,并成为 IBM 在网络、云和安全运营中心方面的首选网络安全合作伙伴。
Open AI的大型语言生成模型ChatGPT火热,它能胜任刷高情商对话、生成代码、构思剧本和小说等多个场景,将人机对话推向新的高度。全球各大科技企业都在积极拥抱AIGC,不断推出相关技术、平台和应用。
多模态大型语言模型(Multimodal Large Language Models,MLLMs)在人工智能 的最新进展中扮演着关键角色,作为通用全能助手开发的基础元素。然而,这些方法依赖 于粗粒度的图像级对齐,缺乏对细节的理解(如区域描述和推理)。
阿里巴巴开源了320亿参数的大语言模型Qwen1.5-32B,性能略超Mixtral 8×7B MoE,略低于720亿参数的Qwen-1.5-72B。Qwen1.5-32B具有高性价比,显存需求减半,适合更广泛使用。模型在多项评测中表现优秀,特别是在推理和数学方面。支持32K上下文长度,以通义千问的开源协议发布,允许商用。
随着思科推进对Splunk收购的整合,从向思科提供遥测数据的客户那里捕获数据所带来的AI“洞察和建议”这一优势将变得越来越清晰。他说:“我们可以再次以其他竞争对手无法做到的规模做到这一点,当你拥有此类客户数据时,你就可以获得更好的信息、更好的建议和更好的洞察。我认为这是最大的区别。
马斯克旗下大模型公司开发的Grok-1大语言模型已开源,采用Apache2.0协议。Grok-1是一个混合专家架构模型,参数总数3140亿,每次推理激活860亿。虽然在MMLU和GSM8K评测中表现不错,但与同类模型相比资源消耗大而收益不显著。开源的仅为推理代码,训练基础设施和tokenizer的特殊token作用未透露。