我们介绍了EMMA,一个端到端的自动驾驶多模态模型。基于多模态大型语言模型的基础,EMMA直接将原始相机传感器数据映射到各种特定于驾驶的输出中,包括规划器轨迹、感知对象和道路图元素。EMMA通过将所有非传感器输入(例如导航指令和自我车辆状态)和输出(例如轨迹和3D位置)表示为自然语言文本,最大化了预训练大型语言模型的世界知识效用。
专业社区关注大语言模型(LLM)如微软&OpenAI、百度文心一言、讯飞星火的发展。OpenAI计划推出性能远超GPT-4的Orion模型,但首席执行官Sam Altman否认相关消息。网友质疑Sam的辟谣,认为Orion项目的存在已被暗示。微软可能在Azure云上提供Orion服务。Sam的推文和ChatGPT-o1的解读进一步加深了Orion即将发布的猜测。
LangGraph是LangChain生态系统的新框架,专为构建基于大语言模型的有状态、多代理应用程序而设计。它支持循环流程,提供精细的控制能力,具备持久性特性,并能与人类协作。LangGraph适用于个人助理、AI教师、软件用户体验优化、空间计算和构建智能操作系统等多种场景。
生成式人工智能在企业中的一个突出用例就是客户服务和支持。大多数读者可能都曾作为客户经历过与传统自动客服系统打交道的沮丧。但这种情况正在发生变化,这要归功于时下强大的大型语言模型和自然语言聊天机器人。虽然有报告显示,我们在处理复杂或敏感的咨询时仍然更愿意与人类交谈,但在提供简单的帮助时,机器人的能力已经越来越强了。
过去30多年来,AELTC一直与IBM合作。作为其主要技术合作伙伴,蓝色巨人也将此作为最新技术的展示良机,每年都会增添新的内容与形式。而在2024年这转折性的一年,闪亮登场的自然是技术界的绝对明星、当今时代的至高母题——生成式AI。
当我们还在惊叹于 ChatGPT 引发的 AI 应用热潮时,技术迭代的巨轮却从未停止转动。Anthropic 新近推出的 Claude 3.5 Sonnet,如同一位技艺精湛的“代码吟游诗人”,以其在代码生成、视觉处理和推理能力方面的显著提升,再次将我们带到了 AI 应用的新疆域。
M 的人工智能和数据平台 Watsonx 将用于支持温布尔登 2024 年草地网球锦标赛的 Catch Me Up 功能。Catch Me Up 功能可以通过 Wimbledon.com 和 Wimbledon 2024 App 显示赛前和赛后的球员卡片以及人工智能生成的球员故事和分析。
Palo Alto Networks 公司和 IBM 公司今天宣布建立新的合作伙伴关系。Palo Alto Networks 将收购 IBM 的 QRadar 软件即服务资产,并成为 IBM 在网络、云和安全运营中心方面的首选网络安全合作伙伴。
Open AI的大型语言生成模型ChatGPT火热,它能胜任刷高情商对话、生成代码、构思剧本和小说等多个场景,将人机对话推向新的高度。全球各大科技企业都在积极拥抱AIGC,不断推出相关技术、平台和应用。
多模态大型语言模型(Multimodal Large Language Models,MLLMs)在人工智能 的最新进展中扮演着关键角色,作为通用全能助手开发的基础元素。然而,这些方法依赖 于粗粒度的图像级对齐,缺乏对细节的理解(如区域描述和推理)。
阿里巴巴开源了320亿参数的大语言模型Qwen1.5-32B,性能略超Mixtral 8×7B MoE,略低于720亿参数的Qwen-1.5-72B。Qwen1.5-32B具有高性价比,显存需求减半,适合更广泛使用。模型在多项评测中表现优秀,特别是在推理和数学方面。支持32K上下文长度,以通义千问的开源协议发布,允许商用。
随着思科推进对Splunk收购的整合,从向思科提供遥测数据的客户那里捕获数据所带来的AI“洞察和建议”这一优势将变得越来越清晰。他说:“我们可以再次以其他竞争对手无法做到的规模做到这一点,当你拥有此类客户数据时,你就可以获得更好的信息、更好的建议和更好的洞察。我认为这是最大的区别。
马斯克旗下大模型公司开发的Grok-1大语言模型已开源,采用Apache2.0协议。Grok-1是一个混合专家架构模型,参数总数3140亿,每次推理激活860亿。虽然在MMLU和GSM8K评测中表现不错,但与同类模型相比资源消耗大而收益不显著。开源的仅为推理代码,训练基础设施和tokenizer的特殊token作用未透露。
英伟达推出了生成式AI(AIGC)专业认证,旨在通过考试提供行业认可的权威证书,并提供相应的培训课程。认证内容涵盖生成式AI和大语言模型知识,考试为远程方式,适合多种AI相关职业人士。
Anthropic推出了第三代大语言模型Claude3,包含三个版本:Claude3-Opus、Claude3-Sonnet和Claude3-Haiku,能力和成本递减。Claude3-Opus在多项评测中超过GPT-4,支持多模态和最高100万上下文输入。
如果情况真如英伟达及其他众多科技企业预料的那样,即大语言模型会成为新的编程模型基础,那么混合CPU-GPU计算引擎就将是新的通用计算平台。
亚马逊宣布其技术创新研究所(TII)完成了大型语言模型Falcon 40B的训练。
成式AI热度的快速升温将对IT行业产生影响,部分数据存储行业将凭借生成式AI获取巨大的潜在销售收益,本文将尝试对此做出分类。
虽然ChatGPT、Stable Diffusion和其他生成式人工智能(Generative AI)为市场带来的明显兴奋和潜在机会真实存在,但生成式人工智能并无法解决任何类型的人工智能所面临的任何市场挑战,生成式人工智能并非灵丹妙药。