大语言模型 关键字列表
人工智能教父:大语言模型并不是简单的词汇预测机器,具有理解能力,还有主观体验

人工智能教父:大语言模型并不是简单的词汇预测机器,具有理解能力,还有主观体验

大语言模型并不是简单的词汇预测机器,这些模型实际上具有理解它们所生成内容的能力。如果大语言模型只是简单地基于统计概率来预测下一个词汇,那么它们不可能在处理复杂问题时表现出色。

基于Gemini!Waymo提出端到端自动驾驶多模态模型EMMA!

基于Gemini!Waymo提出端到端自动驾驶多模态模型EMMA!

我们介绍了EMMA,一个端到端的自动驾驶多模态模型。基于多模态大型语言模型的基础,EMMA直接将原始相机传感器数据映射到各种特定于驾驶的输出中,包括规划器轨迹、感知对象和道路图元素。EMMA通过将所有非传感器输入(例如导航指令和自我车辆状态)和输出(例如轨迹和3D位置)表示为自然语言文本,最大化了预训练大型语言模型的世界知识效用。

比GPT-4强100倍!OpenAI将在12月发布新模型—猎户座

比GPT-4强100倍!OpenAI将在12月发布新模型—猎户座

专业社区关注大语言模型(LLM)如微软&OpenAI、百度文心一言、讯飞星火的发展。OpenAI计划推出性能远超GPT-4的Orion模型,但首席执行官Sam Altman否认相关消息。网友质疑Sam的辟谣,认为Orion项目的存在已被暗示。微软可能在Azure云上提供Orion服务。Sam的推文和ChatGPT-o1的解读进一步加深了Orion即将发布的猜测。

LangGraph,知多少?

LangGraph,知多少?

LangGraph是LangChain生态系统的新框架,专为构建基于大语言模型的有状态、多代理应用程序而设计。它支持循环流程,提供精细的控制能力,具备持久性特性,并能与人类协作。LangGraph适用于个人助理、AI教师、软件用户体验优化、空间计算和构建智能操作系统等多种场景。

18款用于客户服务的生成式人工智能工具

18款用于客户服务的生成式人工智能工具

生成式人工智能在企业中的一个突出用例就是客户服务和支持。大多数读者可能都曾作为客户经历过与传统自动客服系统打交道的沮丧。但这种情况正在发生变化,这要归功于时下强大的大型语言模型和自然语言聊天机器人。虽然有报告显示,我们在处理复杂或敏感的咨询时仍然更愿意与人类交谈,但在提供简单的帮助时,机器人的能力已经越来越强了。

温布尔登网球公开赛为粉丝提供了哪些生成式AI体验

温布尔登网球公开赛为粉丝提供了哪些生成式AI体验

过去30多年来,AELTC一直与IBM合作。作为其主要技术合作伙伴,蓝色巨人也将此作为最新技术的展示良机,每年都会增添新的内容与形式。而在2024年这转折性的一年,闪亮登场的自然是技术界的绝对明星、当今时代的至高母题——生成式AI。

代码吟游诗人:Claude 3.5 Sonnet 如何奏响 AI 应用的全新乐章?

代码吟游诗人:Claude 3.5 Sonnet 如何奏响 AI 应用的全新乐章?

当我们还在惊叹于 ChatGPT 引发的 AI 应用热潮时,技术迭代的巨轮却从未停止转动。Anthropic 新近推出的 Claude 3.5 Sonnet,如同一位技艺精湛的“代码吟游诗人”,以其在代码生成、视觉处理和推理能力方面的显著提升,再次将我们带到了 AI 应用的新疆域。

IBM 为温网部署新的 GenAI 功能

IBM 为温网部署新的 GenAI 功能

M 的人工智能和数据平台 Watsonx 将用于支持温布尔登 2024 年草地网球锦标赛的 Catch Me Up 功能。Catch Me Up 功能可以通过 Wimbledon.com 和 Wimbledon 2024 App 显示赛前和赛后的球员卡片以及人工智能生成的球员故事和分析。

Palo Alto Networks 收购 IBM 的 QRadar 资产成为 IBM 安全合作伙伴

Palo Alto Networks 收购 IBM 的 QRadar 资产成为 IBM 安全合作伙伴

Palo Alto Networks 公司和 IBM 公司今天宣布建立新的合作伙伴关系。Palo Alto Networks 将收购 IBM 的 QRadar 软件即服务资产,并成为 IBM 在网络、云和安全运营中心方面的首选网络安全合作伙伴。

AI服务器产业链及竞争格局分析
2024-04-16

AI服务器产业链及竞争格局分析

Open AI的大型语言生成模型ChatGPT火热,它能胜任刷高情商对话、生成代码、构思剧本和小说等多个场景,将人机对话推向新的高度。全球各大科技企业都在积极拥抱AIGC,不断推出相关技术、平台和应用。

支持任意分辨率图像的MLLM!定位识别超强!Apple提出Ferret-v2!

支持任意分辨率图像的MLLM!定位识别超强!Apple提出Ferret-v2!

多模态大型语言模型(Multimodal Large Language Models,MLLMs)在人工智能 的最新进展中扮演着关键角色,作为通用全能助手开发的基础元素。然而,这些方法依赖 于粗粒度的图像级对齐,缺乏对细节的理解(如区域描述和推理)。

高产的阿里!Qwen1.5系列再次更新:阿里开源320亿参数Qwen1.5-32B,评测超Mixtral MoE,性价比更高!

高产的阿里!Qwen1.5系列再次更新:阿里开源320亿参数Qwen1.5-32B,评测超Mixtral MoE,性价比更高!

阿里巴巴开源了320亿参数的大语言模型Qwen1.5-32B,性能略超Mixtral 8×7B MoE,略低于720亿参数的Qwen-1.5-72B。Qwen1.5-32B具有高性价比,显存需求减半,适合更广泛使用。模型在多项评测中表现优秀,特别是在推理和数学方面。支持32K上下文长度,以通义千问的开源协议发布,允许商用。

思科CEO畅谈收购Splunk之后的AI优势、平台愿景和市场竞争

思科CEO畅谈收购Splunk之后的AI优势、平台愿景和市场竞争

随着思科推进对Splunk收购的整合,从向思科提供遥测数据的客户那里捕获数据所带来的AI“洞察和建议”这一优势将变得越来越清晰。他说:“我们可以再次以其他竞争对手无法做到的规模做到这一点,当你拥有此类客户数据时,你就可以获得更好的信息、更好的建议和更好的洞察。我认为这是最大的区别。

600GB显存才能拉起来的Grok-1不太惊艳!马斯克大模型企业xAI开源Grok-1,截止目前全球参数规模最大的MoE大模型!

600GB显存才能拉起来的Grok-1不太惊艳!马斯克大模型企业xAI开源Grok-1,截止目前全球参数规模最大的MoE大模型!

马斯克旗下大模型公司开发的Grok-1大语言模型已开源,采用Apache2.0协议。Grok-1是一个混合专家架构模型,参数总数3140亿,每次推理激活860亿。虽然在MMLU和GSM8K评测中表现不错,但与同类模型相比资源消耗大而收益不显著。开源的仅为推理代码,训练基础设施和tokenizer的特殊token作用未透露。

英伟达推出”生成式AI专业认证“,帮你成为大模型开发专家!

英伟达推出”生成式AI专业认证“,帮你成为大模型开发专家!

英伟达推出了生成式AI(AIGC)专业认证,旨在通过考试提供行业认可的权威证书,并提供相应的培训课程。认证内容涵盖生成式AI和大语言模型知识,考试为远程方式,适合多种AI相关职业人士。

评测结果超过GPT-4,Anthropic发布第三代大语言模型Claude3,具有多模态能力,实际评测表现优秀!但幻觉问题不小!

评测结果超过GPT-4,Anthropic发布第三代大语言模型Claude3,具有多模态能力,实际评测表现优秀!但幻觉问题不小!

Anthropic推出了第三代大语言模型Claude3,包含三个版本:Claude3-Opus、Claude3-Sonnet和Claude3-Haiku,能力和成本递减。Claude3-Opus在多项评测中超过GPT-4,支持多模态和最高100万上下文输入。

英伟达升级GRACE-HOPPER GPU内存,着力为大语言模型提供加持

英伟达升级GRACE-HOPPER GPU内存,着力为大语言模型提供加持

如果情况真如英伟达及其他众多科技企业预料的那样,即大语言模型会成为新的编程模型基础,那么混合CPU-GPU计算引擎就将是新的通用计算平台。

亚马逊推出Falcon大语言模型,并与Persistent Systems深化合作

亚马逊推出Falcon大语言模型,并与Persistent Systems深化合作

亚马逊宣布其技术创新研究所(TII)完成了大型语言模型Falcon 40B的训练。

新的机会空间:ChatGPT、大语言模型与存储

新的机会空间:ChatGPT、大语言模型与存储

成式AI热度的快速升温将对IT行业产生影响,部分数据存储行业将凭借生成式AI获取巨大的潜在销售收益,本文将尝试对此做出分类。