大模型文章列表第2页-至顶网频道

2024-12-04

2024 re:Invent 首日：除了有Andy Jassy，还有Amazon Nova和苹果Apple

今年6月上任成为亚马逊云科技首席执行官的Matt Garman，今天首次站上re:Invent的讲台，讲述了计算、存储、数据库、推理、Amazon Q等个多个重要模块中的创新。

AWS宣布新应用市场Amazon Bedrock上线100多个AI模型

AWS正在通过Amazon Bedrock服务向AI应用开发人员提供更多的大型语言模型，同时增强该平台的优化推理工作负载和为他们提供所需数据的能力。

企业智能体：为AI投资带来丰厚回报

智能体不仅可以像聊天机器人那样回答问题，还能接受人类甚至是其他智能体委托给它们的任务。而且与AI领域的其他成果一样，智能体同样保持着迅猛的发展速度。

从“Chat”到“Act”：AutoGLM 如何引领 AI 智能设备新范式？

智谱AI率先推出了 AutoGLM，试图打造一款能够理解、规划、执行，并最终实现“无人驾驶”操作系统的 AI Agent。

国产模型炸裂登场，国外赞不绝口！OpenAI-o1级性能，免费使用

这个模型的最大特色便是深度思维链推理，尤其是在数学、代码以及各种复杂推理任务上，可以生成数万字的推理流程，让用户深度了解模型生成内容的全过程。

体验完百度世界2024上的iRAG，我觉得AI绘图也可以没有幻觉了。

本质上，他是不是大模型按照自己的知识库回答，然后先通过一些工程化手段，比如联网搜索，比如文档搜索等等，先把相关信息给找出来，让大模型根据这些信息来进行回答。

李开复：零一万物的目标是，让大模型帮助企业赚到钱

大模型的应用落地仍面临诸多挑战。许多企业对大模型充满期待，却对如何将其融入自身业务感到困惑。如何选择合适的模型？如何进行模型训练和部署，最大限度地发挥大模型的价值、实现降本增效？这些问题如同层层迷雾，阻碍着企业拥抱AI的步伐。

ChatGPT新域名曝光，史上最贵顶级域名之一！

OpenAI首席执行官Sam Altman公开确认购买了该域名，没有说收购价格。但肯定比之前1100万美元收购的AI.com（也是跳转到ChatGPT）贵很多。

赋能AI应用，引领智媒时代新华三出席2024中国电影电视技术学会年会

当前，AI技术已成为媒体新质生产力的核心引擎。从新闻热点聚合、内容策划到创作和分发，再到传播力分析，AIGC赋能媒体业务全流程，显著提升了生产效率。然而，在向AI转型的过程中，媒体也面临着诸多挑战，例如算力需求的满足、专属大模型的打造、相关技能的学习、内容安全机制的制定，等等。

IBM Granite 3.0模型：为大规模企业AI应用指明方向

IBM在企业AI领域做出了一系列颇为独特的探索。蓝色巨人目前正在推动全栈技术布局，以自2020年来兴起的AI和混合云作为企业战略领域的两大基础性支柱，同时借鉴了自身在其产品组合中积累下的优势。

刚刚，OpenAI开源SimpleQA！轻松检测、校准大模型能力

目前，很多大模型会出现一本正经胡说八道的问题，例如，你提问NBA历史上得分最多的是谁，它回答是迈克尔乔丹，实际上是勒布朗詹姆斯。包括OpenAI自己发布的GPT-4o、o1-preview、o1mini等前沿模型都有这些“幻觉”难题。

智谱AI的AutoGLM后，Google和微软也下场来做“贾维斯”了。

谷歌准备推出接管计算机的人工智能。上周三Claude、周五智谱AI、周末Google，然后微软。短短一周内，已经有四个公司爆出来要发布类似的产品了，其中三个已经悄悄发布产品：Anthropic的Claude，智谱的AutoGLM和微软的OmniParser。这些产品的能力有目共睹。

智算为生成式AI发展铺路

从PC时代到移动互联网时代，再到如今的AI时代，每一轮技术变革都在不断降低使用门槛和开发门槛，智算的发展也将进一步降低生成式AI的应用，使其可以快速推进。

科技部回复人大、政协提案：推进人工智能产业应用和立法工作

提案针对我国人工智能大模型产业应用存在的问题，提出强化关键技术研发、促进数据安全共享、加强伦理治理规范、强化人才引培等建议，对提升我国生成式人工智能整体竞争力，推动人工智能快速有序健康发展具有重要意义。

Anthropic发布全新的Haiku 3.5和升级版Sonnet 3.5，大模型控制电脑使用能力强了很多！

Anthropic在这次更新中不仅提升了模型的整体性能，还在专业领域如编程、视觉理解等方面取得了显著进步。特别是新增的计算机使用能力，虽然仍处于早期阶段，但展现出了AI与计算机交互的新可能性。

趋势丨2024遍地开花的新能源大模型

当前，新能源头部企业对于“智能化”与“AI技术”的定位，早已不再是整齐划一的机械臂和简单存储的云平台了。AI技术正在接受海量样本数据喂养，加速实现行业落地，成为头部企业争先布局的“先手棋”，以保障成功穿越周期，继续领跑未来。

大模型的研发和运行确实需要大规模的资源和资金支持，非小规模团队能够轻易承担。这一点在当前的人工智能领域尤为明显。以GPT4-o为例，其训练涉及了文本、视觉和音频等多种数据模态，这意味着它需要处理和分析的数据量是巨大的。据OpenAI透露，GPT-4o在训练过程中使用了多达13兆的数据，这比之前的一些大型模型如LLAMA和PaLM使用的数据量还要多。此外，GPT-4o的模型参数数量也非常庞大，达到了1.8万亿。

提示词工程

大模型

逻辑推理

2024-10-16

一句废话就把OpenAI o1干崩了？大模型的推理能力还真挺脆弱的。

保持提示词简单直接：模型擅长理解和相应简单、清晰的指令，而不需要大量的指导。当时我对这一条的理解，觉得是为了让o1模型更好的理解我的要求，同时可以加快模型的处理速度，因为模型不需要花费额外的时间去解析复杂的语句。

CES 2025：沉浸AI

大模型落地，你还缺怎样的“工具箱”？

2024 AI创新者大会

智算“筑基”AI未来

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: