大模型 关键字列表
刚刚,OpenAI开源SimpleQA!轻松检测、校准大模型能力

刚刚,OpenAI开源SimpleQA!轻松检测、校准大模型能力

目前,很多大模型会出现一本正经胡说八道的问题,例如,你提问NBA历史上得分最多的是谁,它回答是迈克尔乔丹,实际上是勒布朗詹姆斯。包括OpenAI自己发布的GPT-4o、o1-preview、o1mini等前沿模型都有这些“幻觉”难题。

智谱AI的AutoGLM后,Google和微软也下场来做“贾维斯”了。

智谱AI的AutoGLM后,Google和微软也下场来做“贾维斯”了。

谷歌准备推出接管计算机的人工智能。上周三Claude、周五智谱AI、周末Google,然后微软。短短一周内,已经有四个公司爆出来要发布类似的产品了,其中三个已经悄悄发布产品:Anthropic的Claude,智谱的AutoGLM和微软的OmniParser。这些产品的能力有目共睹。

智算为生成式AI发展铺路

智算为生成式AI发展铺路

从PC时代到移动互联网时代,再到如今的AI时代,每一轮技术变革都在不断降低使用门槛和开发门槛,智算的发展也将进一步降低生成式AI的应用,使其可以快速推进。

科技部回复人大、政协提案:推进人工智能产业应用和立法工作

科技部回复人大、政协提案:推进人工智能产业应用和立法工作

提案针对我国人工智能大模型产业应用存在的问题,提出强化关键技术研发、促进数据安全共享、加强伦理治理规范、强化人才引培等建议,对提升我国生成式人工智能整体竞争力,推动人工智能快速有序健康发展具有重要意义。

Anthropic发布全新的Haiku 3.5和升级版Sonnet 3.5,大模型控制电脑使用能力强了很多!

Anthropic发布全新的Haiku 3.5和升级版Sonnet 3.5,大模型控制电脑使用能力强了很多!

Anthropic在这次更新中不仅提升了模型的整体性能,还在专业领域如编程、视觉理解等方面取得了显著进步。特别是新增的计算机使用能力,虽然仍处于早期阶段,但展现出了AI与计算机交互的新可能性。

趋势丨2024遍地开花的新能源大模型

趋势丨2024遍地开花的新能源大模型

当前,新能源头部企业对于“智能化”与“AI技术”的定位,早已不再是整齐划一的机械臂和简单存储的云平台了。AI技术正在接受海量样本数据喂养,加速实现行业落地,成为头部企业争先布局的“先手棋”,以保障成功穿越周期,继续领跑未来。

诺奖都颁给AI了,行业却已开启增速焦虑

诺奖都颁给AI了,行业却已开启增速焦虑

大模型的研发和运行确实需要大规模的资源和资金支持,非小规模团队能够轻易承担。这一点在当前的人工智能领域尤为明显。以GPT4-o为例,其训练涉及了文本、视觉和音频等多种数据模态,这意味着它需要处理和分析的数据量是巨大的。据OpenAI透露,GPT-4o在训练过程中使用了多达13兆的数据,这比之前的一些大型模型如LLAMA和PaLM使用的数据量还要多。此外,GPT-4o的模型参数数量也非常庞大,达到了1.8万亿。

一句废话就把OpenAI o1干崩了?大模型的推理能力还真挺脆弱的。

一句废话就把OpenAI o1干崩了?大模型的推理能力还真挺脆弱的。

保持提示词简单直接:模型擅长理解和相应简单、清晰的指令,而不需要大量的指导。 当时我对这一条的理解,觉得是为了让o1模型更好的理解我的要求,同时可以加快模型的处理速度,因为模型不需要花费额外的时间去解析复杂的语句。

新质发展X智领创新|北京· AIGC应用发展高峰论坛倒计时7天!

新质发展X智领创新|北京· AIGC应用发展高峰论坛倒计时7天!

AIGC应用发展高峰论坛暨AIGC100年度评选”将于下周在北京隆重开幕。本次活动将汇聚超过50位顶尖AI创业者,通过主题演讲、圆桌论坛、落地工坊、互动展区、播客马拉松、派对晚宴等多样化的形式,为与会者提供一个全面而深入的AI交流平台。

极智AI | 解读大模型量化算法之GPTQ

极智AI | 解读大模型量化算法之GPTQ

GPTQ 的核心思想是通过最小化量化引入的输出误差,实现高精度低比特量化。具体来说,GPTQ 在后量化过程中,针对每一层的权重矩阵,利用一小部分校准数据,最小化量化前后模型输出的差异。

大模型之家2024年9月热力榜:“快慢”思考引热议,大厂多模态领域齐发力

大模型之家2024年9月热力榜:“快慢”思考引热议,大厂多模态领域齐发力

“慢思考”概念的提出,也引发了全行业的深思。如360两月前便提出的CoE(专家协同)架构。该架构通过整合多个大型模型和专家模型,构建了一个协作网络,实现了“快思考”与“慢思考”的有机结合,进一步提高了推理任务的灵活性和精确度。

视觉能力媲美OpenAI,Meta发布Llama 3.2

视觉能力媲美OpenAI,Meta发布Llama 3.2

这是Meta首款能够理解图像和文本的旗舰视觉模型。

Qwen2.5全家桶发布,包含7种尺寸规模

Qwen2.5全家桶发布,包含7种尺寸规模

本次开源的Qwen2.5语言模型主要包含7种尺寸,0.5B到72B全尺寸覆盖,弥补了Qwen2 14B/32B这两种业务黄金尺寸缺失的遗憾,并且开源了强劲的3B的端侧模型。本次开源,一个字:尺寸丰富,性能强劲。(此外还包括Math、Code和VL专项模型)

人形机器人的灵魂觉醒:钉钉如何激发具身智能,引领产业新风潮?

人形机器人的灵魂觉醒:钉钉如何激发具身智能,引领产业新风潮?

在AI与大模型技术的加持下,人形机器人不再是冷冰冰的钢铁机器,而是拥有了更强大的“大脑”,它们能够理解、推理、学习,甚至与人类进行自然流畅的互动。钉钉,这个我们熟悉的办公平台,在其中扮演什么关键角色?“云启智跃·产业蝶变”本届的“云栖大会”为我们揭开了迷雾。

思维链就是思维么?OpenAI o1系列发布,开启推理新范式

思维链就是思维么?OpenAI o1系列发布,开启推理新范式

著名的教育家约翰·杜威这样定义思维:“以一种观察到的事物为依据,去推测或判断出其他的事物,然后将作为依据的事物当做后者推测数的事物的机遇或者基础,从而产生信念。”

数据湖演进之路:架构分裂推动AI分析的新时代

数据湖演进之路:架构分裂推动AI分析的新时代

数据湖这个词在21世纪10年代初出现的时候,有些人认为它是在恰当的时间出现的一种恰当的架构。数据湖是一种非结构化的数据存储库,利用了新的低成本云对象存储格式(如Amazon S3),可以容纳来自网络的大量数据。

OpenAI将在两周内发布“草莓”模型,推理模式非常特殊!
2024-09-13

OpenAI将在两周内发布“草莓”模型,推理模式非常特殊!

目前,多数大模型的性能受限于其预训练阶段所获取的数据集,以及推理过程中的算力资源。研究人员发现,可以通过更多的推理时间、自适应(就是草莓的特殊延迟推理)来提升模型的性能,这种技术称为——测试时计算(Test-time computation)。

夸克发布全新CueMe  打造“超能写”的智能对话助手

夸克发布全新CueMe 打造“超能写”的智能对话助手

2万字长文也能高质量生成 夸克全新CueMe打造AI写作神器。

大模型时代,推理的成本决定最终的胜利

大模型时代,推理的成本决定最终的胜利

大模型时代,底层逻辑发生了很大的变化。系统的成本几乎和客户使用量成线性关系,边际成本依然很高。这里的成本绝大部分都是推理的算力消耗。

凯文·凯利、王坚、沈向洋思辨2024外滩大会:人工智能还有哪些难题,如何追寻答案?

凯文·凯利、王坚、沈向洋思辨2024外滩大会:人工智能还有哪些难题,如何追寻答案?

2024年,人工智能依然是全球科技创新高地,也正在全产业的基础技术和基础设施。