深度学习 关键字列表
测试时扩展如何释放小型语言模型的隐藏推理能力 (并让它们超越大语言模型的表现)

测试时扩展如何释放小型语言模型的隐藏推理能力 (并让它们超越大语言模型的表现)

上海人工智能实验室的一项新研究表明,通过适当的工具和测试时扩展技术,参数仅有10亿的小型语言模型在复杂数学基准测试中可以超越4050亿参数的大型语言模型。这一发现为企业在不同环境和应用中部署小型语言模型进行复杂推理任务提供了新的可能性。

DeepTempo 任命首位销售副总裁推广 AI 日志安全业务

DeepTempo 任命首位销售副总裁推广 AI 日志安全业务

深度节奏是一家专注于日志数据的AI安全初创公司,成立16个月后聘请了首位销售副总裁。该公司由Evan Powell于2023年11月创立,去年11月首次公开。新任销售副总裁Chris Bowen曾在Hammerspace担任销售高级副总裁。深度节奏开发的日志语言模型(LLGM)能够识别日志数据中的攻击事件,并将检测到的事件转发至安全信息和事件管理(SIEM)资源。该软件在Snowflake环境中运行,能够在任何数据湖中识别异常活动并发送警报。通过聘请Bowen,深度节奏表明其有产品可售,并可能将销售重点放在Snowflake渠道上。

马斯克发布了一款比 ChatGPT 更智能的 AI — 这意味着什么

马斯克发布了一款比 ChatGPT 更智能的 AI — 这意味着什么

马斯克的 AI 公司 xAI 推出了 Grok 3 模型,号称在多项技术指标上超越竞争对手。这款 AI 在数学、科学推理和编程等方面表现出色,并在用户测试中领先 GPT-4 等模型。Grok 3 的发布标志着 AI 领域竞争加剧,也凸显了马斯克与 OpenAI 之间的紧张关系。

是什么在改变 IT 领导者采用企业级 AI 的规则

是什么在改变 IT 领导者采用企业级 AI 的规则

DeepSeek于1月推出的R-1 AI模型显著改变了企业AI的格局,导致美国科技股市损失超过1万亿美元。该公司声称其推理模型在性能上可与OpenAI的o1相媲美,速度是其两倍,成本仅为10%。尽管模型开发存在争议,DeepSeek加速了AI模型的商品化,为CIO提供了更多选择和更低的内部构建AI能力的门槛。随着模型成本下降,企业在商业解决方案上将有更大选择,内部开发应用变得更为现实。

Perplexity 颠覆 AI 研究成本,对行业意味着什么

Perplexity 颠覆 AI 研究成本,对行业意味着什么

Perplexity 通过推出 Deep Research 工具,颠覆了 AI 市场的现状。该工具能够在几分钟内生成全面的研究报告,并以极低的企业成本向用户开放先进的 AI 能力。Perplexity 的 CEO Aravind Srinivas 强调,知识应该是普遍可获取和有用的,而不是被高昂的订阅计划所限制。Deep Research 的推出揭示了 AI 定价的痛苦真相:昂贵的企业订阅可能是多余的。Perplexity 提供的服务在价格上具有竞争力,可能迫使大型 AI 公司重新审视其定价结构。

研究发现:训练大语言模型进行推理任务并不需要海量数据

研究发现:训练大语言模型进行推理任务并不需要海量数据

{一项来自上海交通大学的研究表明,大型语言模型(LLMs)可以在不依赖大数据集的情况下学习复杂的推理任务。研究结果显示,仅需少量精心挑选的示例,就能训练LLM完成原本认为需要数万个训练实例的任务。这种高效性源于现代LLM在预训练阶段获得的内在知识。随着新的训练方法变得更加数据和计算高效,企业可能能够在不需要大型AI实验室资源的情况下创建定制模型。}

Transformer:AI 模型进化背后的驱动引擎探秘

Transformer:AI 模型进化背后的驱动引擎探秘

{如今,几乎所有前沿的 AI 产品和模型都采用变压器架构。大型语言模型(LLMs)如 GPT-4o、LLaMA、Gemini 和 Claude 都是基于变压器的,其他 AI 应用如文本转语音、自动语音识别、图像生成和文本到视频模型也以变压器作为其基础技术。随着 AI 热潮的持续,了解变压器的工作原理及其在可扩展解决方案增长中的重要性显得尤为重要。变压器不仅仅是表面现象,它们是处理数据序列的神经网络架构,适用于语言翻译、句子补全和自动语音识别等任务。}

AI 发展提速:Anthropic CEO 警告 2026 年 AI 将达到"天才国度"水平

AI 发展提速:Anthropic CEO 警告 2026 年 AI 将达到"天才国度"水平

Anthropic CEO Dario Amodei警告,人工智能将在两年内达到"天才国家"的集体智能水平。他批评巴黎AI峰会错失良机,呼吁加快AI治理进程。Amodei强调民主国家在AI发展中的领导地位,并提出了关于安全风险和经济影响的担忧。这一警告凸显了AI快速发展与有效监管之间的紧迫挑战。

商业领导者应对 AI 驱动威胁的四大关键考虑因素

商业领导者应对 AI 驱动威胁的四大关键考虑因素

人工智能正在重塑网络安全格局,既带来机遇也带来挑战。企业需要充分认识 AI 的双面性,既要利用 AI 提升防御能力,也要防范 AI 被用于网络攻击。本文提出四点建议:获得高层支持、评估风险、培养安全文化、做好应对准备,以帮助企业应对 AI 驱动的网络威胁。

DeepSeek R1 模型引发 AI 投资领域的不确定性

DeepSeek R1 模型引发 AI 投资领域的不确定性

DeepSeek公司最近发布的开源推理AI模型R1在开发者和研究人员中迅速流行,引发科技股大幅抛售。R1的出现以及同期宣布的Stargate项目,凸显了AI投资和商业模式的深度不确定性。这些事件引发了关于开源vs闭源AI系统、硬件vs软件优化、以及AI公司盈利模式等多方面的争议和思考。

EU AI 峰会启幕,行业巨头积极推动人工智能发展蓝图

EU AI 峰会启幕,行业巨头积极推动人工智能发展蓝图

随着人工智能技术的快速发展,欧盟正在制定相关行动计划。与此同时,一项由60多家组织参与的"欧盟人工智能冠军计划"正式启动,旨在释放欧洲在人工智能领域的全部潜力。该计划呼吁简化法规、增加资金支持、投资基础设施,并积极推广人工智能的益处,以提升欧洲企业在全球市场的竞争力。

OpenAI 推出 ChatGPT 深度研究代理

OpenAI 推出 ChatGPT 深度研究代理

OpenAI 推出 ChatGPT 深度研究代理,能够在 5 到 30 分钟内分析数百个在线资源,生成全面报告。该代理使用 o3 模型搜索互联网信息,准确性比现有模型高,但仍存在一些局限性。目前仅向付费用户开放,未来将扩展功能并提高使用限制。

2025 年 AI 发展的四大关键问题

2025 年 AI 发展的四大关键问题

随着人工智能技术的快速发展,2025年被视为AI发展的里程碑之年。本文探讨了AI的普遍性、数据所有权、就业影响及谨慎推进等四个关键问题,旨在引发人们对AI未来发展的深入思考,为社会各界提供重要参考。

Google 扩大 Gemini 2.0 AI 模型的使用范围并推出实验版本

Google 扩大 Gemini 2.0 AI 模型的使用范围并推出实验版本

Google 宣布扩展 Gemini AI 模型系列,增加现有模型的可用性。公司推出了更新的 Gemini 2.0 Flash 模型,并发布了 2.0 Pro 和 2.0 Flash Thinking 的实验版本。此外,Google 还推出了新的 2.0 Flash-Lite 模型,旨在提供最具成本效益的 AI 解决方案。这些举措旨在提升 AI 性能,并为开发者和用户提供更多选择。

抖音母公司推出新AI工具:一张照片就能生成逼真视频

抖音母公司推出新AI工具:一张照片就能生成逼真视频

字节跳动推出OmniHuman-1 AI系统,能从单张照片生成栩栩如生的人物视频,包括说话、手势、唱歌等动作。该系统在生成逼真人物视频方面表现出色,支持各种比例的图像输入,可应用于多种场景。这项技术展现了AI在视频生成领域的巨大潜力,但也引发了对滥用的担忧。

强大的主动式 AI 浪潮即将来临

强大的主动式 AI 浪潮即将来临

随着主动式人工智能技术的快速发展,预计到2025年将有25%使用生成式AI的公司开始试点主动式AI项目,到2027年这一比例可能增至50%。与传统生成式AI不同,主动式AI具有自主决策和行动能力,可以根据实时数据做出判断。这种技术将为医疗、金融、供应链等多个领域带来革命性变化,但同时也面临着伦理和监管方面的挑战。

2025 年值得关注的 6 个数据中心关键缩写词

2025 年值得关注的 6 个数据中心关键缩写词

本文介绍了6个在2025年值得关注的数据中心相关缩写词,包括ARM处理器架构、裸金属即服务(BMaaS)、卷积神经网络(CNN)、NVIDIA新一代GPU GB200、后量子加密(PQC)以及UPS即服务(UPSaaS)。这些缩写词反映了数据中心领域的创新趋势,涉及AI、量子计算、基础设施服务等热点技术。

2024:AI 演进的里程碑之年

2024:AI 演进的里程碑之年

2024年成为人工智能发展的转折点。企业广泛采用生成式AI,提高效率;竞争格局重塑,全球多家公司推出新模型;监管框架逐步形成,平衡保护与创新。尽管仍面临成本和能耗挑战,AI已成为企业战略重点,未来发展潜力巨大。

新模型推理:工程师的视角

新模型推理:工程师的视角

本文探讨了人工智能领域的最新模型进展,特别是o1-pro模型带来的突破。文章解释了新模型如何改变工程师与大语言模型交互的方式,提高了模型处理复杂任务的能力。同时介绍了业内专家对这些进展的看法,以及这些变化对AI技术发展的潜在影响。

Leopold Aschenbrenner 论述 AI 的未来发展

Leopold Aschenbrenner 论述 AI 的未来发展

文章深入探讨了 AI 技术的快速发展趋势及其未来影响。作者通过分析量级增长 (OOM)、AI 能力跃升以及模型的情境意识等方面,论证了 AI 即将迎来重大突破。特别强调了到 2027 年 AI 可能具备 AI 研究员/工程师的工作能力,以及 AI 系统在获得持久记忆和更广泛上下文后将产生质的飞跃。