最新文章
比亚迪出海:从"建"到"简"的车联网修行
2025-10-24

比亚迪出海:从"建"到"简"的车联网修行

比亚迪不仅是中国汽车出海的一面旗帜,也是中国智能制造比肩全球的担当代表。

2025-10-24

从“成本中心”到“质量飞轮”,IT部门如何重塑软件交付的价值公式

当前的数字化转型浪潮中,IT预算的投向已成为企业领导层最核心的战略考量。对于CIO和CTO而言,最大的挑战并非采纳新技术,而是如何让技术投入不再仅仅是开支,而是能立即产生可量化的业务价值。

2025-10-24

英特尔公布2025年三季度财报:营收137亿美元,同比增长3%

第三季度,英特尔公司从运营中产生了25亿美元的现金。

威斯康星大学最新研究:AI在"背书"时容易撒谎,LUMINA系统如何识破这些"花言巧语"

威斯康星大学最新研究:AI在"背书"时容易撒谎,LUMINA系统如何识破这些"花言巧语"

威斯康星大学研究团队开发了LUMINA系统,专门检测AI在回答问题时的"撒谎"行为。该系统发现AI有时会忽视提供的参考资料,固执地依赖内部知识生成不准确回答。LUMINA通过监测AI对外部文档和内部知识的依赖程度来识别这种行为,在多个测试中达到90%以上的准确率,比以往方法提升13%,为构建更可信的AI系统提供了重要工具。

当AI学会"思考":CentraleSupélec团队揭秘推理训练何时真正有效

当AI学会"思考":CentraleSupélec团队揭秘推理训练何时真正有效

这项由法国CentraleSupélec大学领导的研究通过严格控制的实验,系统比较了AI的推理训练与传统训练方式。研究发现推理训练在数学、开放式任务中效果显著,但需要70亿参数以上模型才能充分发挥优势,且成本增加明显。研究为AI开发者提供了明确的应用指导,有助于根据具体场景选择最优训练策略。

AI助手可以"量身定制"了?首个个性化深度研究系统评测基准在OPPO等机构诞生

AI助手可以"量身定制"了?首个个性化深度研究系统评测基准在OPPO等机构诞生

这项由OPPO等机构完成的研究首次建立了评估AI研究助手个性化能力的标准基准。研究团队构建了250个真实用户场景,开发了PQR三维评价框架,测试发现开源系统个性化能力更强,用户信息越详细AI表现越好,为推动AI从标准化服务向个性化伙伴转变提供了重要参考。

首个VLM个性化基准测试MMPB:让AI助手真正懂你——首尔大学团队揭秘视觉语言模型个性化难题

首个VLM个性化基准测试MMPB:让AI助手真正懂你——首尔大学团队揭秘视觉语言模型个性化难题

首尔大学团队首次构建了评估视觉语言模型个性化能力的综合基准MMPB,包含111个概念和超万个测试样本。研究发现即使先进AI模型在个性化任务上表现不佳,存在安全机制过度保守、视觉信息利用不足、长对话记忆丢失等问题。该研究为构建真正懂用户的AI助手指明了技术发展方向。

浙江大学团队打造数据分析神器:让AI像人类专家一样解读复杂数据

浙江大学团队打造数据分析神器:让AI像人类专家一样解读复杂数据

浙江大学和阿里巴巴集团联合开发的DATAMIND系统,通过创新的数据合成和训练方法,让AI具备了专业数据分析师的能力。该系统使用12,000个高质量训练样本,采用动态权重调整的混合训练策略,最终的DATAMIND-14B模型在多项测试中超越了GPT-5等商业模型,平均得分达71.16%。这项开源成果大大降低了数据分析的技术门槛,让普通用户也能获得专业级的数据洞察能力。

复旦大学团队突破语言模型瓶颈:让AI对话变得更快更聪明

复旦大学团队突破语言模型瓶颈:让AI对话变得更快更聪明

复旦大学团队针对掩码扩散语言模型提出三项关键技术:EOS早期拒绝解决句号陷阱问题,渐进式步长调度器将解码步骤从L/2降至log?L,一致性轨迹强化学习确保训练与实际运行的一致性。研究发现规划任务更适合并行解码而数学任务偏好顺序解码,为AI系统的任务特定优化提供新思路。

上海AI实验室团队打造"火眼金睛":让AI学会像人类专家一样验证科学答案的神奇本领

上海AI实验室团队打造"火眼金睛":让AI学会像人类专家一样验证科学答案的神奇本领

上海AI实验室研究团队开发出具备推理能力的科学答案验证模型SCI-Verifier,解决了AI无法准确验证科学答案等价形式的关键问题。该模型覆盖数学、物理、化学、生物五大领域,验证准确率达86.28%,与GPT-5相当。通过构建跨学科测试平台和两阶段训练策略,为AI科学应用的可靠性验证提供了重要突破,有望广泛应用于教育、科研和工业质控等领域。

南洋理工大学团队首创!让小模型在无线通信数学推理上"以小博大"的训练秘籍

南洋理工大学团队首创!让小模型在无线通信数学推理上"以小博大"的训练秘籍

南洋理工大学研究团队通过创新的GRPO强化学习方法,成功让70亿参数的小模型在无线通信数学推理上接近GPT-4o性能。他们构建了包含4027道题目的专业数据集,证明了专门化训练能够让小模型"以小博大",同时意外发现这种训练还能提升通用数学能力,为高效专业AI发展开辟新路径。

上海交通大学发布SQL翻译神器:PARROT帮你解决数据库之间的语言不通问题

上海交通大学发布SQL翻译神器:PARROT帮你解决数据库之间的语言不通问题

这项研究首次系统性地评估了大语言模型在跨数据库系统SQL翻译任务中的能力。研究团队构建了包含598个高质量翻译对的PARROT基准,涵盖22个主流数据库系统。实验结果显示,即使是最先进的AI模型,在SQL翻译任务上的准确率也仅为38.53%,远低于预期。研究识别出三类主要错误模式,并提供了多个评测变体和开源工具。

香港科技大学团队揭露AI写代码的惊人盲点:单个功能很厉害,组合起来就"翻车"

香港科技大学团队揭露AI写代码的惊人盲点:单个功能很厉害,组合起来就"翻车"

香港科技大学团队通过DAFNYCOMP基准测试发现,当前最先进的AI模型在编写单个功能时表现优秀(95.67%语法正确率),但在需要多个功能协调工作的复杂程序中却表现糟糕(仅3.69%验证成功率)。研究揭示了AI在组合推理方面的三大缺陷,为理解AI能力边界提供了重要见解。

西班牙法律文档秒变"人话":西班牙国立远程教育大学和挪威国家图书馆联手破解法律条文的"天书"难题

西班牙法律文档秒变"人话":西班牙国立远程教育大学和挪威国家图书馆联手破解法律条文的"天书"难题

西班牙国立远程教育大学联合挪威国家图书馆创建BOE-XSUM数据集,包含3648个西班牙法律文档的极简摘要,旨在将复杂法律条文转换为普通人可理解的语言。研究显示专门训练的小型模型在此任务上超越大型通用模型,为西班牙语自然语言处理和法律信息民主化提供重要突破,有望大幅提升法律透明度。

Aligned Data Centers部署"首创"数据中心电池储能项目

Aligned Data Centers部署"首创"数据中心电池储能项目

阿里纳德数据中心与Calibrant Energy合作开发首创电池储能系统,通过绕过传统电网升级时间线,使俄勒冈州希尔斯伯勒在建数据中心园区提前数年上线。该31兆瓦、62兆瓦时储能系统计划2026年投运,将作为响应电网的动态资产,在需求高峰期放电,增强区域电网可靠性。这标志着美国首次使用专用电池系统加速大型数据中心并网。

微软推出Edge浏览器Copilot模式挑战ChatGPT Atlas

微软推出Edge浏览器Copilot模式挑战ChatGPT Atlas

微软在Edge浏览器中推出增强版Copilot模式,提供更强大的AI代理功能,目前在美国进行限量预览。该模式包含Actions和Journeys两大功能:Actions让浏览器能代表用户执行任务,如语音控制打开网页或查找文章特定内容;Journeys则记住用户浏览历史,帮助用户继续之前的研究任务。此举正值AI浏览器竞争加剧,OpenAI推出ChatGPT Atlas、Perplexity发布Comet、谷歌集成Gemini到Chrome。目前Chrome占据71%市场份额,Edge仅占4.67%。

IBM与客户共谱AI长期发展蓝图

IBM与客户共谱AI长期发展蓝图

IBM正通过收购红帽和HashiCorp、为Power和z系统增加AI功能等方式,构建盈利能力强的AI产品服务组合。公司拥有超10万企业客户,将为其提供安全、熟悉的AI集成解决方案。IBM第三季度营收163.3亿美元,同比增长9.1%,净利润17.4亿美元。基础设施业务受益于Power11和z17升级周期,销售额增长17%。GenAI咨询订单增加15亿美元,占咨询积压订单的22%。

MIT实验室推出sAIpien项目:让董事会能够审计AI决策

MIT实验室推出sAIpien项目:让董事会能够审计AI决策

MIT媒体实验室推出可扩展AI智能网络演进项目(SAIpien),专注于可审计的人机交互系统。该项目将负责任AI从政策讨论转化为工程学科,连接用户体验标准与可追溯的治理机制。通过数字孪生、原型开发和跨领域设计,SAIpien为医院、城市和企业提供可检查、可适应的AI决策系统,填补了AI治理与实际部署之间的关键空白。

AI道德记分卡如何建立人工智能系统信任

AI道德记分卡如何建立人工智能系统信任

随着机器学习和大语言模型在企业中的广泛应用,AI系统的数据来源和使用方式日益受到关注。企业开始为客户提供详细的伦理评分卡,记录模型训练数据的来源、处理方式和使用情况。这些评分卡帮助组织建立客户信任,确保合规性并降低法律风险。评分卡涵盖数据溯源、可解释性、模型局限性、潜在偏见和隐私保护等关键要素,成为AI产品选择和监管合规的重要工具。

Twitch推出AI工具助力主播触达更大受众

Twitch推出AI工具助力主播触达更大受众

亚马逊旗下直播平台Twitch在TwitchCon 2025大会上发布多项AI功能。其中Auto Clip功能可帮助主播快速剪辑多小时直播中的精彩片段,便于分享到TikTok等短视频平台。平台还将集成Meta的AI智能眼镜,支持直接通过眼镜进行直播。尽管AI工具成本高昂,但Twitch认为这能帮助75%不制作剪辑的主播提升内容创作效率,扩大粉丝群体。