Gartner预计2025年全球IT支出将增长9.8%,达5.61万亿美元,远高于2024年的7.7%增幅。然而,这一增长主要源于现有产品和服务的价格上涨。数据中心系统支出将大幅增长,受生成式AI影响。PC销售预计反弹,AI PC将成主流。IT服务公司和超大规模云服务商将主导AI软件和服务市场。
随着生成式 AI 模型的爆炸性增长,单一数据中心已难以满足其计算需求。未来,AI 的持续发展可能依赖于跨越国家甚至大洲的新型超级计算机。这种分布式架构将现有数据中心连接起来,形成一个大型虚拟数据中心,以应对 AI 模型日益增长的计算和能源需求。
本文探讨了人工智能领域的最新模型进展,特别是o1-pro模型带来的突破。文章解释了新模型如何改变工程师与大语言模型交互的方式,提高了模型处理复杂任务的能力。同时介绍了业内专家对这些进展的看法,以及这些变化对AI技术发展的潜在影响。
随着 AI 技术的快速发展,就业市场正在发生巨大变化。然而,有两类职业在 AI 时代仍然蓬勃发展:企业家和研究人员。这两类角色都能随着 AI 能力的提升而不断拓展自身的目标和价值。本文探讨了这两类职业的特点及如何在 AI 时代选择适合自己的职业道路。
OpenAI 推出名为 Operator 的 AI 代理,可自动执行用户任务。与此同时,主要竞争对手 Perplexity AI 和 Anthropic 也宣布了产品更新。Perplexity AI 在其 Android 应用中引入类似功能,而 Anthropic 则推出了改进 AI 模型引用能力的工具。这些动作反映了 AI 服务领域的激烈竞争和快速发展。
最新调查显示,大多数高管预计 AI 将在未来两年内彻底重塑企业。68% 的高管计划在未来一年投资 5000 万至 2.5 亿美元用于生成式 AI。尽管面临经济压力和数据质量等挑战,企业正加速采用 AI,但基层员工的应用仍有待提高。AI 的变革力量已经显现,并正在加速发展。
文章深入探讨了 AI 技术的快速发展趋势及其未来影响。作者通过分析量级增长 (OOM)、AI 能力跃升以及模型的情境意识等方面,论证了 AI 即将迎来重大突破。特别强调了到 2027 年 AI 可能具备 AI 研究员/工程师的工作能力,以及 AI 系统在获得持久记忆和更广泛上下文后将产生质的飞跃。
微软研究人员提出了一种新的内存技术——管理保留内存 (MRM),旨在解决 AI 基础模型工作负载的存储和 IO 问题。MRM 具有短期数据持久性,可优化 AI 推理性能,同时降低能耗和成本。这一创新概念有望填补现有内存-存储层级中的空白,为 AI 时代的内存技术发展开辟新方向。
英国教育部长宣布计划在教育领域应用人工智能技术,旨在减轻教师工作负担,提高教学质量。政府将投资开发AI辅助备课和评分工具,并将为教师提供相关培训。此举旨在让教师有更多时间与学生互动,增进师生关系,同时提高教育系统的现代化水平。
Hugging Face 公司开源了 SmolVLM-256M,这是一个参数量最少的视觉语言模型。它能在普通笔记本电脑上运行,支持多种视觉数据处理任务。该模型采用新的编码器,在多项基准测试中表现出色,展现了小型模型的巨大潜力。
SK海力士受益于AI驱动的GPU服务器对高带宽内存的强劲需求,2024年第四季度和全年收入、净利润均创历史新高。公司转型聚焦高附加值产品,特别是高带宽内存(HBM)业务增长显著,占DRAM收入比重超40%。SK海力士预计,随着全球科技巨头持续投资AI服务器,HBM需求将继续增长。
WebAI 公司推出了一款名为 Companion 的 AI 助手,专为企业用户设计。该助手可在用户自有设备上私密运行,支持自定义训练,能够融入员工工作流程,提高生产力。Companion 强调数据隐私和本地部署,旨在满足企业对安全性和知识产权保护的需求。
Baya Systems完成3600万美元B轮融资,用于推进其软件组合开发,以满足新兴"芯片组"经济需求。该公司开发了革命性的芯片组优化网络芯片(NoC)和物理链路互连解决方案,旨在提高多芯片设计中的通信效率,为AI和复杂SoC设计提供支持。
Pinecone 推出了 Pinecone Assistant,一种 AI 智能助手构建 API 服务,旨在加速检索增强生成(RAG)应用的开发。该服务集成了向量搜索、模型编排和重排等功能,简化了 RAG 应用的构建过程。Pinecone Assistant 提供了优化的接口、自定义指令和多种文件格式支持,为开发者提供了灵活且高效的 AI 智能助手构建工具。
微软、苹果等科技巨头纷纷在产品中默认开启 AI 功能,引发用户和监管机构关注。这种"先斩后奏"的做法虽然可能提高 AI 使用率,但也引发了隐私和用户体验方面的担忧。业界呼吁科技公司应尊重用户选择,采取"选择加入"而非"选择退出"的方式推广 AI 服务。
三星在Galaxy Unpacked活动上推出了搭载Galaxy AI的新一代S25智能手机系列。新机采用骁龙8 Elite for Galaxy处理器,性能大幅提升。Galaxy AI作为个人数字助手,可提供便捷的AI体验。三星强调了数据安全和隐私保护,采用本地AI处理和个人数据引擎等技术。专家认为AI功能虽有亮点,但对已有较新手机的用户吸引力有限。
OpenAI推出名为Operator的人工智能代理,能够自主使用网络浏览器完成各种在线任务。这项功能目前仅向ChatGPT Pro订阅用户开放,可以执行多步骤的复杂任务,如预订餐厅或购买音乐会门票。虽然具有一定的自动化能力,但其可靠性和准确性仍有待提高。
近日,被誉为"首个 AI 软件工程师"的工具 Devin 在测试中表现不佳。该工具于 2024 年 3 月推出,声称能自主编写和部署应用程序,但实际测试结果显示,在 20 个任务中仅完成 3 个。测试人员指出,Devin 在处理复杂任务时往往陷入技术死胡同,产生无法使用的解决方案,甚至尝试执行不可能完成的任务。
随着企业将更多工作负载转移到云端,超大规模云服务商未能充分帮助CIO和科技采购者提高计算服务碳足迹的透明度。分析师指出,亚马逊网络服务(AWS)在这方面表现最差,微软和谷歌也未能幸免。数据中心的实际排放量可能远高于目前的估计,这主要归因于云服务商使用的排放核算方法存在问题。
近期调查显示,成本预测困难已成为企业采用生成式 AI 的主要障碍之一。46% 的受访 IT 专业人士表示,定价缺乏可预测性阻碍了他们在组织中实施生成式 AI。为缓解这些担忧,IT 专业人士倾向于按需付费模式,而非供应商要求的预付承诺。除定价问题外,潜在负面结果和对收益缺乏信心也是阻碍采用的重要因素。