Inception Labs 于周四发布了 Mercury Coder,这是一种新的 AI 语言模型,利用扩散技术比传统模型更快地生成文本。与逐字生成文本的传统模型(如 ChatGPT)不同,基于扩散的模型(如 Mercury)能够同时生成完整的响应,并将其从最初的遮蔽状态逐步精炼为连贯的文本。
微软终于将其 AI 助手 Copilot 作为独立应用程序推出 macOS 版本。这款免费应用现已在 Mac App Store 上线,支持多种功能如文本翻译、问题解答、文档生成等。Copilot 采用 OpenAI 的 GPT-4 和 DALL-E 3 等模型,标志着微软在 AI 领域的重要布局。该应用要求 M1 或更新的 Mac 设备,以及 macOS 14 或更高版本。
OpenAI 发布 ChatGPT 4.5 预览版,承诺对话更自然、情感智能更强、知识面更广。新模型能更好理解语境和细微差别,创造力和协作能力提升,幻觉现象减少。这一升级体现了 AI 向着匹敌甚至超越人类能力的目标迈进,为未来更强大的 GPT-5 奠定基础。
Figure 公司宣布将于 2025 年底开始在家庭环境中进行 Figure 02 人形机器人的"Alpha 测试"。这一加速计划得益于公司自主研发的 Helix 视觉-语言-行动模型。尽管家庭环境复杂多变,但 Figure 仍决定优先发展家用机器人,以应对人口老龄化等社会问题。
Nvidia在人工智能(AI)数据中心的主导地位持续巩固,最新季度财报显示收入增长16%,与去年同期相比增长93%。该公司的数据中心业务季度收入为356亿美元,全年收入为1150亿美元,同比增长142%。Nvidia首席执行官黄仁勋表示,推理AI将推动对Blackwell的需求,认为新AI模型将进一步提升计算需求。尽管云服务提供商(CSP)正在开发定制芯片以优化AI工作负载,但他认为Nvidia的GPU仍将长期受益于企业客户的增长。
TikTok 计划关闭其创作者市场,转而推出更全面的 TikTok One 平台。新平台将继续连接品牌与创作者,并提供 AI 驱动的创意工具,如 Symphony 创意工作室和 AI 助手。这一转变旨在为广告商和创作者提供更强大的功能,包括趋势分析、视频生成和脚本创作等,以适应 TikTok 的原生风格。
腾讯推出新AI模型"混元Turbo S",定位为"快思考模型",旨在与DeepSeek-R1等"慢思考模型"竞争。该模型通过提高输出速度和减少首字延迟,实现近乎"即时回复"。混元Turbo S融合了直觉式短思考链和理性推理长思考链,在数学、推理和知识等方面表现可比肩主流AI模型。腾讯采用混合Mamba-Transformer架构,提高效率并降低成本,有望成为未来基础模型的核心。
最新泄露的 iPhone 17 系列 CAD 图纸揭示了一致的设计特征。标准版 iPhone 17 可能仅进行内部升级,而 Pro 和 Pro Max 型号将采用扩大的摄像头凸起设计。此外,一款全新的超薄 iPhone 17 Air 可能加入产品线,提供更大屏幕但价格低于 Pro Max。这些设计变化引发了人们对苹果创新方向的猜测和讨论。
OpenAI 今日推出最新最大的 AI 语言模型 GPT-4.5。该模型将首先向 ChatGPT Pro 用户提供研究预览。虽然 OpenAI 称其为"最具知识性的模型",但也警告 GPT-4.5 并非前沿模型,可能无法超越 o1 或 o3-mini 的表现。GPT-4.5 在写作、知识储备和个性方面有所提升,但不会引入足够的新功能被视为前沿模型。
在全球数字化转型的浪潮中,数据已成为推动经济发展和管理效率提升的核心驱动力。作为数据、分析和人工智能领域的领先混合平台,Cloudera为云和本地环境提供了基于Apache Iceberg的开放式数据湖仓一体架构。
Just Move In 是一家英国初创公司,专注于家庭服务设置,最近获得了由 Eos Ventures 领投的 800 万美元 A 轮融资。该公司旨在简化家庭搬迁过程中的各种服务连接,预计到 2025 年将处理超过 40 万次搬迁。通过整合多项服务,Just Move In 为用户提供了一个便捷的管理平台,节省了大量时间,并且该服务是免费的。
Taktile 是一家创新型初创公司,致力于简化金融决策逻辑的修改过程。该平台允许金融科技公司的风险和工程团队创建和管理自动化决策工作流,用户可以进行数据集成实验、监控预测模型性能,并执行 A/B 测试。Taktile 的客户群不断扩大,最近完成了 5400 万美元的 B 轮融资,将用于产品开发和企业销售团队建设。
安全研究人员警告称,即使数据在互联网上暴露的时间很短,仍可能在像 Microsoft Copilot 这样的在线生成 AI 聊天机器人中长期存在。
研究人员发现了一种方法,可以将任何设备变成"AirTag",让黑客远程追踪设备位置。这个名为"nRootTag"的漏洞利用了苹果"查找"网络的工作原理,成功率高达90%。研究人员已通知苹果公司,但修复可能需要数年时间。为保护隐私,用户应谨慎授予蓝牙权限并及时更新设备。
Hugging Face 推出开源 Python 库 FastRTC,旨在简化实时音视频 AI 应用的开发过程。该库可自动处理复杂的实时通信功能,使开发者能够用少量代码快速构建语音和视频 AI 功能。这一工具有望加速语音优先和视频增强型 AI 体验的普及,为用户带来更自然的交互界面。
智能AI是去年生成式AI领域的重大突破技术,今年企业将大规模部署这些系统。但整合智能AI与现有系统存在诸多挑战,包括基础设施现代化、数据集成、安全合规等。IT领导者需要谨慎考虑这些问题,以确保成功部署智能AI系统。
ElevenLabs是一家刚刚完成1.8亿美元融资的人工智能初创公司,主要以其音频生成能力而闻名。该公司通过推出首个独立的语音转文本模型Scribe,迈出了另一个技术方向。该初创公司估值为33亿美元,已帮助许多其他公司提供语音转文本服务,利用其庞大的声音库。然而,该公司现在希望进入语音检测领域,与Gladia、Speechmatics、AssemblyAI、Deepgram和OpenAI的Whisper模型竞争。