Google 推出最新的 Gemini 2.5 Pro (实验版) AI 模型,并以罕见的速度向免费用户开放。该模型支持模拟推理,提高了准确性,并在 LMSYS 聊天机器人竞技场排行榜上名列前茅。免费用户可在网页上试用,但有使用限制,无法上传文件,且有未明确的token和使用次数限制。
Gartner 预测,大语言模型 (LLM) 提供商市场即将进入"灭绝"阶段。在竞争激烈的环境下,巨额资本投入成为主要挑战。预计到 2025 年,全球生成式 AI 支出将达到 6440 亿美元,较 2024 年增长 76%。专家认为,LLM 市场将经历类似云计算市场的整合,最终可能只剩少数几家主导者。
苹果公司推出新一代 AI 智能服务 Apple Intelligence,包括优先通知等多项功能。该服务现已覆盖欧盟用户和 Vision Pro 设备,并支持多种语言。新功能随 iOS 18.4 等系统更新推出,涵盖通知管理、图像生成和视频创作等方面,进一步提升用户体验。
OpenAI计划今年晚些时候向开发者社区发布一个"开放权重"模型,这是该公司自2019年以来的首次尝试。新模型将具备推理能力,类似于现有的o3-mini模型。这一战略转变旨在应对来自竞争对手的压力,同时为开发者提供更多定制和使用灵活性。虽然不完全开源,但这种方式可能有助于OpenAI在保持技术领先的同时,满足市场对更开放AI发展的需求。
OpenAI 正在开发一款新的"开放权重"AI 语言模型,具有推理能力。这种模型介于开源和闭源之间,允许用户查看和修改模型的权重,但不公开底层代码。它可能与 Meta 的 Llama 等开源模型竞争,为企业提供更经济、可定制的 AI 工具。OpenAI 目前正征集开发者反馈,以提高模型的实用性。
3月27日-28日,“聚合生态发展,共赢智算辽宁”主题媒体探访活动在沈阳举办,二十余家全国主流媒体深入沈阳多地,实地探访AI基础设施、大模型应用、智能制造等领域的创新实践,解码辽沈大地高质量发展的科技路径。
Retym Inc. 是一家专注于云计算和人工智能数据中心连接半导体技术的公司,近日宣布正式成立。该公司同时获得由 Spark Capital 领投的 7500 万美元 D 轮融资,总融资额超过 1.8 亿美元。Retym 主要开发用于云数据中心和 AI 基础设施的可编程相干数字信号处理解决方案,旨在提高数据中心内外的高速数据传输能力,以满足日益增长的 AI 工作负载需求。
Runway AI公司推出了迄今为止最先进的AI视频生成模型Gen-4,实现了多镜头间角色和场景的一致性,这是之前大多数AI视频生成器无法做到的。该模型可生成720p分辨率的5-10秒视频片段,并计划本周推出更多功能。这一突破可能彻底改变电影制作流程,引发了对版权和就业的讨论,也为创作者带来了新的机遇和挑战。
IBM迅速确立了其作为企业AI领域重要竞争者的地位。该公司采用全栈平台策略,结合专有模型、与Red Hat混合云基础设施的深度整合以及全球咨询规模优势,执行多管齐下的方法,已经在运营效率和财务收益方面取得显著成效。IBM的AI相关业务在不到两年时间内增长至50亿美元,其中约80%来自咨询业务,20%来自软件订阅。
AI 正在改变教育领域。本文探讨了 AI 如何改变教学和学习方式,包括使用 AI 克隆教师、用对话代替测验、个性化反馈等创新方法。作者强调,AI 是一种工具,关键在于如何有效使用它来扩大教育影响力,培养学生的批判性思维能力。未来的教育将更注重推理、理解和创新思维,而不是简单的记忆。
Amazon 推出了一款名为 Nova Act 的新型 AI 代理,能够控制网页浏览器并执行独立操作。这项技术由 Amazon AGI 旧金山实验室开发,该实验室此前发布了 Amazon Nova 基础模型。Nova Act 可以完成基本的浏览器任务,如点击按钮和填写表单。Amazon 还扩大了 Nova Act SDK 的访问范围,允许开发者构建能够将复杂指令分解为一系列可执行操作的代理。这一举措与其他科技巨头开发类似 AI 解决方案的趋势相呼应。
Sourcetable 公司推出首个人工智能驱动的电子表格,旨在让每个办公室员工都能进行数据分析。该公司获得 430 万美元融资,由 Bee Partners 领投,将彻底改变办公方式。Sourcetable 通过自然语言交互,使普通用户也能完成复杂的电子表格任务,如创建财务模型、数据清理和分析等,无需高级技能。这项技术有望让更多人受益于数据分析,推动办公效率的新时代。
Nvidia首席执行官黄仁勋在GTC大会上公布了未来三代GPU技术路线图,揭示了计算能力提升面临的巨大挑战。从芯片制程到散热和供电,Nvidia正通过增加硅片数量、提高封装密度等方式来突破摩尔定律的限制。这些努力也反映出当前AI计算发展所面临的瓶颈,以及未来数据中心设计的发展方向。
Amazon 发布了名为 Nova Act 的通用 AI 代理,可独立控制网页浏览器执行简单操作。同时推出 Nova Act SDK,供开发者构建原型。Nova Act 将为即将升级的 Alexa+ 提供核心功能。Amazon 称这是研究预览版,开发者可通过 nova.amazon.com 访问工具包。Nova Act 在内部测试中表现优异,是 Amazon AGI 实验室的首个公开产品。
aiOla 推出了一款名为 Jargonic 的新型自动语音识别模型,专为企业使用而设计。这个模型能够处理专业术语、背景噪音和各种口音,无需大量再训练或微调。Jargonic 采用独特的关键词识别系统,可以零样本适应企业特定词汇。在多项基准测试中,Jargonic 在准确性和专业术语识别方面都优于主要竞争对手。这款模型现已通过 API 向企业客户开放使用。
AI 视频创业公司 Runway 发布了最新的 Gen-4 视频合成模型,声称解决了 AI 视频生成的几个关键问题。该模型能够在不同场景中保持人物和物体的一致性,并允许从多个角度拍摄同一环境或主题。这一突破性进展有望为创意专业人士提供更实用的 AI 视频制作工具。
OpenAI 推出的 4o 图像生成器引发了一场 AI 动画热潮。这一发展不仅展示了 AI 辅助视觉创作的能力和局限性,还引发了版权问题的讨论。与之前主要聚焦于艺术诠释和风格转换的 Dall.E 模型不同,4o 图像生成器似乎旨在解决特定的专业痛点,尤其是在文本渲染和多图像一致性方面。随着各大 AI 平台开发出各自的专长,这一领域变得日益拥挤,同时也揭示了生成式 AI 的进展和持续挑战。
随着人工智能技术的发展,深度伪造内容在网络上大量涌现,可能对我们的健康造成潜在威胁。从虚假名人代言到有害的AI生成医疗建议,深度伪造正在助长一波危险的虚假信息浪潮。本文探讨了深度伪造在医疗保健领域的负面影响,以及如何在这个充满虚假信息的时代保护自己的健康。
INCYMO.AI 推出了一个革新性的 AI 驱动创意平台,专注于移动游戏广告制作。该平台基于 10 万多个市场验证广告的数据分析,通过 AI 技术为游戏营销人员提供创意构思和广告生成服务。在创意疲劳、用户获取成本上升和隐私限制的当前环境下,该平台为游戏营销开辟了一条数据驱动的全新道路。