Google 将 Veo 2 AI 视频生成模型引入其 Gemini Advanced 订阅服务,用户可生成 8 秒、720p 分辨率的视频并方便分享;未来还计划结合 DeepMind 的 AI 模型优化对真实世界的理解。
AI视频生成公司Runway宣布完成3.08亿美元融资,由General Atlantic领投,估值超30亿美元。公司刚发布新一代视频生成模型Gen-4,可生成长达10秒的视频片段。Runway计划利用新资金加强AI开发,重点提升训练数据集质量和扩展扩散模型与大语言模型能力。
Runway AI公司推出了迄今为止最先进的AI视频生成模型Gen-4,实现了多镜头间角色和场景的一致性,这是之前大多数AI视频生成器无法做到的。该模型可生成720p分辨率的5-10秒视频片段,并计划本周推出更多功能。这一突破可能彻底改变电影制作流程,引发了对版权和就业的讨论,也为创作者带来了新的机遇和挑战。
AI 视频创业公司 Runway 发布了最新的 Gen-4 视频合成模型,声称解决了 AI 视频生成的几个关键问题。该模型能够在不同场景中保持人物和物体的一致性,并允许从多个角度拍摄同一环境或主题。这一突破性进展有望为创意专业人士提供更实用的 AI 视频制作工具。
Moonvalley 公司推出 Marey,这是一款专为好莱坞影视制作和品牌营销设计的 AI 视频生成模型。与其他使用网络抓取数据的模型不同,Marey 仅使用完全授权的数据进行训练,为影视行业提供了一个无版权争议的 AI 视频创作选择。该模型具备高清视频生成、长视频制作、分层编辑等多项先进功能,旨在辅助而非取代专业创作者。
Google 即将为 Gemini 聊天机器人推出 AI 视频创作功能,用户可通过文字描述生成短视频。最新泄露信息显示,该功能代号为"Toucan",生成每个视频需 1-2 分钟,可能会限制每日生成数量。这表明 Google 可能会为付费用户提供更多权限,或采用信用购买制。虽然 Google 尚未正式宣布,但开发持续进行,有望近期推出。
Tavus Inc.是一家人工智能研究初创公司,专注于开发能够模拟与他人对话体验的实时AI技术。今天,该公司宣布推出一系列突破性的AI模型,旨在构建人机互动的操作系统,通过“对话视频界面”使AI能够自然地感知、理解和回应。Tavus的使命是让AI理解面部表情、语调和肢体语言,并能够用自己的表情和语调做出反应。
阿里云开源了其视频基础模型系列,为企业和研究人员提供视频创作能力。这包括两个版本的四个模型,分别拥有140亿和13亿参数。这些模型可以从文本和图像输入生成高质量视频,支持中英文文本效果,并在视频生成模型基准测试中表现出色。此举旨在降低AI应用门槛,让更多企业能够创建高质量视觉内容。
Guidde 是一家创新型初创公司,利用人工智能技术自动生成软件应用培训视频。该平台通过捕捉用户操作,将其转化为带有"故事线"的视频,并提供 AI 配音、背景音乐等功能。Guidde 还推出了个性化内容推荐功能,旨在提高企业软件培训的参与度和效果。目前该公司已获得 3000 万美元融资,服务超过 10 万用户。
Adobe 推出新的 AI 视频生成模型 Firefly,进军生成式 AI 领域。该模型仅使用授权内容训练,可安全用于商业项目,是 Adobe 为专业创作者提供可靠 AI 工具的重要一步。新功能将通过 Firefly 网页应用和 Premiere Pro 软件提供,可根据文本或图像生成 1080P 视频片段。
YouTube 推出新的生成式 AI 视频功能,创作者可在制作 Shorts 时使用。该功能集成了 Google 的 Veo 2 视频模型,允许用户生成独立视频片段并添加到 Shorts 中。这项功能将为创作者提供更多创意选择,但同时也引发了对 AI 生成内容真实性的讨论。
Adobe 发布 Firefly 视频模型公测版,推出业界首个商业安全的 AI 视频生成模型。新模型可在 Firefly 应用和 Premiere Pro 中使用,能生成可直接用于生产的无版权视频内容。Adobe 还推出了 Firefly 标准版和专业版计划,提供灵活的使用额度和新的音频、视频功能。
数字人和虚拟人等概念和产品屡见不鲜,司马华鹏向大模型之家透露,硅基智能自成立之初就将视频生成作为公司的重要目标,尤其是将生成人物形象作为战略规划的核心。得益于人工智能技术的不断进步,硅基智能在数字人直播、数字人短视频和数字人克隆等领域取得了显著的市场份额,成为这些领域的领先企业之一。