计算机视觉 关键字列表
Google 推出 Gemini 实时 AI 视频功能

Google 推出 Gemini 实时 AI 视频功能

Google 正式向用户推出 Gemini Live 的新 AI 功能,让用户能够通过手机屏幕或摄像头实时与 AI 进行交互。这项源自 "Project Astra" 的技术,可以实时解读视频内容并回答相关问题。目前该功能已向 Google One AI Premium 计划的 Gemini Advanced 订阅用户开放,展现了 Google 在 AI 助手领域的领先地位。

这款应用通过让你真的去触摸草地来限制你的屏幕使用时间

这款应用通过让你真的去触摸草地来限制你的屏幕使用时间

一款名为 "Touch Grass" 的 iOS 应用采用独特方式限制用户使用手机:用户必须走到户外拍摄真实的草地照片,才能解锁受限应用。该应用使用计算机视觉 AI 技术识别真实草地,防止用户使用室内植物作弊。这个既幽默又实用的应用程序,旨在帮助人们减少屏幕使用时间,培养更健康的生活方式。

Nvidia 推出 Cosmos-Transfer1,让机器人训练超乎寻常地真实 - 这将改变一切

Nvidia 推出 Cosmos-Transfer1,让机器人训练超乎寻常地真实 - 这将改变一切

Nvidia 发布了 Cosmos-Transfer1 人工智能模型,可生成高度逼真的仿真环境,用于训练机器人和自动驾驶汽车。该模型采用自适应多模态控制系统,能更精细地控制生成环境,显著提高仿真度和实用性。它解决了物理 AI 开发中模拟训练与现实应用之间的差距,为机器人和自动驾驶技术的发展带来重大突破。

AI 能否担任花样滑冰裁判?

AI 能否担任花样滑冰裁判?

人工智能正在改变体育运动的评判方式。在花样滑冰中,AI可以通过卷积神经网络和姿态估计等技术,精确分析运动员的动作和团队配合。这不仅有助于减少人为偏见,提高评分的公平性,还可以用于教练指导和自我反馈。尽管面临数据稀缺等挑战,但AI在花样滑冰等体育项目中的应用前景广阔。

Snap 推出基于自研生成模型的 AI 视频滤镜

Snap 推出基于自研生成模型的 AI 视频滤镜

Snapchat 首次推出由自研生成视频模型驱动的 AI 视频滤镜。这三款新滤镜仅向付费用户开放,每月订阅费 15.99 美元。Snap 此举旨在保持竞争力,为用户提供独特功能。公司计划每周增加新滤镜,目前包括"浣熊"、"狐狸"和"春花"三款。用户可通过镜头轮盘访问并保存生成的 AI 视频。

简单贴纸就能迷惑自动驾驶汽车,最新研究显示

研究人员发现,廉价的贴纸可以有效欺骗自动驾驶汽车的交通标志识别系统。他们还发现这些系统会"记忆"标志位置,即使标志被遮挡也会假定其存在,导致攻击成功率低于预期。研究人员测试了多种攻击方法,包括使标志"消失"或制造虚假标志。这项研究填补了商业自动驾驶系统漏洞研究的空白,为提高系统安全性提供了重要信息。

Tavus 推出系列 AI 模型,实现实时人脸交互技术突破

Tavus 推出系列 AI 模型,实现实时人脸交互技术突破

Tavus Inc.是一家人工智能研究初创公司,专注于开发能够模拟与他人对话体验的实时AI技术。今天,该公司宣布推出一系列突破性的AI模型,旨在构建人机互动的操作系统,通过“对话视频界面”使AI能够自然地感知、理解和回应。Tavus的使命是让AI理解面部表情、语调和肢体语言,并能够用自己的表情和语调做出反应。

两位前谷歌软件工程师,用AI改写黑夜成像规则

两位前谷歌软件工程师,用AI改写黑夜成像规则

“现在我们可以在黑暗中看到世界上的一切。”

这家AI初创公司承诺可以从家庭安防视频中抹除人物身影及更多功能

这家AI初创公司承诺可以从家庭安防视频中抹除人物身影及更多功能

Prompt AI公司推出的Seemour平台为家庭安防摄像头带来了前所未有的AI功能。除了常见的物体识别和动作分析外,它还能学习识别宠物名字、识别特定个人并从视频中移除他们,以及回答问题如"我的钥匙放哪了?"等。这些创新功能将家庭安防AI推向了新的高度,但也需要用户对这家初创公司给予足够的信任。

Nvidia 推出新型 AI 工具助力手语学习

Nvidia 推出新型 AI 工具助力手语学习

Nvidia 推出了一款名为 Signs 的创新 AI 工具,旨在帮助人们学习美国手语 (ASL)。该平台提供手语词汇库、3D 虚拟教师和实时反馈功能,用户可以通过网络摄像头获得签名评估。Nvidia 计划扩展词汇库并开放数据集,以促进无障碍 AI 工具的开发,为听障儿童家庭提供早期沟通渠道。

UVeye 利用 AI 实现汽车驾驶检测服务,获得 1.91 亿美元融资

UVeye 利用 AI 实现汽车驾驶检测服务,获得 1.91 亿美元融资

UVeye开发了一种基于人工智能的智能车辆检测系统,可在几秒内检测车辆外部和机械故障。该公司最近完成1.91亿美元D轮融资,由丰田汽车旗下Woven Capital领投。UVeye计划利用这笔资金扩大全球系统部署,提高制造能力,并建立更多战略合作伙伴关系。

OpenAI 推出 Operator 代理:自动化网络任务的新尝试

OpenAI 推出 Operator 代理:自动化网络任务的新尝试

OpenAI推出名为Operator的人工智能代理,能够自主使用网络浏览器完成各种在线任务。这项功能目前仅向ChatGPT Pro订阅用户开放,可以执行多步骤的复杂任务,如预订餐厅或购买音乐会门票。虽然具有一定的自动化能力,但其可靠性和准确性仍有待提高。

TikTok 生死时刻,Meta 远离事实,ChatGPT 新增任务功能

TikTok 生死时刻,Meta 远离事实,ChatGPT 新增任务功能

本周科技圈风云激荡:TikTok 面临美国最高法院裁决,或将被迫停运;Meta 在美国终止事实核查,引发争议;ChatGPT 推出全新任务功能,为用户提供智能日程管理;Beat Saber 在 Quest 平台销量突破千万,AI 电影制作技术展现惊人潜力。

一手实测豆包新发布的视觉理解大模型,他们真的卷起飞了。

一手实测豆包新发布的视觉理解大模型,他们真的卷起飞了。

当你来到这个世界睁开眼睛的第一刻,没有学会语言的时候,靠的就是你的眼睛。 我们先看到光影、颜色,才逐渐分辨出父母的面孔,屋子的空间,那时没有词汇、没有句子,只有模糊的光影与轮廓。

2023-09-25

PROPHESEE推出事件视觉评估套件EVK5,搭载与索尼合作开发的传感器IMX646 HD

领先的神经拟态视觉传感公司普诺飞思(Prophesee)今日宣布推出高速、经济高效且紧凑的评估套件(EVK),以满足计算机视觉开发人员想要基于堆栈式事件视觉传感器IMX646 HD开发应用的需求。

AI和计算机视觉加速自助结账

中科英泰智能称重解决方案采用英特尔处理器打造,能够以低功耗提供强大的计算性能、安全性和可靠性。这些能力对于运行边缘人工智能工作负载至关重要。该系统还使用英特尔OpenVINO工具套件来帮助优化图像识别应用程序。

2021-06-03

ICCV 2021 挑战赛及论文招募 | 美团主办 LargeFineFoodAI 研讨会,聚焦食品视觉领域前沿

2021年10月11-17日,两年一度的计算机视觉领域顶级学术会议 ICCV (International Conference on Computer Vision) 将在加拿大蒙特利尔召开。

英特尔积极赋能计算机视觉开发者 软硬结合提供全面新体验

近日,由深圳极视角科技有限公司主办、英特尔提供战略支持的“CV 101-计算机视觉青年开发者技术与应用大会暨榜单活动颁奖典礼”在深圳圆满落幕。

计算机视觉这只“蝴蝶”能否引起智能应用大爆发?

计算机视觉这只“蝴蝶”能否引起智能应用大爆发?

以Windows系统为代表的操作系统,让人们进入PC时代;以苹果OS和安卓为代表的移动操作系统让人们进入移动互联时代;那么智能时代肯定也必须出现一种或多种智能操作系统来满足智能时代的需求

英特尔OpenVINO工具包实现网络边缘的计算机视觉

英特尔OpenVINO工具包实现网络边缘的计算机视觉

英特尔正在加紧推进人工智能,并发布了一个新的工具包,让开发人员能够在网络边缘部署计算机视觉,以用于摄像头和物联网设备。