计算机视觉文章列表第1页-至顶网频道 - 至顶网

/

计算机视觉关键字列表

Google Maps 新推人工智能工具可助改善道路拥堵问题

人工智能

计算机视觉

智慧城市

2025-04-14

Google Maps 新推人工智能工具可助改善道路拥堵问题

Google 在其年度云计算大会上推出了多项 AI 驱动的 Google Maps 新功能，旨在帮助企业和城市改善道路状况、管理交通拥堵并了解当地趋势。这些工具包括利用 AI 识别基础设施、分析地理趋势和管理道路交通等功能，有望为决策者提供更全面的数据支持，提高城市管理和商业决策的效率。

Copilot Vision 更新：Microsoft 让 AI 助手能"看见"你的屏幕和应用程序

人工智能

计算机视觉

AI 辅助功能

2025-04-10

Copilot Vision 更新：Microsoft 让 AI 助手能"看见"你的屏幕和应用程序

Microsoft 正在测试 Windows 版 Copilot 应用的新更新，允许用户与 AI 助手共享屏幕或应用。Copilot Vision 原本仅限于 Edge 浏览器，现在扩展到 PC 上的所有应用。它可以指导用户使用 Photoshop 功能，分析照片和网页。新功能还包括文件搜索，支持多种文件格式。这些功能将在未来几周或几个月内向所有 Windows 11 用户推出。

Gemini Live 不仅仅是会对话的 AI，它现在有了"眼睛"。我亲自体验了一下

人工智能

计算机视觉

实时识别

2025-04-09

Gemini Live 不仅仅是会对话的 AI，它现在有了"眼睛"。我亲自体验了一下

Google 推出的 Gemini Live 不仅能进行对话,还能通过摄像头识别物体。这项功能可以帮助用户在日常生活中获取更多信息,如识别艺术品、导航等。它比简单的图像识别更强大,能与用户进行自然对话。目前该功能已开始在部分手机上推出,有望改变我们与周围世界互动的方式。

微软将 Copilot Vision 引入 Windows 和移动设备，为现实世界提供 AI 辅助

人工智能

计算机视觉

实时分析

2025-04-07

微软将 Copilot Vision 引入 Windows 和移动设备，为现实世界提供 AI 辅助

微软将 Copilot Vision 功能扩展至 Windows 和移动设备，超越网页应用范畴。用户可通过移动设备摄像头实时分析视频，获得植物护理和家居装饰建议。Windows 版本即将推出，支持全系统 AI 辅助，如指导 Photoshop 操作和分析照片、网页等。此次更新还包括记忆、个性化、网络操作和播客创建等多项新功能。

Google 推出 Gemini 实时 AI 视频功能

人工智能

计算机视觉

实时交互

2025-03-25

Google 推出 Gemini 实时 AI 视频功能

Google 正式向用户推出 Gemini Live 的新 AI 功能，让用户能够通过手机屏幕或摄像头实时与 AI 进行交互。这项源自 "Project Astra" 的技术，可以实时解读视频内容并回答相关问题。目前该功能已向 Google One AI Premium 计划的 Gemini Advanced 订阅用户开放，展现了 Google 在 AI 助手领域的领先地位。

这款应用通过让你真的去触摸草地来限制你的屏幕使用时间

人工智能

计算机视觉

行为干预

2025-03-21

这款应用通过让你真的去触摸草地来限制你的屏幕使用时间

一款名为 "Touch Grass" 的 iOS 应用采用独特方式限制用户使用手机：用户必须走到户外拍摄真实的草地照片，才能解锁受限应用。该应用使用计算机视觉 AI 技术识别真实草地，防止用户使用室内植物作弊。这个既幽默又实用的应用程序，旨在帮助人们减少屏幕使用时间，培养更健康的生活方式。

Nvidia 推出 Cosmos-Transfer1，让机器人训练超乎寻常地真实 - 这将改变一切

人工智能

计算机视觉

模拟优化

2025-03-20

Nvidia 推出 Cosmos-Transfer1，让机器人训练超乎寻常地真实 - 这将改变一切

Nvidia 发布了 Cosmos-Transfer1 人工智能模型，可生成高度逼真的仿真环境，用于训练机器人和自动驾驶汽车。该模型采用自适应多模态控制系统，能更精细地控制生成环境，显著提高仿真度和实用性。它解决了物理 AI 开发中模拟训练与现实应用之间的差距，为机器人和自动驾驶技术的发展带来重大突破。

AI 能否担任花样滑冰裁判？

人工智能

计算机视觉

评分系统创新

2025-03-14

AI 能否担任花样滑冰裁判？

人工智能正在改变体育运动的评判方式。在花样滑冰中，AI可以通过卷积神经网络和姿态估计等技术，精确分析运动员的动作和团队配合。这不仅有助于减少人为偏见，提高评分的公平性，还可以用于教练指导和自我反馈。尽管面临数据稀缺等挑战，但AI在花样滑冰等体育项目中的应用前景广阔。

Snap 推出基于自研生成模型的 AI 视频滤镜

人工智能

计算机视觉

自研模型

2025-03-13

Snap 推出基于自研生成模型的 AI 视频滤镜

Snapchat 首次推出由自研生成视频模型驱动的 AI 视频滤镜。这三款新滤镜仅向付费用户开放，每月订阅费 15.99 美元。Snap 此举旨在保持竞争力，为用户提供独特功能。公司计划每周增加新滤镜，目前包括"浣熊"、"狐狸"和"春花"三款。用户可通过镜头轮盘访问并保存生成的 AI 视频。

自动驾驶

计算机视觉

安全漏洞

2025-03-10

简单贴纸就能迷惑自动驾驶汽车，最新研究显示

研究人员发现,廉价的贴纸可以有效欺骗自动驾驶汽车的交通标志识别系统。他们还发现这些系统会"记忆"标志位置,即使标志被遮挡也会假定其存在,导致攻击成功率低于预期。研究人员测试了多种攻击方法,包括使标志"消失"或制造虚假标志。这项研究填补了商业自动驾驶系统漏洞研究的空白,为提高系统安全性提供了重要信息。

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

人工智能

计算机视觉

视频生成

2025-03-07

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Tavus Inc.是一家人工智能研究初创公司，专注于开发能够模拟与他人对话体验的实时AI技术。今天，该公司宣布推出一系列突破性的AI模型，旨在构建人机互动的操作系统，通过“对话视频界面”使AI能够自然地感知、理解和回应。Tavus的使命是让AI理解面部表情、语调和肢体语言，并能够用自己的表情和语调做出反应。

两位前谷歌软件工程师，用AI改写黑夜成像规则

AI

初创企业

计算机视觉

2025-02-28

两位前谷歌软件工程师，用AI改写黑夜成像规则

“现在我们可以在黑暗中看到世界上的一切。”

这家AI初创公司承诺可以从家庭安防视频中抹除人物身影及更多功能

人工智能

计算机视觉

隐私保护技术

2025-02-26

这家AI初创公司承诺可以从家庭安防视频中抹除人物身影及更多功能

Prompt AI公司推出的Seemour平台为家庭安防摄像头带来了前所未有的AI功能。除了常见的物体识别和动作分析外,它还能学习识别宠物名字、识别特定个人并从视频中移除他们,以及回答问题如"我的钥匙放哪了?"等。这些创新功能将家庭安防AI推向了新的高度,但也需要用户对这家初创公司给予足够的信任。

Nvidia 推出新型 AI 工具助力手语学习

人工智能

计算机视觉

辅助学习技术

2025-02-25

Nvidia 推出新型 AI 工具助力手语学习

Nvidia 推出了一款名为 Signs 的创新 AI 工具，旨在帮助人们学习美国手语 (ASL)。该平台提供手语词汇库、3D 虚拟教师和实时反馈功能，用户可以通过网络摄像头获得签名评估。Nvidia 计划扩展词汇库并开放数据集，以促进无障碍 AI 工具的开发，为听障儿童家庭提供早期沟通渠道。

UVeye 利用 AI 实现汽车驾驶检测服务，获得 1.91 亿美元融资

人工智能

计算机视觉

智能检测

2025-01-30

UVeye 利用 AI 实现汽车驾驶检测服务，获得 1.91 亿美元融资

UVeye开发了一种基于人工智能的智能车辆检测系统，可在几秒内检测车辆外部和机械故障。该公司最近完成1.91亿美元D轮融资，由丰田汽车旗下Woven Capital领投。UVeye计划利用这笔资金扩大全球系统部署，提高制造能力，并建立更多战略合作伙伴关系。

OpenAI 推出 Operator 代理：自动化网络任务的新尝试

人工智能

计算机视觉

自动化代理

2025-01-24

OpenAI 推出 Operator 代理：自动化网络任务的新尝试

OpenAI推出名为Operator的人工智能代理，能够自主使用网络浏览器完成各种在线任务。这项功能目前仅向ChatGPT Pro订阅用户开放，可以执行多步骤的复杂任务，如预订餐厅或购买音乐会门票。虽然具有一定的自动化能力，但其可靠性和准确性仍有待提高。

TikTok 生死时刻，Meta 远离事实，ChatGPT 新增任务功能

人工智能

计算机视觉

生成技术

2025-01-20

TikTok 生死时刻，Meta 远离事实，ChatGPT 新增任务功能

本周科技圈风云激荡：TikTok 面临美国最高法院裁决，或将被迫停运；Meta 在美国终止事实核查，引发争议；ChatGPT 推出全新任务功能，为用户提供智能日程管理；Beat Saber 在 Quest 平台销量突破千万，AI 电影制作技术展现惊人潜力。

一手实测豆包新发布的视觉理解大模型，他们真的卷起飞了。

大模型

计算机视觉

大模型幻觉

2024-12-19

一手实测豆包新发布的视觉理解大模型，他们真的卷起飞了。

当你来到这个世界睁开眼睛的第一刻，没有学会语言的时候，靠的就是你的眼睛。我们先看到光影、颜色，才逐渐分辨出父母的面孔，屋子的空间，那时没有词汇、没有句子，只有模糊的光影与轮廓。

计算机视觉

2023-09-25

PROPHESEE推出事件视觉评估套件EVK5，搭载与索尼合作开发的传感器IMX646 HD

领先的神经拟态视觉传感公司普诺飞思（Prophesee）今日宣布推出高速、经济高效且紧凑的评估套件（EVK），以满足计算机视觉开发人员想要基于堆栈式事件视觉传感器IMX646 HD开发应用的需求。

AI

计算机视觉

2022-08-19

AI和计算机视觉加速自助结账

中科英泰智能称重解决方案采用英特尔处理器打造，能够以低功耗提供强大的计算性能、安全性和可靠性。这些能力对于运行边缘人工智能工作负载至关重要。该系统还使用英特尔OpenVINO工具套件来帮助优化图像识别应用程序。

1
2

白皮书

更多

数字化转型方略

更多

当ERP长出AI神经，胜负手在于业务扎根

CES 2025：沉浸AI

大模型落地，你还缺怎样的“工具箱”？

2024 AI创新者大会

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

友情链接

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn

网上有害信息举报专区：https://www.12377.cn

安全联盟认证