计算机视觉 关键字列表
Google Maps 新推人工智能工具可助改善道路拥堵问题

Google Maps 新推人工智能工具可助改善道路拥堵问题

Google 在其年度云计算大会上推出了多项 AI 驱动的 Google Maps 新功能,旨在帮助企业和城市改善道路状况、管理交通拥堵并了解当地趋势。这些工具包括利用 AI 识别基础设施、分析地理趋势和管理道路交通等功能,有望为决策者提供更全面的数据支持,提高城市管理和商业决策的效率。

Copilot Vision 更新:Microsoft 让 AI 助手能"看见"你的屏幕和应用程序

Copilot Vision 更新:Microsoft 让 AI 助手能"看见"你的屏幕和应用程序

Microsoft 正在测试 Windows 版 Copilot 应用的新更新,允许用户与 AI 助手共享屏幕或应用。Copilot Vision 原本仅限于 Edge 浏览器,现在扩展到 PC 上的所有应用。它可以指导用户使用 Photoshop 功能,分析照片和网页。新功能还包括文件搜索,支持多种文件格式。这些功能将在未来几周或几个月内向所有 Windows 11 用户推出。

Gemini Live 不仅仅是会对话的 AI,它现在有了"眼睛"。我亲自体验了一下

Gemini Live 不仅仅是会对话的 AI,它现在有了"眼睛"。我亲自体验了一下

Google 推出的 Gemini Live 不仅能进行对话,还能通过摄像头识别物体。这项功能可以帮助用户在日常生活中获取更多信息,如识别艺术品、导航等。它比简单的图像识别更强大,能与用户进行自然对话。目前该功能已开始在部分手机上推出,有望改变我们与周围世界互动的方式。

微软将 Copilot Vision 引入 Windows 和移动设备,为现实世界提供 AI 辅助

微软将 Copilot Vision 引入 Windows 和移动设备,为现实世界提供 AI 辅助

微软将 Copilot Vision 功能扩展至 Windows 和移动设备,超越网页应用范畴。用户可通过移动设备摄像头实时分析视频,获得植物护理和家居装饰建议。Windows 版本即将推出,支持全系统 AI 辅助,如指导 Photoshop 操作和分析照片、网页等。此次更新还包括记忆、个性化、网络操作和播客创建等多项新功能。

Google 推出 Gemini 实时 AI 视频功能

Google 推出 Gemini 实时 AI 视频功能

Google 正式向用户推出 Gemini Live 的新 AI 功能,让用户能够通过手机屏幕或摄像头实时与 AI 进行交互。这项源自 "Project Astra" 的技术,可以实时解读视频内容并回答相关问题。目前该功能已向 Google One AI Premium 计划的 Gemini Advanced 订阅用户开放,展现了 Google 在 AI 助手领域的领先地位。

这款应用通过让你真的去触摸草地来限制你的屏幕使用时间

这款应用通过让你真的去触摸草地来限制你的屏幕使用时间

一款名为 "Touch Grass" 的 iOS 应用采用独特方式限制用户使用手机:用户必须走到户外拍摄真实的草地照片,才能解锁受限应用。该应用使用计算机视觉 AI 技术识别真实草地,防止用户使用室内植物作弊。这个既幽默又实用的应用程序,旨在帮助人们减少屏幕使用时间,培养更健康的生活方式。

Nvidia 推出 Cosmos-Transfer1,让机器人训练超乎寻常地真实 - 这将改变一切

Nvidia 推出 Cosmos-Transfer1,让机器人训练超乎寻常地真实 - 这将改变一切

Nvidia 发布了 Cosmos-Transfer1 人工智能模型,可生成高度逼真的仿真环境,用于训练机器人和自动驾驶汽车。该模型采用自适应多模态控制系统,能更精细地控制生成环境,显著提高仿真度和实用性。它解决了物理 AI 开发中模拟训练与现实应用之间的差距,为机器人和自动驾驶技术的发展带来重大突破。

AI 能否担任花样滑冰裁判?

AI 能否担任花样滑冰裁判?

人工智能正在改变体育运动的评判方式。在花样滑冰中,AI可以通过卷积神经网络和姿态估计等技术,精确分析运动员的动作和团队配合。这不仅有助于减少人为偏见,提高评分的公平性,还可以用于教练指导和自我反馈。尽管面临数据稀缺等挑战,但AI在花样滑冰等体育项目中的应用前景广阔。

Snap 推出基于自研生成模型的 AI 视频滤镜

Snap 推出基于自研生成模型的 AI 视频滤镜

Snapchat 首次推出由自研生成视频模型驱动的 AI 视频滤镜。这三款新滤镜仅向付费用户开放,每月订阅费 15.99 美元。Snap 此举旨在保持竞争力,为用户提供独特功能。公司计划每周增加新滤镜,目前包括"浣熊"、"狐狸"和"春花"三款。用户可通过镜头轮盘访问并保存生成的 AI 视频。

简单贴纸就能迷惑自动驾驶汽车,最新研究显示

研究人员发现,廉价的贴纸可以有效欺骗自动驾驶汽车的交通标志识别系统。他们还发现这些系统会"记忆"标志位置,即使标志被遮挡也会假定其存在,导致攻击成功率低于预期。研究人员测试了多种攻击方法,包括使标志"消失"或制造虚假标志。这项研究填补了商业自动驾驶系统漏洞研究的空白,为提高系统安全性提供了重要信息。

Tavus 推出系列 AI 模型,实现实时人脸交互技术突破

Tavus 推出系列 AI 模型,实现实时人脸交互技术突破

Tavus Inc.是一家人工智能研究初创公司,专注于开发能够模拟与他人对话体验的实时AI技术。今天,该公司宣布推出一系列突破性的AI模型,旨在构建人机互动的操作系统,通过“对话视频界面”使AI能够自然地感知、理解和回应。Tavus的使命是让AI理解面部表情、语调和肢体语言,并能够用自己的表情和语调做出反应。

两位前谷歌软件工程师,用AI改写黑夜成像规则

两位前谷歌软件工程师,用AI改写黑夜成像规则

“现在我们可以在黑暗中看到世界上的一切。”

这家AI初创公司承诺可以从家庭安防视频中抹除人物身影及更多功能

这家AI初创公司承诺可以从家庭安防视频中抹除人物身影及更多功能

Prompt AI公司推出的Seemour平台为家庭安防摄像头带来了前所未有的AI功能。除了常见的物体识别和动作分析外,它还能学习识别宠物名字、识别特定个人并从视频中移除他们,以及回答问题如"我的钥匙放哪了?"等。这些创新功能将家庭安防AI推向了新的高度,但也需要用户对这家初创公司给予足够的信任。

Nvidia 推出新型 AI 工具助力手语学习

Nvidia 推出新型 AI 工具助力手语学习

Nvidia 推出了一款名为 Signs 的创新 AI 工具,旨在帮助人们学习美国手语 (ASL)。该平台提供手语词汇库、3D 虚拟教师和实时反馈功能,用户可以通过网络摄像头获得签名评估。Nvidia 计划扩展词汇库并开放数据集,以促进无障碍 AI 工具的开发,为听障儿童家庭提供早期沟通渠道。

UVeye 利用 AI 实现汽车驾驶检测服务,获得 1.91 亿美元融资

UVeye 利用 AI 实现汽车驾驶检测服务,获得 1.91 亿美元融资

UVeye开发了一种基于人工智能的智能车辆检测系统,可在几秒内检测车辆外部和机械故障。该公司最近完成1.91亿美元D轮融资,由丰田汽车旗下Woven Capital领投。UVeye计划利用这笔资金扩大全球系统部署,提高制造能力,并建立更多战略合作伙伴关系。

OpenAI 推出 Operator 代理:自动化网络任务的新尝试

OpenAI 推出 Operator 代理:自动化网络任务的新尝试

OpenAI推出名为Operator的人工智能代理,能够自主使用网络浏览器完成各种在线任务。这项功能目前仅向ChatGPT Pro订阅用户开放,可以执行多步骤的复杂任务,如预订餐厅或购买音乐会门票。虽然具有一定的自动化能力,但其可靠性和准确性仍有待提高。

TikTok 生死时刻,Meta 远离事实,ChatGPT 新增任务功能

TikTok 生死时刻,Meta 远离事实,ChatGPT 新增任务功能

本周科技圈风云激荡:TikTok 面临美国最高法院裁决,或将被迫停运;Meta 在美国终止事实核查,引发争议;ChatGPT 推出全新任务功能,为用户提供智能日程管理;Beat Saber 在 Quest 平台销量突破千万,AI 电影制作技术展现惊人潜力。

一手实测豆包新发布的视觉理解大模型,他们真的卷起飞了。

一手实测豆包新发布的视觉理解大模型,他们真的卷起飞了。

当你来到这个世界睁开眼睛的第一刻,没有学会语言的时候,靠的就是你的眼睛。 我们先看到光影、颜色,才逐渐分辨出父母的面孔,屋子的空间,那时没有词汇、没有句子,只有模糊的光影与轮廓。

2023-09-25

PROPHESEE推出事件视觉评估套件EVK5,搭载与索尼合作开发的传感器IMX646 HD

领先的神经拟态视觉传感公司普诺飞思(Prophesee)今日宣布推出高速、经济高效且紧凑的评估套件(EVK),以满足计算机视觉开发人员想要基于堆栈式事件视觉传感器IMX646 HD开发应用的需求。

AI和计算机视觉加速自助结账

中科英泰智能称重解决方案采用英特尔处理器打造,能够以低功耗提供强大的计算性能、安全性和可靠性。这些能力对于运行边缘人工智能工作负载至关重要。该系统还使用英特尔OpenVINO工具套件来帮助优化图像识别应用程序。