苹果将​​人工智能推向现实世界视觉,视觉 AR 即将到来据报道,苹果的智能眼镜工作指向更轻的视觉设备,让人工智能可以看到世界,但相机隐私仍然是一个障碍。

启动后视觉专业版据报道,作为一款优质混合现实耳机,苹果正在转向一款围绕摄像头、人工智能、现实世界环境和 Siri AI 构建的更轻的可穿戴设备。其内部目标很容易理解:吸取 Vision Pro 的技术教训,消除耳机的重量和隔离,将空间计算变成人们日常生活中可以佩戴的东西。

苹果的下一代空间设备可能看起来不像 Vision Pro。它可能看起来像普通眼镜。

其工作理念通常被描述为苹果智能眼镜,但“Vision AR”更好地抓住了方向。这不仅仅是一个较小的 Vision Pro。它将是一款可穿戴设备,使用摄像头和传感器来了解物理世界,然后让 Apple Intelligence 帮助用户对眼前的事物采取行动。

这也是最困难的问题开始的地方。带摄像头的眼镜不仅仅是一个显示产品。它们是一种图像产品。他们看到用户看到的东西。它们可以捕捉街道、家庭、儿童、文件、屏幕、面孔、车牌、办公室、教室、商店和私人日常活动。对于苹果来说,这项技术可能已经足够接近,可以进行认真的测试,但在产品感觉准备就绪之前,隐私模型必须令人信服。

Vision Pro 是第一步

视觉专业版为苹果提供了一种进入空间计算的受控方式。它使用摄像头、传感器、眼动追踪、手部追踪、高分辨率显示器、空间音频和visionOS将应用程序与用户的物理空间融合在一起。它在技术上雄心勃勃,视觉效果令人印象深刻,而且价格昂贵。

它也不是眼镜。

Vision Pro 是一款耳机。它遮盖眼睛,依赖直通视频,配有外部电池,适用于更短、更刻意的会话。它非常适合沉浸式视频、空间照片、3D 环境、多任务处理、娱乐和专业工作,但大多数人不会全天佩戴它。

Vision AR 将是一个不同的类别。该产品需要更轻、使用更快、为社会所接受,并且在持续几秒钟而不是持续一个小时的会话中有用。这改变了设计优先级。显示屏变小。电池变得更硬。相机系统变得更加灵敏。人工智能层变得更加核心。

Vision Pro 证明了苹果可以打造一台空间计算机。眼镜将测试苹果能否让空间计算变得正常。

AI让眼镜更有用

没有人工智能的智能眼镜会让人感觉受到限制。它们可以拍摄照片、录制视频、播放音频、显示通知或提供导航提示。有用,但不足以创建新的计算平台。

人工智能改变了目的。配备摄像头的可穿戴设备可以识别物体、翻译标志、总结文档、记住在哪里看到过某物、描述场景、扫描产品、阅读菜单、帮助指导、回答有关位置的问题或通过应用程序触发操作。

这就是 Apple Intelligence 和 Siri AI 的重要性。未来的 Vision AR 设备可以让用户询问世界,而不仅仅是询问屏幕上的信息。 “我在看什么?”成为计算命令。 “将此添加到我的笔记中”、“翻译此内容”、“提醒我有关此海报”、“查找此产品”或“发送这些详细信息”,无需拿出 iPhone 即可实现。

这符合苹果更大的 WWDC26 方向。 Siri AI 变得更加情境化。视觉智能正在进入 iPhone 的更多部分。应用程序意图允许应用程序向系统公开操作。基础模型为开发人员提供了原生 AI 层。 Vision AR 会将这些想法带入用户的视野。

这款眼镜一开始并不需要取代 iPhone。他们会让 iPhone 变得智能。

相机是功能也是问题

对于Vision AR来说,摄像头既是卖点,也是瓶颈。

可穿戴人工智能设备需要视觉输入来理解现实世界。如果没有摄像头,助理就失去了使眼镜变得有价值的背景。有了摄像头,苹果面临着与每个人都面临的同样的隐私问题。智能眼镜产品.

人们在镜头前的表现有所不同。手机摄像头是可见的并且通常是故意的。有人拿起手机,对准它,然后拍摄一些东西。眼镜不一样。相机可以一直朝外。其他人可能不知道是否正在录制,人工智能是否正在分析场景,或者是否正在存储图像。

这会造成社会摩擦。餐馆、学校、工作场所、健身房、医疗办公室、家庭、音乐会和公共场所都会引起不同的担忧。一件对佩戴者来说有用的产品可能会让附近的人感到侵犯。

苹果无法通过简单的权限屏幕来解决这个问题,因为旁观者无法点击“允许”。隐私设计必须在物理、视觉和社交方面发挥作用。

苹果将​​需要可见的隐私信号

Vision AR 的一项可能要求是强大的外部记录指示器。 Snap 的新规格使用可见光来指示相机活动。 Meta 的雷朋智能眼镜还包括捕捉指示器。苹果几乎肯定需要自己的版本,但该公司可能会走得更远。

微小的光可能还不够。人们需要了解眼镜是在记录、分析还是只是闲置。苹果可以使用专用的硬件指示器、声音提示、严格的应用程序权限、设备上的处理、有限的保留以及对何时保存视觉数据的明确控制。

Apple 还拥有 Vision Pro 经验可供借鉴。它是Vision Pro 隐私概述解释了耳机如何使用摄像头和传感器数据来绘制周围环境,同时尽可能在设备上处理敏感信息。眼镜需要一个更强大的版本来实现这一承诺,因为它们更便携,并且更有可能与其他人一起佩戴。

挑战在于感知。苹果可以建立强大的隐私系统,但用户和旁观者必须相信它们。该产品不会给人一种带有人工智能的隐藏摄像头的感觉。

设备上的处理变得至关重要

苹果对 Vision AR 的最佳隐私论点是设备上的处理。

如果眼镜能够在本地了解世界的大部分内容,那么需要离开设备的图像就会减少。这符合苹果更广泛的人工智能战略:尽可能在设备上进行处理,在需要时使用私有云计算,并使个人数据远离广泛的云收集。

对于眼镜来说,这可能很困难。小型可穿戴硬件的电池、热容量、内存和处理能力有限。高级视觉人工智能的要求可能很高。苹果可能需要这款眼镜才能与 iPhone 作为配对计算设备,尤其是在早期版本中。

这是有道理的。眼镜可以捕捉视觉背景,而 iPhone 可以安全地处理更繁重的人工智能任务。随着时间的推移,用于可穿戴设备的苹果芯片可能会承担更多的工作。

隐私规则应该很简单:眼镜不应将原始图像发送到任何地方,除非用户明确选择需要它的操作。即便如此,苹果仍需要透明的路由、可见的状态和强大的应用程序限制。

竞争正在加速

苹果并不孤单。 Meta 已经通过雷朋智能眼镜建立了势头,将摄像头、音频、语音交互和 Meta AI 结合在一起。 Snap 正在以其最新规格进军全 AR 眼镜。谷歌正在围绕 Gemini 和 Android XR 重建其智能眼镜战略。三星正在与谷歌和高通一起准备 XR 硬件。

市场正在从耳机演示转向可穿戴人工智能。这给苹果带来了压力。 Vision Pro 高端且功能强大,但日常使用类别可能会围绕眼镜形成。如果苹果等待太久,Meta 和其他公司可能会在苹果进入之前定义人工智能眼镜的社会规范。

苹果的优势在于信任、硬件集成和生态系统深度。 iPhone、AirPods、Apple Watch、Siri AI、Apple Intelligence、地图、照片、消息、日历、笔记、钱包和应用程序意图可以使 Vision AR 比独立的眼镜更有用。

风险在于时机。苹果想要隐私和精致。市场可能会奖励速度。

图片来源:谷歌

Vision AR需要一个存在的理由

苹果不能出货眼镜只是因为AI眼镜很流行。 Vision AR 需要感觉自然的日常使用。

导航可能就是其中之一。步行路线、交通提示、机场指南、停车位置、步道路线和商店导航都一目了然。

视觉智能可能是另一个。该眼镜可以识别产品、植物、地标、文件、标志、成分、物体或另一种语言的文本。

如果小心处理的话,记忆力会很强大。用户可以询问他们最后一次看到商品的地点、哪个货架上有商品,或者标牌上写着什么。这需要严格的隐私控制,因为记忆是有用的人工智能可能会变得不舒服的地方。

可访问性可能成为最有力的案例之一。与 AirPods 和 iPhone 配对时,眼镜可以描述周围环境、阅读文本、检测障碍物、识别物体或辅助听觉和视觉环境。

沟通也很重要。消息、通话、实时字幕、翻译和快速 Siri 操作可以让设备感觉很有用,而无需大显示屏。

只有当这些行动比拿出 iPhone 更快时,该产品才能成功。

社交设计与芯片一样重要

苹果的实验室也许能够制造硬件,但 Vision AR 的社交设计可能会决定产品。

眼镜必须看起来可以接受。摄像头必须足够可见,让人感觉诚实,而又不会让设计变得丑陋。显示器必须有帮助,但又不会分散注意力。 Siri AI 必须静静地回应。电池寿命必须能够满足实际使用的需要。隐私指标必须易于理解。该产品必须在公共场合工作,且不会让用户周围的每个人感到不舒服。

这是比 Vision Pro 更困难的设计挑战。耳机可以清楚地表明佩戴者正在使用科技产品。眼镜模糊了这个界限。在日常互动中,它们坐在脸上。他们以不同的方式进入社交空间。

在其他公司在早期版本上遇到困难之后,苹果公司一直致力于让技术为社会所接受。 Apple Watch 将可穿戴设备变成了主流类别。 AirPods 让无线耳机成为常态。基于摄像头的 AI 眼镜也需要类似的转变。

隐私可以解锁这种转变,也可以阻止它。

这个名字可能不是 Vision AR

苹果可能不会使用 Vision AR 这个名称。该公司可以选择 Apple Glass、Apple Vision、Vision Air 或完全其他品牌。 “Vision AR”作为一种描述是因为它将传闻中的眼镜与 Vision Pro 区分开来,同时将它们保留在同一个空间计算系列中。

命名问题比产品角色更重要。苹果需要一款设备,让 Vision 超越沉浸式会话,并将其转移到日常环境中。第一个版本可能没有完整的 AR 显示屏。它可能从摄像头、音频、人工智能和有限的视觉输出开始。随着组件的改进,苹果可能会转向更丰富的显示屏。

这条道路将与更广泛的行业相匹配。真正的轻量化AR眼镜仍然很困难,因为显示器、光学、电池、热量、相机和计算都在争夺空间。在苹果规模的全视觉 AR 变得实用之前,相机和人工智能可穿戴设备可能会问世。

苹果真人眼镜 |图片:电话竞技场

从Vision Pro到Vision AR之路

Vision Pro 是苹果首次推出空间计算产品。 Vision AR 将是使空间计算可穿戴的尝试。

两者之间的联系不仅仅是硬件。 Vision Pro 为苹果在眼动追踪、手部追踪、直通、空间映射、隐私、visionOS、3D 界面和开发者工具方面积累了多年的经验。眼镜可以使用该基础的较小版本,与 Apple Intelligence 和 iPhone 配对。

区别在于野心。 Vision Pro 将应用程序带入太空。 Vision AR 将把智能带入世界。

这就是为什么隐私是主要瓶颈。该技术是可以建立的。更棘手的问题是,苹果能否让人们在日常空间中轻松使用面部人工智能摄像头。

如果苹果解决了这个问题,Vision AR 可能会成为苹果智能最自然的延伸:一种能够看到足够的信息来提供帮助、透露出足够的信息来值得信任、并保持足够的私密性以融入公共生活的设备。