Siri 通过辅助功能获得最清晰的 iOS 27 预览 Siri 的下一个时代可能首先通过语音控制可见,Apple Intelligence 将自然语言转化为界面导航。

Siri iOS 27通过其中之一,期望变得更容易理解Apple 最公开的辅助功能更新。苹果预览了由 Apple Intelligence 支持的新辅助功能,最重要的信号可能是语音控制的演变。该功能将让用户完全通过语音使用自然语言来导航 iPhone 和 iPad,描述屏幕按钮和控件,而不是记住确切的标签、数字或网格位置。

苹果的例子很简单,但很有意义。用户可以在 Apple 地图中说“点击有关最佳餐厅的指南”或在“文件”中“点击紫色文件夹”之类的内容。然后,语音控制可以解释可见界面并对请求的项目进行操作。这将来自严格命令系统的语音输入转变为更接近会话界面控制的东西。

这并未正式被称为新的 Siri。苹果正在预览辅助功能,语音控制仍然是一个单独的工具,专为需要免提导航的身体残疾用户设计。但其背后的技术让我们具体预览了 Siri 的发展方向。现代助理不能只回答问题。它需要了解屏幕上的内容、识别界面元素、解释用户意图并在应用程序内采取行动。

这正是 Siri 最薄弱的领域。苹果承诺通过 Apple Intelligence 提供更加个性化、具有情境感知能力的 Siri,包括对屏幕内容、个人情境和应用内操作的感知。其中一些功能被推迟,给 iOS 27 和 WWDC26 带来了压力。新的语音控制预览表明,苹果已经在辅助功能中构建更强大的助手。

语音控制展示了未来的界面

Siri iOS 27 的评判标准可能是苹果能否将自然语言转化为真正的设备控制。新的语音控制功能展示了这一想法的实用版本。 Apple Intelligence 并不要求用户学习精确的命令结构,而是帮助系统将普通语言与可见控件连接起来。

这很重要,因为界面是可视化的。用户可能不知道按钮的辅助功能标签、菜单项的确切名称或分配给网格覆盖层的编号。他们可能只知道他们看到的内容:紫色文件夹、餐厅指南、发送按钮、红色图标、地图结果、顶行的照片。由 Apple Intelligence 提供支持的语音控制旨在理解这些描述。

对于可访问性来说,这是一个重大改进。对于因行动不便、受伤、疲劳或其他身体状况而依赖语音的用户来说,它可以让 iPhone 和 iPad 变得更加轻松。当应用程序的标签或视觉布局不完美,难以使用旧的语音命令结构进行导航时,它也可以提供帮助。

对于 Siri 来说,影响更大。如果 Apple Intelligence 能够很好地理解屏幕以进行语音控制,那么 Siri 最终应该能够为更广泛的任务做同样的事情。用户应该能够要求 Siri 打开特定文档、点击可见选项、总结页面、移动文件、在应用内回复或在需要时通过确认完成工作流程。

这就是苹果一直承诺的助手。语音控制可能是用户可以清楚地看到基本想法的第一个地方。

自然语言是缺失的一层

Siri iOS 27 需要自然语言控制,因为旧版语音助手是围绕命令识别构建的。他们可以设置计时器、播放歌曲、发送消息、拨打电话、开始锻炼以及回答简单的查询。但当请求涉及应用程序状态、屏幕上下文、个人数据或多步骤操作时,他们常常会遇到困难。

Apple Intelligence 应该会改变这一现状。助手需要从命令执行转向上下文理解。这意味着要认识到用户的意思、什么是可见的、什么数据是相关的、哪个应用程序可以提供帮助以及应该安全地采取什么操作。

语音控制的新“说出你所看到的”模型就是一个直接的例子。用户不再需要知道系统的内部标签。他们可以自然地描述目标。如果 Siri 要与 Gemini、ChatGPT、Alexa 和其他正在走向更加代理行为的人工智能助手竞争,那么 Siri 就需要这种灵活性。

挑战在于 Siri 必须在比聊天机器人更高的信任度下运行。如果 Siri 发送消息、删除文件、支付账单、更改设置、预订乘车、共享文档或修改日历,系统必须理解请求并确认敏感操作。仅自然语言是不够的。苹果必须将其与上下文、权限、隐私和用户控制结合起来。

这就是为什么可访问性可能是最好的预览。语音控制基于清晰的界面操作。它并不假装能够解决所有人工智能任务。它显示了一个具体的改进:系统可以更自然地将用户语音与可见控件连接起来。

图片来源:苹果杂志

辅助功能正在成为苹果的人工智能测试平台

Siri iOS 27 还受益于苹果正在利用辅助功能来展示其一些最实用的人工智能工作这一事实。同一公告包括更丰富的 VoiceOver 描述、实时识别改进、无障碍读者摘要、为没有字幕的视频生成字幕以及适用于兼容轮椅的 Vision Pro 眼动追踪控制。

这些功能并不是抽象的人工智能演示。他们解决实际的交互问题。 VoiceOver 可以更详细地描述图像和周围环境。放大镜和实时识别可以回答有关相机所见内容的问题。语音控制可以通过自然语言导航应用程序。生成的字幕可以使无字幕的视频更容易观看。 Accessibility Reader 可以总结和重新格式化复杂的内容。

这就是 Apple Intelligence 看起来最有说服力的地方。该技术并没有被认为是新颖的。它被用来减少用户与其设备之间的障碍。

对于 Siri 来说,这就是教训。下一位助手的评判标准不会是在真空中听起来是否更具对话性。评判标准是它是否可以帮助用户跨 iPhone、iPad、Mac、Apple Watch、Apple TV、Vision Pro 和应用程序完成工作。可访问性为苹果提供了一个受控的、高价值的场所来构建这些交互模型,然后再更广泛地扩展它们。

苹果应该小心,不要太不小心地模糊可访问性和主流人工智能。语音控制是为有需要的用户而存在的。但那里开发的技术可以改善整个平台。苹果的许多功能最初都是作为辅助工具,后来影响了更广泛的交互设计。

Siri iOS 27 可能取决于两个主要部分:屏幕感知和应用操作。屏幕感知让 Siri 能够了解用户正在看什么。应用程序操作让 Siri 可以根据这种理解来做一些事情。语音控制的自然语言导航直接指向第一首曲目。

第二件是应用意图。 Apple 一直在推动开发人员通过 App Intents 公开应用程序功能,以便 Siri、快捷方式、Spotlight、小部件和 Apple Intelligence 能够理解并触发操作。如果 Siri 可以看到屏幕但无法在应用程序内进行有意义的操作,那么它仍然受到限制。如果应用程序公开正确的操作,Siri 就可以变得更加有用,而无需依赖脆弱的屏幕抓取或手动点击。

这就是为什么 WWDC26 对开发者来说很重要。苹果不仅需要展示更好的 Siri 界面,还需要展示更好的开发者路径。应用程序应该能够声明它们可以做什么、可以提供哪些信息以及需要用户确认哪些内容。然后,Siri 应该将个人背景、屏幕感知和应用意图结合起来,形成更安全的行动。

语音控制从另一个角度暗示了这个未来。即使用户自然地描述它们,它也可以作用于可见控件。这使得它现在很有用,并建议苹果如何桥接尚未与应用程序意图深度集成的应用程序。

最好的 Siri 需要两种方法:用于深度集成的语义应用操作和用于可见界面的屏幕理解。

苹果仍需重建信任

Siri iOS 27 将受到密切关注,因为苹果已经推迟了一些最初与 Apple Intelligence 相关的更高级的 Siri 功能。路透社报道称,苹果公司推迟了 2025 年的某些Siri AI 改进到 2026 年,包括更好地利用个人上下文和更深入的应用程序操作。这次延迟改变了预期。用户和开发人员现在需要证据,而不是另一个承诺。

新的语音控制预览很有帮助,因为它很具体。苹果不仅仅说人工智能将使语音交互变得更好。它展示了 Apple Intelligence 通过自然语言解释界面的具体方式。这正是苹果公司更需要的实际例子。

尽管如此,Siri 本身还是必须有所作为。辅助功能的改进并不能自动解决助手问题。新的 Siri 需要更快、更清晰、更可靠,并且对其功能更加透明。它需要解释何时使用设备上处理、私有云计算、应用程序数据或外部模型。在采取敏感行动之前需要先询问。它需要避免自信的错误。

最强大的 iOS 27 故事将这些部分联系起来:语音控制显示自然语言导航,VoiceOver 显示更丰富的视觉理解,应用程序意图显示应用程序控制,而 Siri 成为将这些功能整合在一起的更广泛的助手层。

图片来源:苹果公司

无需 Siri 即可实现真实预览

Siri iOS 27 可能不是苹果无障碍公告的标题,但它存在于功能的逻辑中。由 Apple Intelligence 提供支持的语音控制为 Apple 的下一代助手提供了最清晰的预览:不仅是一个可以回答问题的声音,而且是一个能够理解界面并在其中进行操作的系统。

该功能本身对于可访问性非常重要。依赖语音导航的用户应该获得更自然、更灵活的方式来控制 iPhone 和 iPad。这就是即时价值。

接下来会出现更广泛的信号。如果苹果能让自然语言语音控制可靠地工作,Siri 就能继承更强大的基础。如果苹果能够将其与个人环境、应用意图、设备智能和私有云计算相结合,iOS 27 就可以开始将 Siri 从传统的助手转变为真正的操作系统界面。

苹果无需将其称为 Siri 预览版即可发挥其功能。 Siri 的未来从 Apple Intelligence 开始理解用户描述所见内容时的含义中可见一斑。