苹果辅助功能这些功能可能成为苹果自加入人工智能竞赛以来面临的一个问题的最明确答案:除了写电子邮件、总结笔记、编辑图像或回答问题之外,人工智能实际上还能为普通人做什么?苹果最新的辅助功能预览给出了比许多生产力演示更强有力的答案,因为它将人工智能置于可以立即发挥作用的任务中。
该公司预览新的辅助功能今年晚些时候将在 iPhone、iPad、Mac、Apple TV 和 Apple Vision Pro 上推出。这些更新使用 Apple Intelligence 为 VoiceOver 和放大镜带来更丰富的描述,为 Voice Control 带来更丰富的描述,为 Voice Control 带来自然语言导航,为 Accessibility Reader 提供文档摘要和翻译,为没有字幕的视频在设备上生成字幕,以及通过 Apple Vision Pro 对兼容电动轮椅进行基于眼睛的控制。
这个范围很重要,因为它将 Apple Intelligence 推向视觉、听觉、移动、阅读、语音和界面控制领域。这不是人工智能作为写作助手。它是人工智能作为用户和设备、文档、视频、物体、房间或轮椅之间的桥梁。这些功能仍然受到语言、硬件、区域、兼容性和发布时间的限制,但方向性很强。苹果正在向人工智能展示它可以减少障碍,而不仅仅是加快办公任务的速度。
对于苹果来说,可访问性还提供了一个更可信的人工智能故事。 Siri 的延迟和 Apple Intelligence 推出的不均衡给该公司带来了压力,要求其证明其人工智能工作是实用的。无障碍功能为苹果带来了一个可以通过直接影响来判断人工智能的地方。生成的字幕要么可以帮助人们关注视频,要么不能。 VoiceOver 描述要么有助于某人理解图像,要么无助于理解。自然语言语音控制操作要么点击正确的项目,要么不点击。
这种清晰度是有价值的。它让人工智能不再那么抽象,而是更贴近苹果设备的日常使用体验。
可访问性使人工智能更容易理解
Apple 情报可访问性功能之所以有效,是因为它们与实际用例相关。 VoiceOver 用户需要更好地描述图像、文档和周围环境。语音控制用户需要在不记住确切标签或编号网格的情况下导航应用程序。低视力用户需要能够处理现实世界文档、菜单、标志和复杂布局的阅读工具。即使视频从未附带字幕,聋哑和听力障碍用户也需要字幕。一些 Vision Pro 用户需要超越手和控制器的输入方法。
这些都是具体问题。 Apple Intelligence 用于通过解释视觉内容、理解自然语言、生成语音转文本字幕、总结复杂材料以及将目光输入连接到支持的移动系统来解决这些问题。
苹果的语音控制预览可能是最能说明问题的。借助 Apple Intelligence,用户将能够用自然语言描述屏幕控件,例如引用可见项目而不是命名确切的按钮。这可以帮助用户导航难以标记或记住的界面,并且它可以提供 Siri 最终需要的屏幕感知控制的实用预览。苹果表示,此语音控制更新最初将在美国、加拿大、英国和澳大利亚提供英语版本。
VoiceOver 和放大镜还获得了更有用的情报。苹果表示,VoiceOver 将通过 Image Explorer 提供更丰富的图像描述,而 Live Recognition 将允许用户询问有关相机视图中的内容并提出后续问题。 Magnifier 将使用 Apple Intelligence 帮助用户与现实世界的文本和视觉内容(包括文档和菜单)进行交互。
关键是人工智能并没有作为一个额外的层出现。它被放置在用户已经依赖的工具中。

生成的字幕将人工智能变成媒体功能
Apple Intelligence 的辅助功能还可以通过生成的字幕来实现娱乐。苹果表示,没有现有字幕的视频将能够显示设备上生成的自动转录。该功能适用于 iPhone、iPad、Mac、Apple TV 和 Apple Vision Pro,最初在美国和加拿大提供英语版本。
这是预览版中最广泛有用的功能之一。字幕对于聋哑和听力障碍用户来说至关重要,但它们也有助于在嘈杂的房间、共享空间、深夜观看、公共交通、教室、语言学习和无法大声播放音频的家庭情况下使用。
设备上的方法很重要,因为视频可能是个人的。家庭剪辑、消息附件、学校视频或私人录音可能包含敏感言论。本地生成字幕有助于苹果保持该功能与其隐私立场保持一致。
生成的字幕不会取代专业准备的字幕。人造字幕可以包括自动语音识别可能会错过的发言者姓名、音效、音乐提示和编辑时间。但作为无字幕视频的后备方案,该功能具有明显的价值。它将人工智能转变为一个媒体可访问层,比典型的生产力功能可以帮助更多的人。
这也对 Apple TV 有所帮助。 tvOS 即将支持更大的文本,生成的字幕将为客厅屏幕带来更多字幕访问。对于围绕共享观看构建的平台,这些变化使可访问性成为核心媒体体验的一部分,而不是次要设置。
Vision Pro 轮椅控制使 Apple Intelligence 的无障碍功能变得更加雄心勃勃。苹果预览了一项功能,让 Vision Pro 用户用眼睛控制兼容的电动轮椅,首先在美国使用 Tolt 和 LUCI 替代驱动系统。该功能适用于受控环境,并使用 Vision Pro 的眼球追踪系统和支持的轮椅硬件。
这不是大众市场的功能,苹果正在适当限制框架。轮椅控制是一个高风险领域,安全性、兼容性、校准、环境和硬件集成都很重要。但该公告表明了一些重要的事情苹果的人工智能和可访问性方向:该公司愿意将先进的输入系统连接到物理移动性,而不仅仅是数字导航。
Vision Pro 已经使用眼动追踪作为主要界面方法。将输入扩展到兼容的移动系统表明空间计算如何成为辅助技术。它还赋予 Vision Pro 除了娱乐、工作和沉浸式媒体之外更重要的作用。
该功能的推出范围有限并没有降低其重要性。辅助技术通常从特定的支持系统开始,只有在安全性和可靠性得到证明后才进行扩展。苹果在这里的角色并不是将 Vision Pro 变成通用轮椅控制器。它是为那些可能无法舒服地使用常规控件的用户开辟了另一条输入路径。
从最广泛的意义上来说,这是与人工智能相邻的:传感器、凝视理解、空间交互、可访问性软件和硬件合作伙伴关系共同支持物理独立性。

阅读工具不再局限于简单的文本
Apple Intelligence 辅助功能还增强了 Accessibility Reader,该功能专为阅读障碍或弱视等残障用户而设计。苹果表示,该功能将使用 Apple Intelligence 来帮助总结更复杂的内容,包括科学文章、多列布局、图像和表格。内置翻译还将帮助用户以其母语阅读内容,同时保留自定义格式、字体和颜色。
这是一个实用的阅读升级,因为真正的文档很少是简单的。文章可能包括专栏、图表、图像、标题、侧边栏、脚注、表格和密集格式。当页面不是纯文本时,传统的阅读工具通常会遇到困难。 Apple Intelligence 可以通过提取含义、总结结构以及使内容更易于理解来提供帮助。
这对于学校、工作、医疗保健表格、政府信息、研究、旅行证件、说明和日常阅读都很重要。摘要可以帮助用户在详细阅读之前理解主要思想。翻译可以减少语言障碍。自定义格式可以使文本对于需要特定字体、颜色或间距的人来说更加舒适。
再次强调,其用处是显而易见的。这并不是人工智能追逐新奇。人工智能让困难的信息变得更容易获取。
苹果的隐私故事在这里更强大
Apple Intelligence 的辅助功能也比许多 AI 产品更自然地契合苹果的隐私定位。辅助工具可能涉及深度个人信息:家庭摄像头视图、私人文档、医疗文书、家庭视频、个人照片、口头对话、运动模式和设备控制行为。
苹果公司对生成字幕的设备内处理的重视以及注重隐私的苹果智能设计为该公司带来了更清晰的差异化优势。依赖辅助功能的用户不应该为了不必要的数据暴露而牺牲独立性。当 iPhone 描述图像、总结账单或为私人视频生成字幕时,隐私就是该功能价值的一部分。
但这并不能消除所有担忧。人工智能的描述可能是错误的。生成的字幕可能会出错。语音导航可能会误解命令。轮椅控制必须限制在安全条件下。 Apple 警告称,在高风险情况下、在可能发生伤害的情况下进行导航、或者进行诊断或治疗时,不应依赖 VoiceOver 和放大镜。
这些限制是必要的。无障碍人工智能应该提供帮助,而不是过度承诺。苹果战略的最强版本是结合了隐私、清晰的界限和实用价值的战略。

生产力之外的人工智能是更好的故事
Apple Intelligence 的辅助功能对于苹果的 AI 声誉可能比其他书写工具更重要。生产力人工智能很有用,但这个类别很拥挤。现在每个主要平台都提供摘要、写作帮助、图像工具和聊天式帮助。辅助功能为苹果提供了一种更独特的方式来展示人工智能在个人设备中的作用。
这也符合苹果公司的历史。 Apple 的许多最佳辅助功能都成为了更深层次平台设计的示例:VoiceOver、AssistiveTouch、实时字幕、声音识别、眼动追踪、个人语音、放大镜和开关控制。这些工具表明,苹果的优势不仅在于使技术变得强大,而且在于使其能够适应不同的身体、感官和需求。
最新的预览将这一理念延伸到了人工智能中。当 Apple Intelligence 帮助人们理解图像、阅读标志、控制屏幕、跟随视频、导航文档或在支持硬件的物理环境中移动时,它就会变得非常有用。
这是比人工智能作为新奇事物更强烈的信息。这也为苹果在 Siri 和 Apple Intelligence 的延迟之后重建信心提供了一条途径。如果苹果能够可靠地提供这些功能,可访问性可能会成为人工智能在最重要的地方发挥作用的最明显的例子之一。
下一阶段将取决于执行情况。在某些情况下,可用性有限。语言和地区需要扩大。开发人员需要正确支持可访问性。人工智能输出必须足够准确,才能在日常生活中得到信任。 Apple 必须保持隐私保护可见且易于理解。
尽管如此,方向还是明确的。Apple 正在使用辅助功能表明人工智能不需要被困在生产力应用程序中。它可以存在于整个生态系统中,帮助人们更加独立地阅读、聆听、观看、移动、导航和交流。






