Siri人工智能随着生成式人工智能改变了用户对智能手机助手的期望,这已经成为苹果最重要的挑战之一。苹果多年来一直强调隐私、设备上的处理以及 iPhone、iPad、Mac、Apple Watch 及其服务的深度集成。这种方法仍然给苹果带来了强大的优势,但它也带来了一个困难的限制:最智能的人工智能系统通常需要比手机本身所能提供的更多的内存、规模和云计算能力。
这就是为什么报道围绕谷歌双子座很重要。苹果可以继续改进自己的人工智能模型,但 Siri 需要与助手竞争,这些助手已经理解更长的提示、处理更灵活的语言,并以用户现在期望从 Gemini 和 ChatGPT 等工具获得的深度响应。如果苹果希望 Siri 移动得更快,Gemini 支持的层可以帮助缩小差距,同时苹果保持对用户体验的控制。
Apple Intelligence 已经指出了混合的未来。某些任务在设备上运行。更复杂的请求可以使用私有云计算,这是苹果专注于隐私的服务器系统。可选的 ChatGPT 支持也表明,苹果愿意在外部模型增加价值时将其引入体验中。更深层次的双子座关系将更加重要,因为它可以支持更聪明的 Siri 背后更广泛的智能层。
苹果的设备端人工智能战略具有真正的优势。本地处理数据可以更快、更私密、更容易信任。这也符合苹果的硬件故事,因为每一款新的 iPhone 芯片都会带来更多机器学习通过神经引擎实现性能。
问题是现代人工智能助手不再通过简单的命令来判断。用户期望助手能够理解上下文、总结信息、重写文本、回答后续问题、跨应用程序工作以及完成多步骤请求。这需要的不仅仅是语音界面。它需要一种能够通过请求进行推理并以感觉自然的方式做出响应的语言模型。
iPhone可以处理许多人工智能任务,但它无法运行与云系统相同规模的最大模型。内存、热量、电池寿命和处理能力都限制了一切。苹果可以为重点任务构建更小的模型,但真正有竞争力的 Siri AI 体验可能需要更强大的云支持模型来满足更苛刻的要求。
这就是 Google Gemini 可以发挥作用的地方。谷歌在大规模人工智能基础设施上投入了大量资金,并且已经将 Gemini 内置到了 Android、搜索、Workspace 和其他产品中。苹果对设备体验拥有更好的控制力,但谷歌目前在大语言模型方面拥有更强的公众动力。通过合作,苹果可以更快地改进 Siri,同时又不会放弃 iPhone 与众不同的部分体验。

Gemini 可以帮助 Siri 与 Android 竞争
竞争压力正在迅速增大。谷歌正在将 Gemini 作为 Android 的核心,而三星则依靠谷歌的人工智能模型来实现 Galaxy 功能。如果 Android 用户开始将 Gemini 视为默认的移动助手层,那么苹果就不能让 Siri 在 iPhone 上显得过时。
Siri仍然有一个主要优势:系统访问。它可以以常规聊天机器人无法做到的方式与 Apple 应用程序、设备设置、消息、提醒、日历、音乐、联系人和其他个人区域进行交互。这种访问应该使 Siri 成为世界上最有用的助手之一。问题是,如果助理不能很好地理解请求,仅靠访问是不够的。
Gemini 支持的 Siri 可以将谷歌的模型优势与苹果的平台控制结合起来。谷歌可以帮助语言理解和更广泛的推理。苹果可以对隐私设计、应用程序权限、设备操作以及结果向用户显示的方式承担责任。
这种结构在一个重要方面类似于苹果与谷歌的长期搜索关系:谷歌提供核心功能,而苹果则控制其在自己产品中的显示方式。不同之处在于,人工智能比搜索感觉更个性化。 Siri 处理可能涉及私人消息、位置、联系人、文件、照片和例程的请求。苹果需要清楚地解释何时使用外部模型以及如何保护用户数据。
苹果的隐私宣传仍然很重要
更强大的 Siri 人工智能体验不能以牺牲苹果的隐私信息为代价。苹果多年来一直告诉用户,其产品旨在保护个人数据。 Siri 内部的任何双子座角色都需要兑现这一承诺。
私有云计算是苹果迄今为止最明确的答案。该系统旨在处理云中更复杂的人工智能请求,同时限制数据暴露并使隐私模型可验证。苹果将其描述为一种将 iPhone 智能扩展到设备之外的方法,而无需将用户数据转变为典型的云人工智能产品。
如果 Gemini 成为 Siri 的一部分,苹果可能需要对共享哪些数据、如何处理请求以及谷歌是否可以保留或使用任何信息设置严格的界限。该公司不能让 Siri 感觉像是苹果外壳内的谷歌助手。
这也是混合模型有意义的原因。简单和敏感的任务可以保留在设备上。更复杂的请求可以使用Apple的私有云基础设施。仅当需要或用户允许时才可以使用外部模型。这使得苹果公司的隐私策略保持完整,同时让 Siri 的功能更加强大。
挑战在于清晰度。用户不想管理技术路由系统。他们希望 Siri 能够工作。苹果的工作是在可能的情况下使模型选择不可见,在必要时使模型选择透明。

Siri AI 必须通过个人背景取胜
最聪明的 Siri 版本不会因为比每个聊天机器人都能更好地回答一般问题而获胜。它将通过安全地使用个人上下文而获胜。 Apple 可以访问设备、操作系统、应用程序、传感器、设置和用户例程。这为 Siri 提供了一条 Gemini 或 ChatGPT 无法完全复制的路径。
更强大的 Siri 应该能够找到某人上周发送的文件、总结特定人员错过的消息、调出旅行中的照片、在会议前更改设置、根据屏幕上的内容创建提醒,以及在获得许可的情况下跨应用程序执行操作。这些任务可以让人工智能感觉是 iPhone 原生的,而不是添加到上面的。
苹果已经承诺推出更加个性化的 Siri 作为苹果情报,包括更好地了解个人背景以及跨应用程序采取行动的能力。由于竞争对手行动迅速,这些功能的延迟使得差距变得更加明显。用户现在更加了解现代人工智能助手可以做什么,而 Siri 也是根据更高的标准来评判的。
Gemini 可以在推理层提供帮助,但苹果仍然拥有更重要的产品层。助手需要理解用户的意思,知道允许使用哪些信息,选择正确的应用程序或系统操作,并在不让用户重复请求的情况下完成任务。
这就是苹果的优势仍然存在的地方。 Siri 能够成为更有用的助手,并不是因为它在任何情况下都拥有最大的模型,而是因为它可以将智能与 Apple 设备上的个人行为联系起来。
Apple 智能的更快路径
苹果并不需要 Siri 背后的每个人工智能模型都完全在内部构建。该公司在改进产品时经常使用外部技术,同时将界面、集成和用户体验保持在苹果的控制之下。人工智能使这种平衡变得更加微妙,因为模型会影响语气、质量、信任和可靠性。
Gemini 支持的 Siri这可以被视为苹果承认苹果在生成人工智能方面落后了。这也可能是帮助苹果迎头赶上、同时改进自己的机型的实际举措。对于用户来说,重要的问题会更简单:Siri 最终是否能够理解更多、做得更多、失败次数更少?
最有可能的未来不是一种模式取代另一种模式。 Siri 可能依赖苹果自己的模型来完成许多设备上和个人任务,私有云计算来满足更苛刻的请求,Gemini 来满足某些推理需求,以及可选的第三方模型来满足特殊情况。 Siri 仍然是界面,而底层的模型堆栈则变得灵活。
这种灵活性可能成为苹果应对人工智能竞赛的最佳答案。苹果不必强制每个请求都通过一种模型,而是可以选择最适合任务的工具,同时保持体验一致。用户不必考虑 Siri 是否使用设备上的模型、Apple 的云、Gemini 或其他受支持的系统。结果应该只是让人感觉更有能力。
Siri AI 需要这样的跳跃。苹果拥有硬件、生态系统、隐私故事和发行版。 Gemini 可以赋予它所需的速度和模型强度,以与已经塑造用户期望的最智能助手竞争。





