M5 芯片在本地 LLM 性能方面比 M4 显着提升 Apple 展示了与 M4 相比,M5 处理本地大型语言模型的速度要快得多,并且设备上的 AI 工作负载也显着提升。

苹果公司分享了新的性能测试,展示了M5芯片与去年的 M4 相比,显着提高了本地大语言模型处理能力。根据 9to5Mac 的报道,苹果运行了一系列受控基准测试,测量了这两款芯片如何处理设备上的 LLM 工作负载,强调了新架构在不依赖云服务器的情况下编译、加载和处理模型的速度有多快。

比较使用相同的型号、相同的内存配置和相同的系统环境。在一切都受控的情况下,苹果的测试表明,M5 完成相同任务的时间远少于 M4,这说明了苹果在其最新芯片中内置的代际跳跃。

设备上模型速度的飞跃

基准测试重点关注运行推理循环、处理多步骤文本生成、将模型加载到内存以及处理扩展提示等操作。在苹果的内部演示中,M5 始终以明显更高的速度完成这些操作。结果与该芯片的早期技术披露密切相关,其中强调了带宽的改进、神经引擎资源的扩展以及专为高强度并行工作负载而设计的更新的内核。

对于日常用户来说,这些收益意味着依赖 Apple Intelligence 的功能(包括实时功能)总结、重写工具、翻译和上下文处理——运行更流畅、响应更快速。使用本地或混合模型架构的开发人员也受益于吞吐量的增加,特别是在为设备上执行进行原型设计或优化应用程序时。

为什么本地法学硕士的表现很重要

转向运行模型直接在 Apple 硬件上减少了对连续云请求的需求,提供更快的响应时间并改善隐私。随着设备端工作负载的扩展,性能空间变得至关重要。 M5 似乎正是实现了这一点,实现了更雄心勃勃的 Apple Intelligence 功能,并为第三方开发人员提供了试验更先进的设备逻辑的空间。

苹果对本地处理的重视也与更广泛的行业走向边缘计算的运动相一致。随着模型变得更加高效,并且随着苹果芯片的能力变得越来越强大,更多的任务可以直接在设备上处理,而无需依赖数据中心规模的基础设施。

改进背后的架构

Apple 的性能提升源于 M5 一代引入的多项架构变化。其中包括针对持续负载进行调整的更新的 CPU 和 GPU 内核、更高的内存带宽以及专为加速模型推理而设计的神经引擎。综合效果可产生更快的令牌生成、长时间运行期间的更稳定的性能以及交互式 AI 功能期间更低的延迟。

该公司的测试表明,M5 的改进并不局限于理想条件。即使在较重的系统负载下,该芯片也保持了优于同类芯片的一贯优势。本地模型任务中的 M4。这使得 M5 成为以 Apple Intelligence 为中心的下一波软件更新的更坚实基础。

性能飞跃有助于为 Apple 2025-2026 年硬件周期建立基线。随着苹果生态系统的扩展,采用 M5 的设备(包括 MacBook Pro、iPad Pro 和 Vision Pro)能够处理日益复杂的人工智能工作流程。该公司的演示还表明,未来的芯片(包括预期的 M6 系列)可能会进一步推动这一趋势。

随着 Apple 在系统应用程序、编写工具、开发框架和创意工作流程中添加更多生成和上下文感知功能,M5 等芯片成为流畅、实时性能的实际需求。为 Apple Intelligence 构建工具的开发人员在设计更深层次的集成时可能会以 M5 级硬件为基准。

随着 Apple 芯片路线图的继续发展,本地模型性能变得与传统 CPU 和 GPU 指标一样重要。苹果的早期测试表明,M5 在这一领域远远领先于其前身,为更以人工智能为中心的一代设备奠定了基础。