成功运行4000亿参数模型！iPhone 17 Pro挑战本地大模型执行，速度仅0.6词/秒

发布时间：2026/3/25

智能手机的计算极限在哪里？苹果最新旗舰iPhone 17 Pro给出了一个既令人惊叹又有些尴尬的答案。

3月23日，一款拥有4000亿参数的大型语言模型成功在iPhone 17 Pro上运行。值得注意的是，即使经过量化压缩，这类模型通常至少需要200GB的内存，而iPhone 17 Pro的硬件配置仅为12GB LPDDR5X内存。

技术“黑科技”：闪存流式传输与专家混合模型（MoE）

在内存极度不足的情况下，这一“看似不可能完成的任务”主要依靠两项技术实现：

SSD强制“扩容”：利用开源项目Flash-MoE，设备直接从固态硬盘（SSD）向GPU流式传输数据，突破了物理内存的限制。
MoE架构优势：“MoE”即专家混合模型，意味着系统在生成每个词时只调用4000亿参数中的一小部分，而非加载整个模型。

速度缺陷：每词生成约2秒

虽然“成功运行”，但实际体验仍远未达到“可用”水平。测试结果显示：

生成速度：仅0.6词/秒，换言之，生成一个词大约需要1.5到2秒。
功耗压力：高强度的本地计算迅速消耗手机电量，且产生的热量也不容忽视。

行业洞察：本地大模型的“奇点”正在逼近？

尽管当前速度令人沮丧，但这一演示的象征意义远超其实用价值。它证明了在智能手机上本地运行顶级大模型并非死胡同。

隐私保护：本地运行意味着数据无需上传云端，极大提升隐私安全。
离线可行性：即使无网络连接，也有望获得顶尖AI的响应。

未来，随着技术进步，智能手机本地运行大型AI模型的体验有望大幅提升。

标签

#智能手机 #大模型 #本地计算 #隐私保护 #技术突破

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

隐私驱动的DuckDuckGo用户激增，谷歌大力推进人工智能引发关注

2026/05/28

隐私驱动的DuckDuckGo用户激增，谷歌大力推进人工智能引发关注

随着谷歌在I/O大会上推出多项AI功能，注重隐私保护的搜索引擎DuckDuckGo迎来用户增长。

日本PIXTA终止AI生成素材销售，但不否定AI技术应用

2026/05/28

日本PIXTA终止AI生成素材销售，但不否定AI技术应用

由日本PIXTA运营的照片、插画、视频及音乐素材市场平台“PIXTA”于5月22日正式停止销售“AI生成素材”。早在4月20日，PIXTA便已停止接受新的AI生成内容申请，此次则是终止了此前作为“AI生成素材”进行销售的作品。不过，考虑到AI技术在当今创意领域的广泛应用，公司表示将允许创作者在不大幅修改其亲自拍摄或创作作品的前提下，辅助性地使用AI技术。此前，PIXTA尊重AI作为新表达手法

软银与美国MODE达成资本及业务合作，利用生成式AI与物联网提升建筑及制造现场决策水平

2026/05/02

软银与美国MODE达成资本及业务合作，利用生成式AI与物联网提升建筑及制造现场决策水平

日本软银株式会社与美国MODE公司于28日宣布，双方将通过生成式人工智能（AI）与物联网（IoT）技术的结合，推动建筑和制造现场基于数据的高级决策实现。此次合作旨在整合MODE在现场数据整合与结构化方面的技术优势，与软银在生成式AI、云服务、通信网络及企业客户基础的资源，促进现场业务中数据应用的推广与深化。 MODE公司提供的解决方案型物联网平台“BizStack（ビズスタック）”能够实现现场数据