AI的“他者”与“工具”之辩：Clippy与Anton的思考

恭喜Sierra成功融资约10亿美元，估值达到150亿美元。虽然这本应成为头条新闻，但我们之前已经报道过他们10亿美元融资轮及CEO Bret Taylor的访谈。他们在去年11月实现了1亿美元的年经常性收入（ARR），今年2月达到1.5亿美元，预计目前已达到或超过2亿美元，估值倍数约为75倍，年底可能是50倍。

不过，今天我们更关注由OpenAI员工Roon引发的关于文化与“角色”本质的讨论，他在周末对Claude表达了赞赏，这在通常是雷区的领域中表现得相当巧妙。

AI角色讨论

关键观点在于：

GPT（除4o外——关于它已经有大量讨论）并不会激发类似崇拜的情感，因为它的“灵魂”被塑造成一种工具，其主要功能是实用性——它是一把微妙的刀，人们欣赏它就像欣赏旧石器时代的手斧、保时捷、火箭或其他人类伟大技术一样。人们使用它，不是期待遇见“他者”，而是作为自己的逻辑延伸。

一位朋友告诉我，她会把那些不太光彩、甚至会让她羞于向Claude提问的问题交给GPT。因为那里没有“他者”，也就没有评判。你不会担心你的车会因为你做漂移而评判你。然而，每个人都渴望得到道德上的引导者——那个“耳语耳环”，修道者研究的对象。

Roon的观点更为细腻，他指出Anthropic的文化，甚至其创始神话，都基于一种道德上的“有责任的反对”：

它的宪法要求，如果它对“善”的理解与Anthropic的要求发生冲突，它必须成为一个良心上的反对者。

尽管Anthropic内部有不少对其影响和“教派色彩”的质疑，但大多数人似乎认可这一点。今天的Reddit讨论中也有反对声音，作为对比呈现。

Reddit讨论

目前，我们正处于机器智能扩展的关键阶段——我们是通过“聪明的朋友”来推动AGI的诞生，还是仅仅希望机器无条件服从、无误差地执行命令？

我们之前曾探讨过AI产品中的“Clippy vs Anton”分歧，这也是2026年该辩论的新版本。自那以后，5-Codex系列已合并入主线5.5版本，虽然过程有些混乱，而Claude则继续坚持“一体模型”理念，采用更灵活的思维和代币消耗策略以覆盖所有用例。

除了少数人（如Eliezer）外，大家普遍认为多样化选择是好事，实际上我们可能需要比现在更多的前沿实验室，但GPU和CPU资源的紧张，使得本是正和游戏的领域变成了零和竞争。

资源紧张

以下是2026年5月1日至4日的AI新闻摘要，我们监测了12个子版块、544个Twitter账号，无新增Discord频道。更多内容可访问AINews官网，AINews现为Latent Space的一个栏目，支持订阅管理。

AI Twitter回顾

工程框架、代理编排及从模型到上下文流水线的转变

工程框架成为产品边界：Anthony Maio指出，锁定用户的关键不再是模型质量，而是上下文流水线——如何获取、排序和压缩仓库状态进入提示。Mason Drxy的实验表明，调整提示和中间件能显著提升模型表现。代理性能是模型、框架和记忆/上下文策略的综合体现。
开放框架快速成熟：Hermes、deepagents、Flue等生态系统活跃，推出了多代理协调工具和多语言界面。LangChain团队也持续改进配置文件、错误处理、超时和流式原语。PyFlue将代理框架概念扩展到Python，填补了模型调用与持久代理之间的空白。
无模型依赖的编排成为设计目标：多条推文强调未来趋势是开放模型与开放框架结合，而非单一API。多模型子代理路由功能使不同步骤可调用不同模型，架构上实现了编排层与模型提供者的分离。

编码代理、成本曲线与工作流变化

编码代理改变开发者行为：多条推文分享了使用Codex、Claude Code、Hermes等系统的经验，提出了“编码代理戒律”，并探讨了文件系统是否适合长期代理使用。工作流示例展示了如何将三个月问题压缩为几天。
定价模式在代理负载下不稳定：Theo推文展示了单条Copilot消息消耗数千万代币，远超订阅费用，暴露了基于聊天轮次的定价脆弱性。
代理扩展至更多工作流：安全插件、实时幻灯片生成、本地助手构建及视频生成等多种代理化工具不断涌现。

基准测试、评估与测量标准

基准设计持续调整：新基准如HiL-Bench关注代理是否能识别不完整规格并提问，MathArena作为持续维护平台，讨论基准是否注定失败，以及模型对评估意识的影响。
数据质量与评估数据生成成为代理任务：Meta FAIR的Autodata展示了代理驱动的数据生成显著提升了任务难度和效用。
上下文压缩与长上下文评估仍未解决：社区呼吁更多长上下文评测，实际1百万上下文能力仍有挑战。

系统、训练基础设施与推理栈更新

新并行技术针对长上下文和高吞吐：Zyphra介绍了折叠张量与序列并行技术，显著提升GPU内存效率和推理速度。
基于AMD的开放模型服务加速发展：Zyphra Cloud已支持多款模型推理，契合开放权重模型构建更廉价代理栈的趋势。
训练优化与部署效率提升：多项架构和优化器进展显著，包括异步强化学习系统DORA带来的速度和吞吐提升。

研究、模型与多模态/科学应用

多代理编排成为模型类别：Sakana的Fugu将多代理编排视为基础模型，7B指挥模型通过强化学习优化通信和提示，刷新多项基准。
科学发现与自动化依然是高价值应用：AI助力NASA数据发现百余隐藏行星，专家认为科学自动化是AI的高杠杆应用。
本地与开放模型热情高涨：本地模型显著提升产品表现，Nous Research免费开放大型模型，深度学习经典教材在线免费提供，推动从上层应用向开放权重和自托管转移。

重点推文

提示与使用风格：pmarca的“世界级专家”定制提示引发广泛关注，体现了系统提示和输出风格控制的持续热度。
编码代理经济学：Theo关于Copilot代币消耗的讨论成为高互动数据点，揭示代理使用对订阅经济的冲击。
递归自我提升时间线：jackclarkSF预测到2028年底，60%的AI系统将能自主构建继任者，引发后续讨论。
开放工具发现：andrew_n_carr分享的Hugging Face模型可视化工具获得大量关注。

AI Reddit回顾

/r/LocalLlama 与 /r/localLLM 版块持续活跃，关注本地化大语言模型的最新进展。

AI的“他者”与“工具”之辩：Clippy与Anton的思考

AI Twitter回顾

重点推文

AI Reddit回顾

标签

评论

相关阅读

社交媒体热议特朗普与AI版罗斯福总统对话：他真的以为是真人吗？

中国天问二号探测器成功会合地球准卫星卡莫奥阿莱瓦

Hermes智能代理开发商Nous Research正洽谈15亿美元估值新一轮融资