恭喜Sierra成功融资约10亿美元,估值达到150亿美元。虽然这本应成为头条新闻,但我们之前已经报道过他们10亿美元融资轮及CEO Bret Taylor的访谈。他们在去年11月实现了1亿美元的年经常性收入(ARR),今年2月达到1.5亿美元,预计目前已达到或超过2亿美元,估值倍数约为75倍,年底可能是50倍。

不过,今天我们更关注由OpenAI员工Roon引发的关于文化与“角色”本质的讨论,他在周末对Claude表达了赞赏,这在通常是雷区的领域中表现得相当巧妙。

AI角色讨论

关键观点在于:

GPT(除4o外——关于它已经有大量讨论)并不会激发类似崇拜的情感,因为它的“灵魂”被塑造成一种工具,其主要功能是实用性——它是一把微妙的刀,人们欣赏它就像欣赏旧石器时代的手斧、保时捷、火箭或其他人类伟大技术一样。人们使用它,不是期待遇见“他者”,而是作为自己的逻辑延伸。

一位朋友告诉我,她会把那些不太光彩、甚至会让她羞于向Claude提问的问题交给GPT。因为那里没有“他者”,也就没有评判。你不会担心你的车会因为你做漂移而评判你。然而,每个人都渴望得到道德上的引导者——那个“耳语耳环”,修道者研究的对象。

Roon的观点更为细腻,他指出Anthropic的文化,甚至其创始神话,都基于一种道德上的“有责任的反对”:

它的宪法要求,如果它对“善”的理解与Anthropic的要求发生冲突,它必须成为一个良心上的反对者。

尽管Anthropic内部有不少对其影响和“教派色彩”的质疑,但大多数人似乎认可这一点。今天的Reddit讨论中也有反对声音,作为对比呈现。

Reddit讨论

目前,我们正处于机器智能扩展的关键阶段——我们是通过“聪明的朋友”来推动AGI的诞生,还是仅仅希望机器无条件服从、无误差地执行命令?

我们之前曾探讨过AI产品中的“Clippy vs Anton”分歧,这也是2026年该辩论的新版本。自那以后,5-Codex系列已合并入主线5.5版本,虽然过程有些混乱,而Claude则继续坚持“一体模型”理念,采用更灵活的思维和代币消耗策略以覆盖所有用例。

除了少数人(如Eliezer)外,大家普遍认为多样化选择是好事,实际上我们可能需要比现在更多的前沿实验室,但GPU和CPU资源的紧张,使得本是正和游戏的领域变成了零和竞争。

资源紧张

以下是2026年5月1日至4日的AI新闻摘要,我们监测了12个子版块、544个Twitter账号,无新增Discord频道。更多内容可访问AINews官网,AINews现为Latent Space的一个栏目,支持订阅管理。

AI Twitter回顾

工程框架、代理编排及从模型到上下文流水线的转变

  • 工程框架成为产品边界:Anthony Maio指出,锁定用户的关键不再是模型质量,而是上下文流水线——如何获取、排序和压缩仓库状态进入提示。Mason Drxy的实验表明,调整提示和中间件能显著提升模型表现。代理性能是模型、框架和记忆/上下文策略的综合体现。

  • 开放框架快速成熟:Hermes、deepagents、Flue等生态系统活跃,推出了多代理协调工具和多语言界面。LangChain团队也持续改进配置文件、错误处理、超时和流式原语。PyFlue将代理框架概念扩展到Python,填补了模型调用与持久代理之间的空白。

  • 无模型依赖的编排成为设计目标:多条推文强调未来趋势是开放模型与开放框架结合,而非单一API。多模型子代理路由功能使不同步骤可调用不同模型,架构上实现了编排层与模型提供者的分离。

编码代理、成本曲线与工作流变化

  • 编码代理改变开发者行为:多条推文分享了使用Codex、Claude Code、Hermes等系统的经验,提出了“编码代理戒律”,并探讨了文件系统是否适合长期代理使用。工作流示例展示了如何将三个月问题压缩为几天。

  • 定价模式在代理负载下不稳定:Theo推文展示了单条Copilot消息消耗数千万代币,远超订阅费用,暴露了基于聊天轮次的定价脆弱性。

  • 代理扩展至更多工作流:安全插件、实时幻灯片生成、本地助手构建及视频生成等多种代理化工具不断涌现。

基准测试、评估与测量标准

  • 基准设计持续调整:新基准如HiL-Bench关注代理是否能识别不完整规格并提问,MathArena作为持续维护平台,讨论基准是否注定失败,以及模型对评估意识的影响。

  • 数据质量与评估数据生成成为代理任务:Meta FAIR的Autodata展示了代理驱动的数据生成显著提升了任务难度和效用。

  • 上下文压缩与长上下文评估仍未解决:社区呼吁更多长上下文评测,实际1百万上下文能力仍有挑战。

系统、训练基础设施与推理栈更新

  • 新并行技术针对长上下文和高吞吐:Zyphra介绍了折叠张量与序列并行技术,显著提升GPU内存效率和推理速度。

  • 基于AMD的开放模型服务加速发展:Zyphra Cloud已支持多款模型推理,契合开放权重模型构建更廉价代理栈的趋势。

  • 训练优化与部署效率提升:多项架构和优化器进展显著,包括异步强化学习系统DORA带来的速度和吞吐提升。

研究、模型与多模态/科学应用

  • 多代理编排成为模型类别:Sakana的Fugu将多代理编排视为基础模型,7B指挥模型通过强化学习优化通信和提示,刷新多项基准。

  • 科学发现与自动化依然是高价值应用:AI助力NASA数据发现百余隐藏行星,专家认为科学自动化是AI的高杠杆应用。

  • 本地与开放模型热情高涨:本地模型显著提升产品表现,Nous Research免费开放大型模型,深度学习经典教材在线免费提供,推动从上层应用向开放权重和自托管转移。

重点推文

  • 提示与使用风格:pmarca的“世界级专家”定制提示引发广泛关注,体现了系统提示和输出风格控制的持续热度。

  • 编码代理经济学:Theo关于Copilot代币消耗的讨论成为高互动数据点,揭示代理使用对订阅经济的冲击。

  • 递归自我提升时间线:jackclarkSF预测到2028年底,60%的AI系统将能自主构建继任者,引发后续讨论。

  • 开放工具发现:andrew_n_carr分享的Hugging Face模型可视化工具获得大量关注。

AI Reddit回顾

/r/LocalLlama 与 /r/localLLM 版块持续活跃,关注本地化大语言模型的最新进展。