在上周五,Claude Code的创始人Boris Cherny出席了Meta的@Scale大会,令人意外的是,观众提出的第一个问题竟然是关于“循环”的。
提问者问道:“循环是下一波炒作热点,还是确实有实际意义?”
Cherny的回答非常肯定:“是的,循环是真实存在的。”
他继续解释道:“两年前,我们还在手写源代码。随后开始让智能代理来编写代码。现在,我们正迈向让代理去提示其他代理来写代码的阶段。就像从手写代码到代理编写代码是一个巨大飞跃一样,循环同样是一个重要且巨大的进步。”
在演讲后半段(YouTube视频约32分钟处),Cherny具体介绍了他自己工作中运行的循环机制。一个代理不断寻找改进代码架构的方法,另一个代理则寻找可以合并的重复抽象。他们像普通程序员一样提交代码合并请求,由于代码持续变化,这些循环永不停歇。
这是一个非常强大的理念,尤其是由Cherny这样的重要人物推动。随着智能代理AI的兴起,大多数用户关注的是如何更好地管理代理:设定明确目标,检查阶段性进展,防止代理偏离初衷。而循环机制更进一步,授权一群代理在后台持续不断地工作,永无止境。这对AI的信任度提出了很高要求,但随着模型快速进步,这或许是让AI真正承担实际工作的下一步。

首先需要明确的是,这并非全新概念。递归循环——即函数自我调用以重复执行某个动作,并带有终止条件——是计算机科学入门课程的基础。这些循环遵循非确定性逻辑,即由子代理决定何时停止循环,而非明确条件,但基本思路相同。随着程序员开始利用AI完成任务,AI监督AI的递归循环模式必然出现。
与传统计算不同,智能代理循环可能非常简单。其中一个流行的技巧是“Ralph循环”(以《辛普森一家》中的角色Ralph Wiggum命名),它会总结模型已完成的工作,并询问是否达成目标。这种方法帮助模型避免长时间运行时迷失方向,实质上是让模型反复确认直到任务完成。
另一种理解循环的方式是将其视为测试时计算资源投入的延伸。正如OpenAI研究员Noam Brown本月早些时候指出,现代模型只要投入足够计算资源,几乎可以解决任何问题。这意味着确保问题解决的一个方法就是不断投入计算资源直到完成。对于像改进代码库这样的爬坡式问题,模型可以持续做出渐进改进,直到达到预定阈值。正如Cherny的例子,模型可以只要有计算资源就持续改进。
如果听起来成本高昂,那确实如此。与简单的问答聊天机器人相比,智能代理循环消耗的令牌更多,而且由于循环需要持续运行,花费没有上限。对于Anthropic这类以销售令牌为业务的公司来说无妨,但对其他用户来说,这可能是一种昂贵的工作方式。
不过,视具体问题和合理的监督机制(包括令牌消耗、偏移和其他AI常见问题)而定,智能代理循环带来的收益可能远远超过成本。


