AI世界进入“循环”时代

在上周五，Claude Code的创始人Boris Cherny出席了Meta的@Scale大会，令人意外的是，观众提出的第一个问题竟然是关于“循环”的。

提问者问道：“循环是下一波炒作热点，还是确实有实际意义？”

Cherny的回答非常肯定：“是的，循环是真实存在的。”

他继续解释道：“两年前，我们还在手写源代码。随后开始让智能代理来编写代码。现在，我们正迈向让代理去提示其他代理来写代码的阶段。就像从手写代码到代理编写代码是一个巨大飞跃一样，循环同样是一个重要且巨大的进步。”

在演讲后半段（YouTube视频约32分钟处），Cherny具体介绍了他自己工作中运行的循环机制。一个代理不断寻找改进代码架构的方法，另一个代理则寻找可以合并的重复抽象。他们像普通程序员一样提交代码合并请求，由于代码持续变化，这些循环永不停歇。

这是一个非常强大的理念，尤其是由Cherny这样的重要人物推动。随着智能代理AI的兴起，大多数用户关注的是如何更好地管理代理：设定明确目标，检查阶段性进展，防止代理偏离初衷。而循环机制更进一步，授权一群代理在后台持续不断地工作，永无止境。这对AI的信任度提出了很高要求，但随着模型快速进步，这或许是让AI真正承担实际工作的下一步。

首先需要明确的是，这并非全新概念。递归循环——即函数自我调用以重复执行某个动作，并带有终止条件——是计算机科学入门课程的基础。这些循环遵循非确定性逻辑，即由子代理决定何时停止循环，而非明确条件，但基本思路相同。随着程序员开始利用AI完成任务，AI监督AI的递归循环模式必然出现。

与传统计算不同，智能代理循环可能非常简单。其中一个流行的技巧是“Ralph循环”（以《辛普森一家》中的角色Ralph Wiggum命名），它会总结模型已完成的工作，并询问是否达成目标。这种方法帮助模型避免长时间运行时迷失方向，实质上是让模型反复确认直到任务完成。

另一种理解循环的方式是将其视为测试时计算资源投入的延伸。正如OpenAI研究员Noam Brown本月早些时候指出，现代模型只要投入足够计算资源，几乎可以解决任何问题。这意味着确保问题解决的一个方法就是不断投入计算资源直到完成。对于像改进代码库这样的爬坡式问题，模型可以持续做出渐进改进，直到达到预定阈值。正如Cherny的例子，模型可以只要有计算资源就持续改进。

如果听起来成本高昂，那确实如此。与简单的问答聊天机器人相比，智能代理循环消耗的令牌更多，而且由于循环需要持续运行，花费没有上限。对于Anthropic这类以销售令牌为业务的公司来说无妨，但对其他用户来说，这可能是一种昂贵的工作方式。

不过，视具体问题和合理的监督机制（包括令牌消耗、偏移和其他AI常见问题）而定，智能代理循环带来的收益可能远远超过成本。

AI世界进入“循环”时代

标签

评论

相关阅读

Cursor推出全新AI代理体验，挑战Claude Code和Codex

亲爱的谷歌，请别再提《毁灭战士》了

日本NTT数据先进技术公司在本地封闭环境中验证本地大型语言模型的应用技术