在我们的系列文章《初创企业如何利用Claude构建》中,我们展示了初创企业如何通过AI改变各自行业。本文将分享CodeRabbit如何构建一个在AI生成代码前进行规划的代理编排层。
AI编码工具大幅缩短了从创意到可运行原型的时间。作为一家AI代码审查平台,CodeRabbit注意到一个伴随效率提升而来的新趋势:代码虽然能编译通过测试,但却未能实现团队真正想要构建的功能。
CodeRabbit的AI副总裁David Loker指出,问题根源在于模型输入之前。经验丰富的开发者往往假设编码代理能理解他们的上下文,因此不会详细写出那些对他们来说显而易见的需求。结果,编码代理会用它认为合理的内容来填补这些空白。
为了解决这个问题,CodeRabbit利用Claude设计并构建了一个代理编排系统,在生成代码之前先执行结构化的规划阶段。团队的核心假设是:规划质量决定输出质量,随着代码生成成本降低,错误方向带来的代价反而更高。
解决AI编码中的内部知识鸿沟
CodeRabbit团队在分析客户的AI生成拉取请求时发现,最常见的失败模式是代码虽然能编译并通过测试,但仍未解决预期问题。
Loker说:“随着开发经验的积累,我们会将知识内化,所有细节都存在脑海中,假设其他开发者也知道。但我们也同样假设AI系统隐含理解这些内容,甚至自己都没意识到这一点。”
模糊的提示语迫使系统用它认为合理的内容填补空白,而这种猜测往往与开发者的初衷不符。
Loker举了一个个人例子:他在一个副项目中构建内存系统时,花了数小时与编码代理反复调试,直到程序能运行。结果当他询问如何使用时,代理告诉他需要传入用户令牌,但系统没有登录页面。他虽然指定了需要用户,但没明确用户需要登录方式,代理就自行填补了这个空白,导致产品缺少入口。
“结果是你会在这个基础上构建更多功能,直到很晚才发现问题。在AI工作流中,后期验证代价非常高。”
在AI编码前增加编排层
CodeRabbit的解决方案是在代码生成前插入规划系统。它协调多个Claude模型,分析需求并揭示假设,生成结构化执行计划,明确构建内容及约束条件。

Loker表示:“这个规划系统不是替代Claude Code的计划模式,而是更高层次的编排,先于Claude Code运行,确保所有必须明确的内容都被明确,所有假设都被识别。”
输出是一个协作式产品需求文档(PRD):包含完整上下文、经团队利益相关者验证并在实施前审查。Claude Code基于该计划生成细化的实施方案。该计划成为共享文档,记录决策及原因,帮助团队避免返工、验证输出是否符合初衷,也方便新工程师入职。
在Claude模型家族中进行任务路由
CodeRabbit根据任务复杂度匹配不同模型层级,以优化成本和响应时间。Opus负责编排循环和战略层面的理解与方向设定;Sonnet将输出转化为结构化规划步骤;Haiku处理范围狭窄的操作,如上下文提炼和特定工具调用,适合小模型回答的具体问题。
Loker说:“如果Haiku在某任务表现与Sonnet相当,我们就用Haiku;如果评估显示给Opus更多空间能提升计划质量,我们就给它更多空间,我们不靠猜测。”
构建计划质量评估体系
CodeRabbit已有成熟的代码审查评估系统,但缺乏对规划输出的评估。搭建这套基础设施成为独立项目。
系统从手工调优示例和人工检查开始,团队开发了一套LLM评审库,针对计划质量的具体维度打分。由于计划最终生成代码,团队还能衡量代码是否有效、是否包含额外范围以及生成所需的token数量。通过对比有无规划步骤的同一任务,团队能独立评估规划的价值。
Loker说:“我们没预料到计划的细节层次该如何把握。过于细致的计划一旦代码库变动就过时,过于宏观的计划又会让代理自行填补假设,正是规划层想要避免的问题。找到合适的抽象层次需要反复迭代,评估体系让这成为可能。”
在代码生成前捕捉错误
在AI原生编码工作流中,许多过去在代码审查阶段才发现的决策,现在提前在规划层做出。构建团队可审查并达成一致的计划,有助于及早发现错误。
Loker总结:“我们利用Claude生态系统构建了一个全团队的规划系统。计划本身成为质量关卡,只要确保计划质量足够高,下游效果非常显著,最终产出代码质量大幅提升。”
立即在Claude平台上构建你的初创企业。


