AI教程不用改权重也能赢过 GRPO:GEPA 如何把一条轨迹榨干用到极致
伯克利团队提出 GEPA:不调模型权重、不用 GPU 训练,只靠“读懂轨迹+改提示”,在 35 倍更少采样下击败 GRPO 超 10 分。本文拆解它为何有效、适用场景,以及如何在 DSPy 中上手。
按标签聚合查看文章内容。
AI教程伯克利团队提出 GEPA:不调模型权重、不用 GPU 训练,只靠“读懂轨迹+改提示”,在 35 倍更少采样下击败 GRPO 超 10 分。本文拆解它为何有效、适用场景,以及如何在 DSPy 中上手。