提升技能创建者:测试、衡量与优化智能代理技能
Skill-creator 现已支持编写评估(evals)、运行基准测试,并帮助您在模型演进过程中保持技能的有效性。这些更新现已在 Claude.ai 和 Cowork 平台上线,同时作为 Claude Code 的插件和我们代码库中的一部分提供。 自去年十月推出 Agent Skills 以来,我们发现大多数技能作者是领域专家而非工程师。他们熟悉自己的工作流程,但缺乏工具来判断技能在新模型下是否
按标签聚合查看文章内容。
Skill-creator 现已支持编写评估(evals)、运行基准测试,并帮助您在模型演进过程中保持技能的有效性。这些更新现已在 Claude.ai 和 Cowork 平台上线,同时作为 Claude Code 的插件和我们代码库中的一部分提供。 自去年十月推出 Agent Skills 以来,我们发现大多数技能作者是领域专家而非工程师。他们熟悉自己的工作流程,但缺乏工具来判断技能在新模型下是否