#技能测试 - AI情报

AI资讯2026/03/17

提升技能创建者：测试、衡量与优化智能代理技能

Skill-creator 现已支持编写评估（evals）、运行基准测试，并帮助您在模型演进过程中保持技能的有效性。这些更新现已在 Claude.ai 和 Cowork 平台上线，同时作为 Claude Code 的插件和我们代码库中的一部分提供。自去年十月推出 Agent Skills 以来，我们发现大多数技能作者是领域专家而非工程师。他们熟悉自己的工作流程，但缺乏工具来判断技能在新模型下是否