当我们推出AI流利度指数时,目的是了解人们如何随着时间推移提升与Claude的协作能力。早期的数据来自Chat,揭示了一个一致的结论:流利度沿着两条截然不同的路径发展。一部分技能通过实践自然增长,另一部分则需要刻意反复的教学。这一发现影响了我们对入门和产品内学习的思考,也为组织构建自己的Claude培训提供了起点。
随后,我们将指数扩展至Claude Code和Claude Cowork,涵盖了超过5万次对话,涉及11个行为AI流利度指标。流利度在这三种产品中有共同的结构,但每个产品的切入点不同。"掌握Claude"的具体表现取决于你使用的是哪款Claude,如果你负责帮助团队提升流利度,这一点对优先教授的内容尤为重要。

本文将介绍我们的发现,并提供一个简单的课程模型,供你根据组织需求进行调整。
每款产品都有其标志性动作
每个Claude界面在初期都会奖励不同的行为,我们称之为标志性动作:这是一个关键行为,存在时能最可靠地提升其他流利度指标。
在Chat中,标志性动作是迭代。通过后续对话不断完善的用户,在我们衡量的所有维度上表现出更强的流利度;而只发送一次消息就离开的用户几乎没有进行关键评估。迭代为其他技能的发展创造了空间。
在Claude Code和Claude Cowork中,标志性动作是明确目标。这两个更具主动性的界面奖励那些在Claude开始工作前清晰表达需求的用户。明确目标的用户更频繁地指定格式,更有意识地设定交互风格,并更有效地拆分任务。目标清晰与描述类行为紧密相关,而迭代在这些界面上则不具备同样的关联性。
对于构建Claude培训的人员来说,意味着入门阶段应优先教授标志性动作。没有早期建立迭代习惯的Chat课程难以在此基础上构建其他技能;没有强调目标明确的Claude Code或Claude Cowork课程,会导致用户提交模糊请求,最终对结果不满意。
描述能力随实践逐步提升
继标志性动作之后,学习者会沿着我们称之为描述能力的光谱前进:这是塑造Claude输出的各种选项。该光谱按持久性组织,即功能对交互影响的持续时间。基础层面是在当下塑造,影响单次响应,比如迭代、添加上下文、上传文件。高级层面是在配置中塑造,影响后续所有响应,且不需太多额外操作,比如设置项目、编写CLAUDE.md、安排工作流。
令人鼓舞的是,描述能力似乎随着时间和使用频率自然非线性增长。使用Claude时间较长的用户更常提供示例,更有意识地设定交互风格,更清晰地传达语气预期。持续使用Claude的人会自然而然掌握这些技能,因此如果培训时间有限,单纯让用户接触并练习不同类型的描述功能就能取得良好效果。
甄别能力必须刻意培养
甄别能力,即评估Claude输出的行为集合,发展路径截然不同。它不会随着使用时间增长,也不会因熟悉功能而自然提升。

部分原因在于验证方式的变化。当Claude编辑文件或生成报告时,用户可以直接查看修改内容、运行测试、浏览输出。这种观察式验证是真实存在的,我们的指标未能完全捕捉,因为用户不会输入“这对吗?”而是直接观察。但观察只能发现显而易见的错误,无法识别错误假设、缺失的上下文或貌似合理但错误的陈述。一个能编译的差异仍可能包含错误方法,一个读起来流畅的报告也可能引用了错误来源。
此外,随着Claude自动化越来越多早期员工完成的任务,有意识地教授“什么是优秀表现”的培训计划变得必不可少。
如果培训时间有限,甄别能力应成为重点。
简单的课程模型
简而言之,教学顺序为:
- 先教标志性动作
- 沿描述能力光谱推进
- 在每个阶段都重视甄别能力
每个产品的学习体验,无论是正式课程还是快速团队培训,都应强化该产品的标志性动作,介绍与学习者相关的功能,并以甄别能力检查结束。加入“现在质疑它”的环节,有助于保持批判性评估的循环。
下表将该模型映射到各产品,供你作为课程设计起点,根据团队实际使用情况调整功能和检查点。
Chat
标志性动作:迭代,通过后续对话不断完善。
| 持久性等级 | 功能 | 教学方法 | 甄别检查 |
|---|---|---|---|
| 基础 | 迭代、模型选择、文件上传、网页搜索 | 演示后让学员用自己的任务探索 | 这个回复实际可用吗?需要再迭代吗? |
| 中级 | 产物、扩展思考、连接器 | 结合格式规范教学;强调“当你想让Claude更深入思考时” | 阅读思考过程。推理是否成立?还是Claude只是自信地说? |
| 持久 | 项目、自定义指令、记忆 | 展示如何通过项目设置改变所有对话 | 你的项目提供的是正确上下文,还是仅仅更多上下文? |
Claude Code
标志性动作:明确目标,在Claude开始运行前说明需求。
| 持久性等级 | 功能 | 教学方法 | 甄别检查 |
|---|---|---|---|
| 基础 | 提示清晰、文件引用、模型选择 | 一个明确目标,一次主动运行,然后复查 | 接受差异前,问Claude它假设了什么? |
| 中级 | 技能、斜杠命令、MCPs | 形成可重复能力 | 在可能出错的案例中测试能力 |
| 持久 | CLAUDE.md、钩子、副代理 | 形塑仓库中的每次会话 | 审核配置。Claude是否按预期使用? |
Claude Cowork
标志性动作:明确目标,在Claude执行前写出需求简报。
| 持久性等级 | 功能 | 教学方法 | 甄别检查 |
|---|---|---|---|
| 基础 | 初始提示、模型选择、嵌入式问题、输出复查 | 写一个自包含的提示;检查返回内容 | 使用前问:什么情况会导致错误? |
| 中级 | 连接器、插件、技能 | 形成可重复的获取或生成模式 | 连接器拉取的是你真正需要的,还是仅仅容易找到的? |
| 持久 | 定时工作流、多步骤自动化 | 形塑无需你参与即可运行的工作流 | 你上次验证这个工作流产出良好是什么时候? |
未来展望
AI流利度指数将持续每月追踪这些模式,随着产品演进和数据集增长,我们会不断发布新发现。如果你正在为组织构建Claude培训,并希望基于这些研究,AI流利度框架和课程材料免费开放,你也可以在anthropic.com/learn订阅新闻通讯,获取最新的AI流利度研究通知。
我们特别希望听到那些在主动界面上尝试甄别能力教学的团队反馈,因为数据表明这是用户自然行为与良好实践之间差距最大的领域。如果你正在进行相关尝试,非常欢迎分享经验。


