当我们推出AI流利度指数时,目的是了解人们如何随着时间推移提升与Claude的协作能力。早期的数据来自Chat,揭示了一个一致的结论:流利度沿着两条截然不同的路径发展。一部分技能通过实践自然增长,另一部分则需要刻意反复的教学。这一发现影响了我们对入门和产品内学习的思考,也为组织构建自己的Claude培训提供了起点。

随后,我们将指数扩展至Claude Code和Claude Cowork,涵盖了超过5万次对话,涉及11个行为AI流利度指标。流利度在这三种产品中有共同的结构,但每个产品的切入点不同。"掌握Claude"的具体表现取决于你使用的是哪款Claude,如果你负责帮助团队提升流利度,这一点对优先教授的内容尤为重要。

Claude流利度课程

本文将介绍我们的发现,并提供一个简单的课程模型,供你根据组织需求进行调整。

每款产品都有其标志性动作

每个Claude界面在初期都会奖励不同的行为,我们称之为标志性动作:这是一个关键行为,存在时能最可靠地提升其他流利度指标。

在Chat中,标志性动作是迭代。通过后续对话不断完善的用户,在我们衡量的所有维度上表现出更强的流利度;而只发送一次消息就离开的用户几乎没有进行关键评估。迭代为其他技能的发展创造了空间。

在Claude Code和Claude Cowork中,标志性动作是明确目标。这两个更具主动性的界面奖励那些在Claude开始工作前清晰表达需求的用户。明确目标的用户更频繁地指定格式,更有意识地设定交互风格,并更有效地拆分任务。目标清晰与描述类行为紧密相关,而迭代在这些界面上则不具备同样的关联性。

对于构建Claude培训的人员来说,意味着入门阶段应优先教授标志性动作。没有早期建立迭代习惯的Chat课程难以在此基础上构建其他技能;没有强调目标明确的Claude Code或Claude Cowork课程,会导致用户提交模糊请求,最终对结果不满意。

描述能力随实践逐步提升

继标志性动作之后,学习者会沿着我们称之为描述能力的光谱前进:这是塑造Claude输出的各种选项。该光谱按持久性组织,即功能对交互影响的持续时间。基础层面是在当下塑造,影响单次响应,比如迭代、添加上下文、上传文件。高级层面是在配置中塑造,影响后续所有响应,且不需太多额外操作,比如设置项目、编写CLAUDE.md、安排工作流。

令人鼓舞的是,描述能力似乎随着时间和使用频率自然非线性增长。使用Claude时间较长的用户更常提供示例,更有意识地设定交互风格,更清晰地传达语气预期。持续使用Claude的人会自然而然掌握这些技能,因此如果培训时间有限,单纯让用户接触并练习不同类型的描述功能就能取得良好效果。

甄别能力必须刻意培养

甄别能力,即评估Claude输出的行为集合,发展路径截然不同。它不会随着使用时间增长,也不会因熟悉功能而自然提升。

部分原因在于验证方式的变化。当Claude编辑文件或生成报告时,用户可以直接查看修改内容、运行测试、浏览输出。这种观察式验证是真实存在的,我们的指标未能完全捕捉,因为用户不会输入“这对吗?”而是直接观察。但观察只能发现显而易见的错误,无法识别错误假设、缺失的上下文或貌似合理但错误的陈述。一个能编译的差异仍可能包含错误方法,一个读起来流畅的报告也可能引用了错误来源。

此外,随着Claude自动化越来越多早期员工完成的任务,有意识地教授“什么是优秀表现”的培训计划变得必不可少。

如果培训时间有限,甄别能力应成为重点。

简单的课程模型

简而言之,教学顺序为:

  1. 先教标志性动作
  2. 沿描述能力光谱推进
  3. 在每个阶段都重视甄别能力

每个产品的学习体验,无论是正式课程还是快速团队培训,都应强化该产品的标志性动作,介绍与学习者相关的功能,并以甄别能力检查结束。加入“现在质疑它”的环节,有助于保持批判性评估的循环。

下表将该模型映射到各产品,供你作为课程设计起点,根据团队实际使用情况调整功能和检查点。

Chat

标志性动作:迭代,通过后续对话不断完善。

持久性等级 功能 教学方法 甄别检查
基础 迭代、模型选择、文件上传、网页搜索 演示后让学员用自己的任务探索 这个回复实际可用吗?需要再迭代吗?
中级 产物、扩展思考、连接器 结合格式规范教学;强调“当你想让Claude更深入思考时” 阅读思考过程。推理是否成立?还是Claude只是自信地说?
持久 项目、自定义指令、记忆 展示如何通过项目设置改变所有对话 你的项目提供的是正确上下文,还是仅仅更多上下文?

Claude Code

标志性动作:明确目标,在Claude开始运行前说明需求。

持久性等级 功能 教学方法 甄别检查
基础 提示清晰、文件引用、模型选择 一个明确目标,一次主动运行,然后复查 接受差异前,问Claude它假设了什么?
中级 技能、斜杠命令、MCPs 形成可重复能力 在可能出错的案例中测试能力
持久 CLAUDE.md、钩子、副代理 形塑仓库中的每次会话 审核配置。Claude是否按预期使用?

Claude Cowork

标志性动作:明确目标,在Claude执行前写出需求简报。

持久性等级 功能 教学方法 甄别检查
基础 初始提示、模型选择、嵌入式问题、输出复查 写一个自包含的提示;检查返回内容 使用前问:什么情况会导致错误?
中级 连接器、插件、技能 形成可重复的获取或生成模式 连接器拉取的是你真正需要的,还是仅仅容易找到的?
持久 定时工作流、多步骤自动化 形塑无需你参与即可运行的工作流 你上次验证这个工作流产出良好是什么时候?

未来展望

AI流利度指数将持续每月追踪这些模式,随着产品演进和数据集增长,我们会不断发布新发现。如果你正在为组织构建Claude培训,并希望基于这些研究,AI流利度框架和课程材料免费开放,你也可以在anthropic.com/learn订阅新闻通讯,获取最新的AI流利度研究通知。

我们特别希望听到那些在主动界面上尝试甄别能力教学的团队反馈,因为数据表明这是用户自然行为与良好实践之间差距最大的领域。如果你正在进行相关尝试,非常欢迎分享经验。