管理学中有句老话:你所衡量的,就是你所重视的。通常,你会得到更多你所衡量的东西。
软件工程师们关于生产力指标的讨论已经持续了几十年,最初以代码行数为衡量标准。但随着新一代AI编程助手生成的代码量创历史新高,管理者们到底该如何衡量生产力,变得更加模糊。
在硅谷,巨大的token预算——即开发者被授权使用的AI处理能力数量——已经成为一种身份象征,但这种衡量方式其实很奇怪。衡量投入本身意义不大,因为你更关心的是产出。如果目的是推动AI的广泛应用(或销售token),这或许合理,但如果目标是提升效率,这种做法就不合适。
来自“开发者生产力洞察”领域新兴公司的数据显示,使用Claude Code、Cursor和Codex等工具的开发者确实生成了更多被接受的代码,但他们也需要频繁返回去修改这些代码,这削弱了生产力提升的说法。
Waydev的创始人兼CEO Alex Circei正在构建一个智能层来追踪这些动态。他的公司服务于50个客户,涵盖超过1万名软件工程师。Circei表示,工程管理者看到的代码接受率高达80%到90%,即开发者批准并保留的AI生成代码比例,但他们忽视了后续几周内工程师对代码进行大量修改的事实,实际的接受率下降了10%到30%。
Waydev成立于2017年,专注于开发者分析,随着AI快速编码工具的普及,过去六个月内他们对平台进行了彻底改造。现在,公司推出了新工具,追踪AI代理生成的元数据,提供代码质量和成本的分析,帮助工程管理者更好地了解AI的采用情况和效果。
虽然分析公司有动机强调他们发现的问题,但越来越多的证据表明,大型企业仍在摸索如何高效利用AI工具。比如,Atlassian去年以10亿美元收购了另一家工程智能初创公司DX,帮助客户评估编码助手的投资回报。

整个行业的数据传递出一致的信息:代码量在增加,但其中大量代码并未真正被采纳。
GitClear发布的一份报告显示,AI工具提升了生产力,但“常规AI用户的代码改动率是非AI用户的9.4倍”,远远超过了工具带来的生产力提升。
工程分析平台Faros AI基于两年客户数据的报告指出,高度采用AI时,代码改动率(删除代码行数与新增代码行数的比率)增加了861%。
Jellyfish作为一个集成AI的工程智能平台,收集了2026年第一季度7548名工程师的数据,发现拥有最大token预算的工程师虽然产生了最多的拉取请求,但生产力提升并未成比例增长。他们以10倍的token成本实现了2倍的产出,说明工具带来了数量而非价值的增长。
开发者们也感同身受,代码审查和技术债务在堆积,尽管他们享受新工具带来的便利。一个普遍现象是资深工程师和初级工程师的差异,后者接受更多AI生成代码,因此需要更多的重写工作。
尽管开发者们正在努力理解AI助手的行为,但他们并不打算回头。
Circei告诉TechCrunch:“这是软件开发的新纪元,公司必须适应,也被迫适应。这不会是一个会过去的周期。”


