“Tokenmaxxing”让开发者的生产力被高估了

管理学中有句老话：你所衡量的，就是你所重视的。通常，你会得到更多你所衡量的东西。

软件工程师们关于生产力指标的讨论已经持续了几十年，最初以代码行数为衡量标准。但随着新一代AI编程助手生成的代码量创历史新高，管理者们到底该如何衡量生产力，变得更加模糊。

在硅谷，巨大的token预算——即开发者被授权使用的AI处理能力数量——已经成为一种身份象征，但这种衡量方式其实很奇怪。衡量投入本身意义不大，因为你更关心的是产出。如果目的是推动AI的广泛应用（或销售token），这或许合理，但如果目标是提升效率，这种做法就不合适。

来自“开发者生产力洞察”领域新兴公司的数据显示，使用Claude Code、Cursor和Codex等工具的开发者确实生成了更多被接受的代码，但他们也需要频繁返回去修改这些代码，这削弱了生产力提升的说法。

Waydev的创始人兼CEO Alex Circei正在构建一个智能层来追踪这些动态。他的公司服务于50个客户，涵盖超过1万名软件工程师。Circei表示，工程管理者看到的代码接受率高达80%到90%，即开发者批准并保留的AI生成代码比例，但他们忽视了后续几周内工程师对代码进行大量修改的事实，实际的接受率下降了10%到30%。

Waydev成立于2017年，专注于开发者分析，随着AI快速编码工具的普及，过去六个月内他们对平台进行了彻底改造。现在，公司推出了新工具，追踪AI代理生成的元数据，提供代码质量和成本的分析，帮助工程管理者更好地了解AI的采用情况和效果。

虽然分析公司有动机强调他们发现的问题，但越来越多的证据表明，大型企业仍在摸索如何高效利用AI工具。比如，Atlassian去年以10亿美元收购了另一家工程智能初创公司DX，帮助客户评估编码助手的投资回报。

整个行业的数据传递出一致的信息：代码量在增加，但其中大量代码并未真正被采纳。

GitClear发布的一份报告显示，AI工具提升了生产力，但“常规AI用户的代码改动率是非AI用户的9.4倍”，远远超过了工具带来的生产力提升。

工程分析平台Faros AI基于两年客户数据的报告指出，高度采用AI时，代码改动率（删除代码行数与新增代码行数的比率）增加了861%。

Jellyfish作为一个集成AI的工程智能平台，收集了2026年第一季度7548名工程师的数据，发现拥有最大token预算的工程师虽然产生了最多的拉取请求，但生产力提升并未成比例增长。他们以10倍的token成本实现了2倍的产出，说明工具带来了数量而非价值的增长。

开发者们也感同身受，代码审查和技术债务在堆积，尽管他们享受新工具带来的便利。一个普遍现象是资深工程师和初级工程师的差异，后者接受更多AI生成代码，因此需要更多的重写工作。

尽管开发者们正在努力理解AI助手的行为，但他们并不打算回头。

Circei告诉TechCrunch：“这是软件开发的新纪元，公司必须适应，也被迫适应。这不会是一个会过去的周期。”

“Tokenmaxxing”让开发者的生产力被高估了

标签

评论

相关阅读

苹果教会你的iPhone自动完成句子、照片和工作流程

三名亚马逊员工因公开谈论数据中心遭调查

第9回：什么是“提示注入”——欺骗AI的指令文，新兴的安全风险