2026年,研究人员发现,开发者们已经牢牢依赖AI编程工具,几乎无法离开它们。

虽然AI无疑帮助程序员更快地编写代码,但其他研究者警告,这并不意味着代码质量更高,未来可能会带来问题。

具体来说,知名AI研究机构METR在2026年2月发布了一项令人惊讶的发现:大多数开发者即使只是在有限的任务上,也不愿意在没有AI辅助的情况下工作。

METR原本计划更新2025年发布的一项开创性研究,后者测量了开源开发者手动完成任务与使用AI辅助完成任务所花费的时间。虽然开发者们报告说AI提升了他们的生产力,但研究结果显示,AI实际上让他们的效率下降了。虽然AI生成代码更快,但开发者需要花额外时间查找和修复错误、引导AI以及等待任务完成。

当METR尝试重复实验以衡量AI和开发者技能的进步时,发现开发者不愿参与,因为他们不愿意“没有AI辅助”工作,即使只是为了研究。

于是,METR在5月发布了一项调查,让技术人员自我报告AI带来的生产力提升。结果显示,他们普遍认为AI使自己对组织的价值提升了两倍。

然而,近期关于“tokenmaxxing”现象的报道和一些研究让这种自我认知变得值得怀疑。

所谓tokenmaxxing,是用个人使用的token数量来衡量AI生产力的趋势,这在2026年初非常流行,但可能已经结束。

据《金融时报》报道,亚马逊关闭了内部的token追踪排行榜Kirorank,因为员工通过过度使用AI代理来“刷分”,导致成本飙升,证明AI使用并不自动等同于生产力提升。

《The Information》报道,优步在2026年前四个月就耗尽了AI预算,首席运营官Andrew Macdonald在播客中表示,这些开销并未带来项目或生产力的显著提升。

程序员兼作家James Shore在一篇在Hacker News上走红的博客中优雅地论述,AI生成的代码不一定减少后续维护需求,甚至可能增加。他写道:“你现在写代码快了两倍?那就希望你维护成本减半,否则你就麻烦了。你是在用暂时的速度提升换取永久的负担。”

还有其他证据表明AI可能加剧代码维护问题。

Reliability engineering代理初创公司Entelligence AI的创始人兼CEO Aiswarya Sankar在一条病毒推文中指出,公司有44%的token花在修复AI生成的bug上。同时,代码审查工具公司CodeRabbit分析开源拉取请求发现,AI生成的代码问题比人类代码多1.7倍。

虽然这些数据来自试图推广AI代码审查工具的公司,但新加坡管理大学的独立研究人员也在4月发布报告,警告“AI生成代码可能给真实软件项目带来长期维护成本”。

既然程序员如此依赖AI助手,解决方案是什么?

销售AI编程代理的厂商建议,开发者可以用AI代理快速完成代码修复等繁琐任务,这也是AI编程代理Devin的创始人兼CEO Scott Wu的观点。但他也承认,Devin目前的能力介于初级和中级程序员之间,不能完全放手不管。

新加坡管理大学的研究人员建议采取更人性化的方法。程序员应像熟悉自己最擅长的编程语言一样,深入了解AI擅长和不擅长的任务。他们需要为AI设计强有力的质量保障体系,并且必须像对待初级开发者一样,仔细审查AI的工作。

研究人员和Scott Wu都认为,人类仍应负责软件架构和安全设计等宏观层面的工作。