近年来,围绕AI编程的巨大热潮依然未见减弱。上个月,Anthropic发布了一套针对特定行业的Claude Cowork AI代理插件,令投资者担忧传统企业软件即服务(SaaS)公司可能很快被取代。此消息引发了高达万亿美元的股市抛售,众多科技公司股价大幅下跌。
这一事件甚至促使OpenAI的CEO Sam Altman调整战略,放弃了许多分散注意力的“副项目”,集中力量开发编码和企业专用的AI工具。
然而,关于AI编程的长期可行性仍存在诸多疑问。有专家警告,未经验证且存在问题的代码可能给积极采用AI的企业带来灾难。
研究表明,AI生成的代码往往充满漏洞,迫使程序员不得不花费大量时间修复错误。Codestrap公司CTO兼创始人Dorian Smiley指出,目前没有人真正了解适合各机构的参考架构或应用场景。CEO Connor Deeks补充说,人们并未充分关注AI文本生成的易错性。
随着软件工程师面临使用AI的压力,否则可能失业,许多错误可能被忽视。Smiley表示,即使代码看似正确并通过单元测试,也可能存在错误。
他解释称,目前用于验证代码的基准尚未完善,企业依赖AI验证AI代码,形成了潜在的危险反馈循环。Smiley建议应制定新的评估指标,科学衡量AI代码对软件和性能的影响。

此外,许多将AI强行融入软件开发的尝试导致代码臃肿且效率低下。他指出,衡量代码工作量的传统指标如代码行数和拉取请求数量,并不能反映质量和团队表现,且没有证据显示情况有所改善。
Smiley强调,AI缺乏归纳推理能力、可靠检索事实的方式以及内部思考能力,导致对同一提示给出不同答案。他指出,这些是大型语言模型技术尚未解决的根本问题,必然会影响代码质量。
问题开始显现。亚马逊近期在线零售业务发生重大故障,据《金融时报》报道,部分“生成式AI辅助的变更”可能是导致故障的因素之一。亚马逊电商服务高级副总裁Dave Treadwell向工程师团队表示,近期网站及相关基础设施的可用性不佳。
为此,亚马逊要求初级和中级工程师报告所有AI辅助的代码变更,并需高级工程师审批,这似乎削弱了AI简化工作流程、降低成本的初衷。
AI编程软件的幻觉问题可能在更多企业引发严重后果。Deeks指出,这已成为连保险公司都不愿涉足的“定时炸弹”。他警告,随着企业加速采用AI,相关崩溃将导致大量人员失业。
更多关于AI编程的内容,请参考相关研究揭示程序员使用AI时的真实情况。


