雇主在AI实验中逐渐暴露的严峻现实

近年来，围绕AI编程的巨大热潮依然未见减弱。上个月，Anthropic发布了一套针对特定行业的Claude Cowork AI代理插件，令投资者担忧传统企业软件即服务（SaaS）公司可能很快被取代。此消息引发了高达万亿美元的股市抛售，众多科技公司股价大幅下跌。

这一事件甚至促使OpenAI的CEO Sam Altman调整战略，放弃了许多分散注意力的“副项目”，集中力量开发编码和企业专用的AI工具。

然而，关于AI编程的长期可行性仍存在诸多疑问。有专家警告，未经验证且存在问题的代码可能给积极采用AI的企业带来灾难。

研究表明，AI生成的代码往往充满漏洞，迫使程序员不得不花费大量时间修复错误。Codestrap公司CTO兼创始人Dorian Smiley指出，目前没有人真正了解适合各机构的参考架构或应用场景。CEO Connor Deeks补充说，人们并未充分关注AI文本生成的易错性。

随着软件工程师面临使用AI的压力，否则可能失业，许多错误可能被忽视。Smiley表示，即使代码看似正确并通过单元测试，也可能存在错误。

他解释称，目前用于验证代码的基准尚未完善，企业依赖AI验证AI代码，形成了潜在的危险反馈循环。Smiley建议应制定新的评估指标，科学衡量AI代码对软件和性能的影响。

此外，许多将AI强行融入软件开发的尝试导致代码臃肿且效率低下。他指出，衡量代码工作量的传统指标如代码行数和拉取请求数量，并不能反映质量和团队表现，且没有证据显示情况有所改善。

Smiley强调，AI缺乏归纳推理能力、可靠检索事实的方式以及内部思考能力，导致对同一提示给出不同答案。他指出，这些是大型语言模型技术尚未解决的根本问题，必然会影响代码质量。

问题开始显现。亚马逊近期在线零售业务发生重大故障，据《金融时报》报道，部分“生成式AI辅助的变更”可能是导致故障的因素之一。亚马逊电商服务高级副总裁Dave Treadwell向工程师团队表示，近期网站及相关基础设施的可用性不佳。

为此，亚马逊要求初级和中级工程师报告所有AI辅助的代码变更，并需高级工程师审批，这似乎削弱了AI简化工作流程、降低成本的初衷。

AI编程软件的幻觉问题可能在更多企业引发严重后果。Deeks指出，这已成为连保险公司都不愿涉足的“定时炸弹”。他警告，随着企业加速采用AI，相关崩溃将导致大量人员失业。

更多关于AI编程的内容，请参考相关研究揭示程序员使用AI时的真实情况。

评论