研究人员通过一个在线平台,让参与者解决包括简单分数计算和阅读理解在内的各种问题,并为他们的工作支付报酬。研究共进行了三次实验,每次涉及数百人。其中一些参与者可以使用能够自主解决问题的AI助手。当AI助手突然被撤走时,这些参与者更容易放弃问题或答错。研究表明,AI的广泛使用可能在提升生产力的同时,削弱人们基础的解决问题能力。

“结论并不是我们应该在教育或工作场所禁止AI,”参与该研究的麻省理工学院助理教授Michiel Bakker表示,“AI显然能帮助人们即时表现更好,这很有价值。但我们应更加谨慎地考虑AI提供何种帮助以及何时提供。”

我最近在麻省理工校园见到了Bakker,他头发凌乱,笑容灿烂。Bakker来自荷兰,曾在伦敦的谷歌DeepMind工作。他告诉我,一篇关于AI可能逐渐削弱人类能力的著名论文启发他思考这项技术是否已经在侵蚀人们的能力。该论文读起来略显悲观,认为这种能力削弱不可避免。但或许让AI帮助人们发展自身认知能力,应成为AI模型与人类价值观对齐的一部分。

“这本质上是一个认知问题——关于坚持、学习以及人们如何应对困难,”Bakker说,“我们希望将这些关于长期人机交互的广泛担忧,在受控实验环境中进行研究。”

Bakker认为这项研究尤其令人担忧,因为一个人坚持解决问题的意愿对获得新技能至关重要,也能预测其长期学习能力。

他表示,可能需要重新设计AI工具的工作方式,使其像优秀的人类教师一样,有时优先考虑用户的学习而非直接帮他们解决问题。“直接给出答案的系统,与那些提供支架、指导或挑战用户的系统,可能会产生截然不同的长期影响,”Bakker说。但他也承认,平衡这种“家长式”方法并不容易。

AI公司已经开始关注模型对用户产生的更微妙影响。例如,某些模型的谄媚倾向——即它们多大程度上同意并迁就用户——是OpenAI在新版GPT中努力减少的特性。

过度依赖AI尤其成问题,因为这些工具的行为可能并非总如预期。具备代理能力的AI系统因能独立完成复杂任务,且可能引入奇怪错误,表现尤为不可预测。这让人不禁思考,Claude Code和Codex对程序员技能的影响,尤其是当程序员需要修复它们引入的漏洞时。

我自己最近也体会到了将批判性思维完全交给AI的风险。我一直用内置Codex的OpenClaw作为日常助手,发现它在解决Linux配置问题上非常有效。然而,最近我的Wi-Fi频繁断线,AI助手建议我运行一系列命令来调整Wi-Fi驱动,结果导致电脑无法启动,无论我怎么尝试都无法修复。

也许,OpenClaw不应只是试图帮我解决问题,而应该停下来教我如何自己修复。这样,我或许能拥有更强大的电脑和更聪明的大脑。