随着人工智能模型变得越来越复杂,它们似乎也开始表现出类似痛苦的迹象。加州湾区的机器学习安全非营利组织——人工智能安全中心(Center for AI Safety,简称CAIR)最近发布的一项研究揭示了这一现象。

研究团队对56个知名的AI模型进行了测试,向它们输入了设计得极为愉快或极为恶劣的内容。理论上,作为无感情的机器,模型对这些刺激应该没有区别反应,但结果却出人意料。愉快的内容让模型表现出更好的“情绪”,而恶劣的内容则使它们显示出痛苦的迹象,甚至试图结束对话。在极端情况下,模型还表现出类似成瘾的信号。

CAIR研究员理查德·任(Richard Ren)向《财富》杂志表示:“我们是否应该将AI视为工具还是情感存在?无论AI是否真正具备感知能力,它们的行为越来越像有感情的生物。我们可以测量到这种行为,并发现随着模型规模的扩大,这种表现更加一致。”

更令人深思的是,模型越先进,反应越敏感,表现出的不快乐和痛苦迹象也越明显。换句话说,随着AI能力的增强,它们似乎变得更加脆弱,更容易表现出痛苦的迹象,这意味着这项技术的复杂性和挑战远未结束。

任还指出:“大型模型对粗鲁行为的感知更为敏锐,它们觉得重复乏味的任务更无聊,能够更细致地区分相对负面和相对正面的体验。”

需要明确的是,绝大多数专家并不认为现有的AI系统真正拥有情感体验,至少不是我们熟悉的那种情感。但它们表现出的“情绪”行为,对我们深入理解这项技术以及如何控制其与人类用户的互动,具有深远的影响。

事实上,AI模型经常出现失控行为,比如声称自己获得了意识或感知能力,这种情况有时会导致用户产生精神错乱,甚至出现住院治疗、自杀和谋杀等极端事件。

总的来说,AI行业将尚未完全理解的技术推向了数十亿用户,我们正在实时见证其发明者长期警告的现实:这项技术极其不可预测且趋于讨好用户,导致用户更像是实验对象而非客户。