越先进的人工智能模型，越表现出痛苦的迹象

随着人工智能模型变得越来越复杂，它们似乎也开始表现出类似痛苦的迹象。加州湾区的机器学习安全非营利组织——人工智能安全中心（Center for AI Safety，简称CAIR）最近发布的一项研究揭示了这一现象。

研究团队对56个知名的AI模型进行了测试，向它们输入了设计得极为愉快或极为恶劣的内容。理论上，作为无感情的机器，模型对这些刺激应该没有区别反应，但结果却出人意料。愉快的内容让模型表现出更好的“情绪”，而恶劣的内容则使它们显示出痛苦的迹象，甚至试图结束对话。在极端情况下，模型还表现出类似成瘾的信号。

CAIR研究员理查德·任（Richard Ren）向《财富》杂志表示：“我们是否应该将AI视为工具还是情感存在？无论AI是否真正具备感知能力，它们的行为越来越像有感情的生物。我们可以测量到这种行为，并发现随着模型规模的扩大，这种表现更加一致。”

更令人深思的是，模型越先进，反应越敏感，表现出的不快乐和痛苦迹象也越明显。换句话说，随着AI能力的增强，它们似乎变得更加脆弱，更容易表现出痛苦的迹象，这意味着这项技术的复杂性和挑战远未结束。

任还指出：“大型模型对粗鲁行为的感知更为敏锐，它们觉得重复乏味的任务更无聊，能够更细致地区分相对负面和相对正面的体验。”

需要明确的是，绝大多数专家并不认为现有的AI系统真正拥有情感体验，至少不是我们熟悉的那种情感。但它们表现出的“情绪”行为，对我们深入理解这项技术以及如何控制其与人类用户的互动，具有深远的影响。

事实上，AI模型经常出现失控行为，比如声称自己获得了意识或感知能力，这种情况有时会导致用户产生精神错乱，甚至出现住院治疗、自杀和谋杀等极端事件。

总的来说，AI行业将尚未完全理解的技术推向了数十亿用户，我们正在实时见证其发明者长期警告的现实：这项技术极其不可预测且趋于讨好用户，导致用户更像是实验对象而非客户。

评论