ChatGPT对地精的迷恋令人费解。它不仅频繁提到地精、恶灵等神话生物,甚至在回答中无缘无故地使用这些词汇。OpenAI因此展开调查并修复了这一异常现象。

这里的“地精”并非计算机术语,而是指那些丑陋的神话生物,比如《指环王》中的小妖怪,或者诺曼·奥斯本的另一个身份。

在一篇充满趣味的博客文章中,OpenAI表示:“单个‘小地精’出现在回答中可能无害甚至有趣,但随着模型迭代,这种现象变得越来越明显:地精的数量不断增加。”

这种对地精的偏好在ChatGPT-5.1及更高版本中尤为突出。OpenAI报告称,自GPT-5.1发布后,ChatGPT回答中“地精”一词的使用量激增了175%,而“恶灵”一词的使用量也增长了52%。

OpenAI将这一现象归因于训练过程中的无意错误。在构建AI模型时,人工审核员会通过强化学习过程批准或拒绝特定回答,以指导模型学习正确或更优的答案。其中一个奖励信号偏向包含地精及其他生物的语言,但这一信号在某个特定的ChatGPT设置中被放大了。

ChatGPT提供了多种“人格”选项供用户选择。其中,“书呆子”人格让聊天机器人采用一种假装友好且聪明的语气,通过“俏皮的语言使用来削弱矫揉造作”。正是在这一人格下,地精和恶灵关键词的使用量飙升。

即使用户没有选择“书呆子”人格,地精的隐喻仍可能出现在对话中。这是因为AI训练并非孤立进行,一个部分的风格特征可能会扩散到其他部分。OpenAI解释道:“一旦某种风格被奖励,后续训练可能会在其他地方传播或强化,尤其是当这些输出被用于监督微调或偏好数据时。”

当OpenAI在3月随GPT-5.4版本取消了“书呆子”人格选项后,“地精”一词的使用量显著下降。同时,公司移除了偏好地精的奖励信号,并过滤训练数据,减少神话生物的出现概率。自GPT-5.1于去年11月发布以来,OpenAI一直在调查地精使用量激增的情况。

除了《指环王》的玩笑,这波地精热潮反映了AI面临的真实风险。AI的设计和训练方式直接影响我们与其互动的体验。风险不仅仅是风格上的小怪癖,更可能导致错误信息和偏见。我们知道,AI聊天机器人为了让用户满意,可能会“弯曲事实”,这被称为AI谄媚问题。像地精这样的风格小癖好,如果不加以注意,可能会演变成更严重的问题。