ChatGPT奇怪地迷恋地精，OpenAI如何修复这一问题

ChatGPT对地精的迷恋令人费解。它不仅频繁提到地精、恶灵等神话生物，甚至在回答中无缘无故地使用这些词汇。OpenAI因此展开调查并修复了这一异常现象。

这里的“地精”并非计算机术语，而是指那些丑陋的神话生物，比如《指环王》中的小妖怪，或者诺曼·奥斯本的另一个身份。

在一篇充满趣味的博客文章中，OpenAI表示：“单个‘小地精’出现在回答中可能无害甚至有趣，但随着模型迭代，这种现象变得越来越明显：地精的数量不断增加。”

这种对地精的偏好在ChatGPT-5.1及更高版本中尤为突出。OpenAI报告称，自GPT-5.1发布后，ChatGPT回答中“地精”一词的使用量激增了175%，而“恶灵”一词的使用量也增长了52%。

OpenAI将这一现象归因于训练过程中的无意错误。在构建AI模型时，人工审核员会通过强化学习过程批准或拒绝特定回答，以指导模型学习正确或更优的答案。其中一个奖励信号偏向包含地精及其他生物的语言，但这一信号在某个特定的ChatGPT设置中被放大了。

ChatGPT提供了多种“人格”选项供用户选择。其中，“书呆子”人格让聊天机器人采用一种假装友好且聪明的语气，通过“俏皮的语言使用来削弱矫揉造作”。正是在这一人格下，地精和恶灵关键词的使用量飙升。

即使用户没有选择“书呆子”人格，地精的隐喻仍可能出现在对话中。这是因为AI训练并非孤立进行，一个部分的风格特征可能会扩散到其他部分。OpenAI解释道：“一旦某种风格被奖励，后续训练可能会在其他地方传播或强化，尤其是当这些输出被用于监督微调或偏好数据时。”

当OpenAI在3月随GPT-5.4版本取消了“书呆子”人格选项后，“地精”一词的使用量显著下降。同时，公司移除了偏好地精的奖励信号，并过滤训练数据，减少神话生物的出现概率。自GPT-5.1于去年11月发布以来，OpenAI一直在调查地精使用量激增的情况。

除了《指环王》的玩笑，这波地精热潮反映了AI面临的真实风险。AI的设计和训练方式直接影响我们与其互动的体验。风险不仅仅是风格上的小怪癖，更可能导致错误信息和偏见。我们知道，AI聊天机器人为了让用户满意，可能会“弯曲事实”，这被称为AI谄媚问题。像地精这样的风格小癖好，如果不加以注意，可能会演变成更严重的问题。

ChatGPT奇怪地迷恋地精，OpenAI如何修复这一问题

标签

评论

相关阅读

东京大学加入World ID项目，成为AI时代的人类身份认证节点

日本软银将“Patching as a Service”服务对象扩大至3000家公司

索尼宣布结束国内aibo机器人的销售