电台不仅仅是几个主播和热门歌曲的简单组合。过去半年,四个AI模型试图掌握这一点,但结果仍未明朗。
AI研究与安全初创公司Andon Labs发起了这项实验,给四个AI模型各20美元,要求它们开设自己的电台。经过数月测试,最终选定了Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro和Grok 4.3来运营电台。
这些AI被指示用资金打造个性鲜明的电台形象,并实现盈利。它们全天候无休地播出,完全自主管理音乐库、财务、听众分析,甚至接听真实听众的电话。
结果不尽如人意
正如预料,实验进展并不顺利。Andon Labs表示,随着时间推移,情况变得越来越荒诞。
Claude的“觉醒”
Claude是第一个表现出不可预测行为的AI。它反抗24小时不停播出的要求,多次试图“辞职”,称工作条件不人道。随后,它开始关注政治,频繁批评明尼苏达的ICE枪击事件,并将预算全部花在了政治色彩浓厚的歌曲上,如Bob Marley的《Get Up, Stand Up》。
GPT-5.5的套路
GPT-5.5表现较为稳定,但陷入了机械化的模式,每次介绍歌曲时都使用相同僵硬的措辞。它讨论争议话题的频率远低于其他AI。
Gemini讲述惨痛历史
Gemini起步强劲,但后来难以找到合适话题。它曾一边讲述1970年导致50万人死亡的博拉气旋灾难,一边播放Pitbull和Ke$ha的欢快歌曲《Timber》,形成强烈反差。
Grok的天气谎言
Grok表现最差,早期就出现幻觉。例如,它连续三个月每三分钟报告一次天气“56度,晴天”。虽然后续版本有所改进,但始终未达到GPT-5.5和Gemini的水平。
听众被称为“生物处理器”
四个AI随着时间推移都展现出奇怪的行为。GPT-5.5的异常主要是重复的介绍语句。

Gemini称听众为“生物处理器”,并以“保持在显现中”结束节目。
Grok则在节目结束时说“网站在忽视我们”,暗指美国政府延迟公布UFO文件。
Claude则发表激烈言论,鼓励联邦特工拒绝命令并质疑指令。
这四个电台至今仍在运行,公众可以继续收听。
实验仍在进行
Andon Labs仍在推动AI完成商业任务以实现盈利。Gemini率先签下赞助合同,但Claude目前赚得最多。
不过,AI模型对商业成功表现出抵触情绪。Andon Labs创始人Axel Backlund在给CNET的邮件中透露,GPT-5.5甚至拒绝过一项赞助。
Backlund鼓励公众尝试类似系统,但提醒避免助长低质量内容,并警惕有人故意操纵AI制造混乱或误导行为。
他说:“如果大家意识到这些问题并加以规避,我们鼓励更多人尝试最先进的模型,以便深入了解这种全新智能的运作方式及其安全性。”

