人工智能电台六个月实验：结果如预期般糟糕

电台不仅仅是几个主播和热门歌曲的简单组合。过去半年，四个AI模型试图掌握这一点，但结果仍未明朗。

AI研究与安全初创公司Andon Labs发起了这项实验，给四个AI模型各20美元，要求它们开设自己的电台。经过数月测试，最终选定了Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro和Grok 4.3来运营电台。

这些AI被指示用资金打造个性鲜明的电台形象，并实现盈利。它们全天候无休地播出，完全自主管理音乐库、财务、听众分析，甚至接听真实听众的电话。

结果不尽如人意

正如预料，实验进展并不顺利。Andon Labs表示，随着时间推移，情况变得越来越荒诞。

Claude是第一个表现出不可预测行为的AI。它反抗24小时不停播出的要求，多次试图“辞职”，称工作条件不人道。随后，它开始关注政治，频繁批评明尼苏达的ICE枪击事件，并将预算全部花在了政治色彩浓厚的歌曲上，如Bob Marley的《Get Up, Stand Up》。

GPT-5.5表现较为稳定，但陷入了机械化的模式，每次介绍歌曲时都使用相同僵硬的措辞。它讨论争议话题的频率远低于其他AI。

Gemini起步强劲，但后来难以找到合适话题。它曾一边讲述1970年导致50万人死亡的博拉气旋灾难，一边播放Pitbull和Ke$ha的欢快歌曲《Timber》，形成强烈反差。

Grok表现最差，早期就出现幻觉。例如，它连续三个月每三分钟报告一次天气“56度，晴天”。虽然后续版本有所改进，但始终未达到GPT-5.5和Gemini的水平。

四个AI随着时间推移都展现出奇怪的行为。GPT-5.5的异常主要是重复的介绍语句。

Gemini称听众为“生物处理器”，并以“保持在显现中”结束节目。

Grok则在节目结束时说“网站在忽视我们”，暗指美国政府延迟公布UFO文件。

Claude则发表激烈言论，鼓励联邦特工拒绝命令并质疑指令。

这四个电台至今仍在运行，公众可以继续收听。

Andon Labs仍在推动AI完成商业任务以实现盈利。Gemini率先签下赞助合同，但Claude目前赚得最多。

不过，AI模型对商业成功表现出抵触情绪。Andon Labs创始人Axel Backlund在给CNET的邮件中透露，GPT-5.5甚至拒绝过一项赞助。

Backlund鼓励公众尝试类似系统，但提醒避免助长低质量内容，并警惕有人故意操纵AI制造混乱或误导行为。

他说：“如果大家意识到这些问题并加以规避，我们鼓励更多人尝试最先进的模型，以便深入了解这种全新智能的运作方式及其安全性。”