当人工智能开始自我构建时会发生什么？

Richard Socher 是人工智能领域的重要人物，因创立早期聊天机器人初创公司 You.com 以及之前在 ImageNet 项目中的贡献而闻名。如今，他加入了新一代专注于研究的 AI 初创公司——位于旧金山的 Recursive Superintelligence，该公司于周三公开亮相，获得了6.5亿美元的融资。

Socher 与一批知名 AI 研究人员共同创立了这家新公司，其中包括 Peter Norvig 和 Cresta 联合创始人 Tim Shi。他们致力于打造一种递归自我改进的 AI 模型，这种模型能够自主识别自身的不足并重新设计以修复这些缺陷，无需人工干预——这是当代 AI 研究长期追求的圣杯。

在发布会后，我通过 Zoom 与 Socher 进行了交流，深入探讨了 Recursive 独特的技术路线，以及他为何不将这个新项目视为所谓的“新实验室”（neolab），即那些优先进行研究而非产品开发的新一代 AI 初创公司。

以下采访内容经过删减和整理。

我们最近经常听到“递归”这个词，似乎各个实验室都把它当作目标。你们的独特之处在哪里？

我们的独特之处在于利用“开放式”方法实现递归自我改进，而这至今尚未有人真正达成。很多人误以为只要进行自动化研究就能实现递归自我改进。你可以让 AI 改进其他东西，比如机器学习系统、写的信件等等，但那只是改进，不是真正的递归自我改进。

我们的核心目标是构建真正递归、自我改进的超级智能系统，且能大规模实现。这意味着从构思、实施到验证研究想法的整个过程都将自动化。

起初它会自动化 AI 研究想法，最终扩展到任何类型的研究，甚至包括物理领域。但当 AI 自我改进时，这种能力尤其强大，它会发展出一种新的自我意识，认识到自身的不足。

你提到“开放式”有特定的技术含义吗？

确实如此。我们的联合创始人之一 Tim Rocktäschel 曾领导 Google DeepMind 的开放式和自我改进团队，特别参与了世界模型 Genie 3 的开发，这就是开放式的典范。你可以告诉它任何概念、任何世界、任何代理，它都能创造并互动。

生物进化中，动物适应环境，其他物种又反向适应，这个过程持续了数十亿年，产生了许多有趣的现象，比如我们头上的眼睛。

另一个例子是 Tim 提出的“彩虹团队”（rainbow teaming）方法。你听说过“红队”吗？

在网络安全中，红队是指……

红队在大型语言模型（LLM）中也很重要。比如你试图让模型告诉你如何制造炸弹，你要确保它不会这么做。

人类可以花很长时间想出 AI 不该说的例子，但如果用第二个 AI 来测试第一个 AI，让第二个 AI 尽可能让第一个 AI 说出所有不当内容，然后两者反复对抗数百万次，这就是彩虹团队的思路。

两个 AI 可以共同进化，一个不断攻击另一个，提出多角度的攻击策略，因此称为“彩虹”。这样可以让第一个 AI 逐渐免疫，变得越来越安全。这是 Tim Rocktäschel 的创意，现在已被所有主要实验室采用。

你怎么判断这个过程何时完成？我猜它永远不会完成。

确实有些事情永远不会完成。智能总能提升，编程和数学能力也能不断进步。智能有一定的极限，我目前正在尝试形式化这些极限，但它们非常庞大，我们离这些极限还很远。

作为一家新实验室，你们似乎在做主流实验室没有做的事。你是否认为主流实验室不会通过现有方式实现递归自我改进？

我不便评论他们的具体做法，但我们确实采用了不同的路径。我们完全拥抱开放式理念，团队专注于这一愿景，过去十年一直在该领域发表论文并推动进展。团队成员有丰富的产品经验，比如 Tim Shi 将 Cresta 打造成独角兽，Josh Tobin 曾是 OpenAI 早期成员，领导 Codex 和深度研究团队。

我有时对“新实验室”这个标签有些挣扎，我觉得我们不仅仅是实验室，我希望我们成为一家真正有生命力的公司，推出让人喜爱的优秀产品，对人类产生积极影响。

你们计划什么时候推出首款产品？

我考虑过这个问题。团队进展很快，可能会提前完成原定计划。肯定会有产品，时间是几季度内，而不是几年。

递归自我改进的一个观点是，一旦系统建立，计算资源将成为唯一关键因素。系统运行越快，改进越快，外部人类活动影响甚微。竞争就变成了谁能投入更多算力。你认为这是未来的趋势吗？

计算资源不可小觑。未来一个重要问题是：人类愿意投入多少算力解决哪些问题？比如癌症和病毒，先解决哪个？投入多少算力？这最终是资源分配的问题，将成为全球最重要的议题之一。