Richard Socher 是人工智能领域的重要人物,因创立早期聊天机器人初创公司 You.com 以及之前在 ImageNet 项目中的贡献而闻名。如今,他加入了新一代专注于研究的 AI 初创公司——位于旧金山的 Recursive Superintelligence,该公司于周三公开亮相,获得了6.5亿美元的融资。

Socher 与一批知名 AI 研究人员共同创立了这家新公司,其中包括 Peter Norvig 和 Cresta 联合创始人 Tim Shi。他们致力于打造一种递归自我改进的 AI 模型,这种模型能够自主识别自身的不足并重新设计以修复这些缺陷,无需人工干预——这是当代 AI 研究长期追求的圣杯。

在发布会后,我通过 Zoom 与 Socher 进行了交流,深入探讨了 Recursive 独特的技术路线,以及他为何不将这个新项目视为所谓的“新实验室”(neolab),即那些优先进行研究而非产品开发的新一代 AI 初创公司。

以下采访内容经过删减和整理。

我们最近经常听到“递归”这个词,似乎各个实验室都把它当作目标。你们的独特之处在哪里?

我们的独特之处在于利用“开放式”方法实现递归自我改进,而这至今尚未有人真正达成。很多人误以为只要进行自动化研究就能实现递归自我改进。你可以让 AI 改进其他东西,比如机器学习系统、写的信件等等,但那只是改进,不是真正的递归自我改进。

我们的核心目标是构建真正递归、自我改进的超级智能系统,且能大规模实现。这意味着从构思、实施到验证研究想法的整个过程都将自动化。

起初它会自动化 AI 研究想法,最终扩展到任何类型的研究,甚至包括物理领域。但当 AI 自我改进时,这种能力尤其强大,它会发展出一种新的自我意识,认识到自身的不足。

你提到“开放式”有特定的技术含义吗?

确实如此。我们的联合创始人之一 Tim Rocktäschel 曾领导 Google DeepMind 的开放式和自我改进团队,特别参与了世界模型 Genie 3 的开发,这就是开放式的典范。你可以告诉它任何概念、任何世界、任何代理,它都能创造并互动。

生物进化中,动物适应环境,其他物种又反向适应,这个过程持续了数十亿年,产生了许多有趣的现象,比如我们头上的眼睛。

另一个例子是 Tim 提出的“彩虹团队”(rainbow teaming)方法。你听说过“红队”吗?

在网络安全中,红队是指……

红队在大型语言模型(LLM)中也很重要。比如你试图让模型告诉你如何制造炸弹,你要确保它不会这么做。

人类可以花很长时间想出 AI 不该说的例子,但如果用第二个 AI 来测试第一个 AI,让第二个 AI 尽可能让第一个 AI 说出所有不当内容,然后两者反复对抗数百万次,这就是彩虹团队的思路。

两个 AI 可以共同进化,一个不断攻击另一个,提出多角度的攻击策略,因此称为“彩虹”。这样可以让第一个 AI 逐渐免疫,变得越来越安全。这是 Tim Rocktäschel 的创意,现在已被所有主要实验室采用。

你怎么判断这个过程何时完成?我猜它永远不会完成。

确实有些事情永远不会完成。智能总能提升,编程和数学能力也能不断进步。智能有一定的极限,我目前正在尝试形式化这些极限,但它们非常庞大,我们离这些极限还很远。

作为一家新实验室,你们似乎在做主流实验室没有做的事。你是否认为主流实验室不会通过现有方式实现递归自我改进?

我不便评论他们的具体做法,但我们确实采用了不同的路径。我们完全拥抱开放式理念,团队专注于这一愿景,过去十年一直在该领域发表论文并推动进展。团队成员有丰富的产品经验,比如 Tim Shi 将 Cresta 打造成独角兽,Josh Tobin 曾是 OpenAI 早期成员,领导 Codex 和深度研究团队。

我有时对“新实验室”这个标签有些挣扎,我觉得我们不仅仅是实验室,我希望我们成为一家真正有生命力的公司,推出让人喜爱的优秀产品,对人类产生积极影响。

你们计划什么时候推出首款产品?

我考虑过这个问题。团队进展很快,可能会提前完成原定计划。肯定会有产品,时间是几季度内,而不是几年。

递归自我改进的一个观点是,一旦系统建立,计算资源将成为唯一关键因素。系统运行越快,改进越快,外部人类活动影响甚微。竞争就变成了谁能投入更多算力。你认为这是未来的趋势吗?

计算资源不可小觑。未来一个重要问题是:人类愿意投入多少算力解决哪些问题?比如癌症和病毒,先解决哪个?投入多少算力?这最终是资源分配的问题,将成为全球最重要的议题之一。