一群曾在谷歌DeepMind、苹果、OpenAI和Meta超级智能实验室工作的AI研究员,于周三宣布成立一家名为Trajectory的新创公司,目标是帮助企业通过训练基于真实用户交互的数据,持续改进其AI产品。

Trajectory致力于打造一个能够持续学习的AI平台,这一直被研究人员视为推动AI进一步发展的关键障碍。OpenAI、谷歌和Anthropic在训练越来越强大的AI模型方面取得了成功,尤其是在编程、数学和科学领域。然而,这些系统在训练完成后便停止进步。尽管近期在持续学习方面有一些突破,科技公司普遍难以打造能够实时从错误中学习的AI产品。2025年12月,在年度最大AI研究会议NeurIPS上,图灵奖得主理查德·萨顿强调,持续学习对于构建超级智能代理至关重要。

Trajectory已完成1500万美元的种子轮融资,估值达1.15亿美元,领投方为风险投资公司Conviction,参与者还包括Bessemer Venture Partners、Radical VC和BoxGroup。个人投资者中有谷歌DeepMind首席科学家Jeff Dean,以及被誉为“AI教母”的斯坦福教授兼World Labs CEO李飞飞。

Trajectory的CEO兼联合创始人Ronak Malde曾是Windsurf的AI研究员,去年谷歌DeepMind以24亿美元收购该编程初创公司时,他成为少数加入DeepMind的员工之一。其他联合创始人包括曾参与苹果Vision Pro项目的前AI研究员Arjun Karanam,以及曾在谷歌DeepMind机器人部门工作的Michael Elabd。

Malde向WIRED表示,一些领先的AI编程产品如Cursor,已经在实践早期版本的持续学习——利用用户与产品的真实交互数据进行训练后优化,并定期发布模型更新。他认为这正是AI编程产品迅速发展的核心原因之一,也促使主要AI实验室竞相开发类似的编程应用。Trajectory团队由11名研究员和工程师组成,计划将这一技术推广到编程领域之外的AI工具改进中。

“即便是当今最强大的AI依然是静态的。你昨天用的模型,今天仍会犯同样的错误,”Malde说。“已有少数公司开始迈向持续学习的世界。我们的目标是为所有企业打造实现持续学习的平台。”

将这一理念应用于其他领域的挑战在于,编程结果易于验证——代码要么能运行,要么不能,而其他行业对成功的定义则更为模糊。Karanam表示,Trajectory平台的一大优势是能够帮助企业根据自身需求优化AI模型。

Trajectory并非直接使用OpenAI或Anthropic的现成模型,而是让客户从一个开源模型开始,针对特定AI产品进行后续训练。例如,客户Decagon开发AI客服代理,Trajectory会记录AI未能满足需求的情况,比如客户退货请求被转给人工客服,并利用这些数据每周训练新模型。Trajectory声称,这些后训练模型在企业最关心的狭窄任务上,表现优于顶尖实验室的模型。

企业高管们渴望将AI应用于各种任务,但目前往往需要雇佣“前线部署工程师”——即嵌入企业内部的顾问和技术人员,帮助构建AI产品。OpenAI、Anthropic和Palantir等公司纷纷满足这一需求。Elabd表示,Trajectory的目标是打造一个能够自我改进的产品,减少企业对内部工程师持续维护AI系统的依赖。该初创公司已有包括企业销售初创公司Clay和法律AI初创公司Harvey在内的客户,未来计划将平台推广至财富500强企业。

批评者可能认为,Trajectory尚未实现传统意义上的真正持续学习,因为其模型目前仅每周更新一次,更新间隔内仍保持静态。

Elabd认为,Trajectory才刚刚起步。他表示AI行业正迈向一个新范式,即AI从经验中学习——这与AI编程领域的现状类似。Trajectory的最终目标是打造一个能够每天甚至更频繁更新企业AI模型的平台。

“每天更新可能还不够,可能是每小时,甚至每次交互都更新,”Elabd说。“也许每家公司不止需要一个AI,而是可以为每个员工训练一个能持续学习的AI。”