前谷歌与苹果研究员创办初创公司，打造AI缺失的反馈循环

一群曾在谷歌DeepMind、苹果、OpenAI和Meta超级智能实验室工作的AI研究员，于周三宣布成立一家名为Trajectory的新创公司，目标是帮助企业通过训练基于真实用户交互的数据，持续改进其AI产品。

Trajectory致力于打造一个能够持续学习的AI平台，这一直被研究人员视为推动AI进一步发展的关键障碍。OpenAI、谷歌和Anthropic在训练越来越强大的AI模型方面取得了成功，尤其是在编程、数学和科学领域。然而，这些系统在训练完成后便停止进步。尽管近期在持续学习方面有一些突破，科技公司普遍难以打造能够实时从错误中学习的AI产品。2025年12月，在年度最大AI研究会议NeurIPS上，图灵奖得主理查德·萨顿强调，持续学习对于构建超级智能代理至关重要。

Trajectory已完成1500万美元的种子轮融资，估值达1.15亿美元，领投方为风险投资公司Conviction，参与者还包括Bessemer Venture Partners、Radical VC和BoxGroup。个人投资者中有谷歌DeepMind首席科学家Jeff Dean，以及被誉为“AI教母”的斯坦福教授兼World Labs CEO李飞飞。

Trajectory的CEO兼联合创始人Ronak Malde曾是Windsurf的AI研究员，去年谷歌DeepMind以24亿美元收购该编程初创公司时，他成为少数加入DeepMind的员工之一。其他联合创始人包括曾参与苹果Vision Pro项目的前AI研究员Arjun Karanam，以及曾在谷歌DeepMind机器人部门工作的Michael Elabd。

Malde向WIRED表示，一些领先的AI编程产品如Cursor，已经在实践早期版本的持续学习——利用用户与产品的真实交互数据进行训练后优化，并定期发布模型更新。他认为这正是AI编程产品迅速发展的核心原因之一，也促使主要AI实验室竞相开发类似的编程应用。Trajectory团队由11名研究员和工程师组成，计划将这一技术推广到编程领域之外的AI工具改进中。

“即便是当今最强大的AI依然是静态的。你昨天用的模型，今天仍会犯同样的错误，”Malde说。“已有少数公司开始迈向持续学习的世界。我们的目标是为所有企业打造实现持续学习的平台。”

将这一理念应用于其他领域的挑战在于，编程结果易于验证——代码要么能运行，要么不能，而其他行业对成功的定义则更为模糊。Karanam表示，Trajectory平台的一大优势是能够帮助企业根据自身需求优化AI模型。

Trajectory并非直接使用OpenAI或Anthropic的现成模型，而是让客户从一个开源模型开始，针对特定AI产品进行后续训练。例如，客户Decagon开发AI客服代理，Trajectory会记录AI未能满足需求的情况，比如客户退货请求被转给人工客服，并利用这些数据每周训练新模型。Trajectory声称，这些后训练模型在企业最关心的狭窄任务上，表现优于顶尖实验室的模型。

企业高管们渴望将AI应用于各种任务，但目前往往需要雇佣“前线部署工程师”——即嵌入企业内部的顾问和技术人员，帮助构建AI产品。OpenAI、Anthropic和Palantir等公司纷纷满足这一需求。Elabd表示，Trajectory的目标是打造一个能够自我改进的产品，减少企业对内部工程师持续维护AI系统的依赖。该初创公司已有包括企业销售初创公司Clay和法律AI初创公司Harvey在内的客户，未来计划将平台推广至财富500强企业。

批评者可能认为，Trajectory尚未实现传统意义上的真正持续学习，因为其模型目前仅每周更新一次，更新间隔内仍保持静态。

Elabd认为，Trajectory才刚刚起步。他表示AI行业正迈向一个新范式，即AI从经验中学习——这与AI编程领域的现状类似。Trajectory的最终目标是打造一个能够每天甚至更频繁更新企业AI模型的平台。

“每天更新可能还不够，可能是每小时，甚至每次交互都更新，”Elabd说。“也许每家公司不止需要一个AI，而是可以为每个员工训练一个能持续学习的AI。”

前谷歌与苹果研究员创办初创公司，打造AI缺失的反馈循环

标签

评论

相关阅读

东京大学学生生成式AI使用率达93.4%，匿名问卷应用用户突破500人

Meta新款AI芯片将于九月开始量产

TOPPAN等三家公司推动日本政府共通数据的AI准备化