Andrej Karpathy,这位曾共同创立OpenAI并曾领导特斯拉AI团队的知名人工智能研究员,现已加入Anthropic。
Karpathy在周二于社交平台X上宣布:“我已加入Anthropic。我认为未来几年在大型语言模型(LLM)前沿领域将极具影响力。我非常兴奋能加入这里的团队,重新投身研发工作。”
本周,Karpathy开始在Anthropic工作,负责预训练项目,团队由Nick Joseph领导。预训练阶段负责大规模训练任务,为Claude模型提供核心知识和能力。该阶段也是构建前沿模型中最昂贵且计算密集的部分。
Anthropic发言人向TechCrunch透露,Karpathy将组建一个团队,利用Claude加速预训练研究。
Karpathy是少数能够连接LLM理论与大规模训练实践的研究者之一。Anthropic选择他来组建团队,表明公司相信通过AI辅助研究,而非单纯依赖算力,才能在与OpenAI和谷歌的竞争中保持优势。
Karpathy在OpenAI期间专注于深度学习和计算机视觉,2017年离开后加入特斯拉,领导全自动驾驶(FSD)和自动辅助驾驶项目,直到2022年离职。随后他回到OpenAI工作一年,2024年再次离开,创办了专注于将AI助手应用于教育领域的创业公司Eureka Labs。

自Eureka Labs成立以来,Karpathy鲜有更新,尚不清楚他是否会继续参与该项目。他还开设了在线课程《神经网络:从零到英雄》,帮助学生从零开始编写神经网络代码,并在YouTube频道定期发布关于LLM和AI的讲座。
Karpathy表示:“我依然对教育充满热情,计划适时恢复相关工作。”
TechCrunch已联系Karpathy寻求评论。
此外,Anthropic还聘请了拥有20多年网络安全经验的Chris Rohlf加入其前沿红队,负责对先进AI模型进行严苛的安全测试。Rohlf曾在Yahoo著名的网络安全团队“The Paranoids”工作,最近六年任职于Meta,并曾是乔治城大学安全与新兴技术中心的研究员,参与CyberAI项目。
Rohlf在X上表示:“我们面临着用AI显著提升网络安全的重大机遇。我无法想象在这个关键时刻有比Anthropic更合适的公司和团队。”
