Replit在过去六个月内估值飙升至90亿美元。 作为创始人,Amjad Masad和他的团队对当前技术趋势的敏锐把握令人钦佩。或许你未曾深入了解Replit,比如他们2015年的《大师计划》或纪录片,但现在的Replit已远非两年前那个“附带AI功能的编码平台”。

如今,随着软件工程问题基本解决,Replit正向上游拓展,打造一个集画布、应用、网站、幻灯片、视频等多功能于一体的完整生产力套件。这一转型契合2026年的主流趋势:编码代理已解决编码问题,相关开发者正将其扩展至更多知识工作任务,如Pi到OpenClaw、Claude Code到Cowork,以及各大模型实验室对Excel和PowerPoint的集成,Notion也推出了面向各种知识工作整合的自定义代理。

2026年AI趋势回顾

我们总结了2026年值得关注的AI趋势:

  • 2025年12月的编码与推理断层
  • 编码代理向知识工作代理的转变(本文主题)
  • IDE的终结与“黑暗”软件工厂的兴起,无需代码审查
  • AI研究自动化(递归自我改进)
  • 世界模型的发展
  • 内存短缺与定制ASIC堆栈
  • AI与SaaS的重组
  • AI科学应用的突破
  • 高效扩展而无冗余

AI推特热点

NVIDIA Nemotron 3 Super发布及开放模型效率提升

Nemotron 3 Super是一款1200亿参数、约120亿活跃参数的开放模型,支持100万上下文长度,采用混合Mamba-Transformer与SSM Latent MoE架构,专为Blackwell时代部署优化,推理速度比GPT-OSS-120B快2.2倍,社区支持迅速覆盖多个推理框架。

代理基础设施与“更大IDE”论点

产品趋势从“与模型聊天”转向持久代理运行时和编排层。Karpathy提出“IDE时代未结束,而是需要更大IDE”,工作单位由文件转向代理,强调可读、可分叉的代理组织和实时监控。Perplexity推出“个人电脑”,支持本地与云端混合运行,Replit Agent 4则提供多代理协作画布,Base44 Superagents强调集成多种工具,服务非技术用户。

Anthropic及Claude相关动态

Anthropic成立Anthropic Institute,Jack Clark担任公共利益负责人,聚焦AI社会影响。内部传出Claude模型已实现递归自我改进,70-90%的代码由Claude编写,模型发布周期缩短至数周,自动化AI研究或一年内实现。但Claude Code的登录故障暴露了基础设施风险,影响硅谷开发者生产力。

代理评估、检索与自我改进研究

研究重点转向代理系统的测量与改进。PostTrainBench v1.0用于评估代理对语言模型的后训练能力,EvoSkill通过失败学习提升技能,AgentIR结合推理轨迹提升检索准确率。代理可靠性被视为安全问题,强调测量与反馈机制的重要性。

多模态模型与视觉AI

谷歌发布Gemini Embedding 2,支持文本、图像、视频、音频及PDF的多模态嵌入,定价偏高适合多模态检索。Qwen3.5多模态架构融合混合注意力机制,支持百万级上下文。Reka Edge推出面向物理AI的视觉语言模型,性能优于主流8B模型。谷歌展示了AI在乳腺癌筛查和临床对话推理中的应用。

AI社区精选推文

  • Perplexity“个人电脑”:Mac mini上的本地云混合代理,支持远程控制和本地文件访问。
  • Anthropic Institute及Jack Clark新角色,推动强大AI的公共利益讨论。
  • Replit Agent 4:多代理协作画布,支持应用、网站和幻灯片开发。
  • NVIDIA Nemotron 3 Super:开放120B参数混合模型,支持百万上下文。
  • Claude Code故障暴露基础设施风险,影响真实工程流程。

AI Reddit社区动态

/r/LocalLlama 与 /r/localLLM

  • M5 Max 128GB 14寸笔记本的多模型基准测试,涵盖Qwen3.5-122B-A10B、Qwen3-Coder-Next等,展示了不同模型在内存使用和生成速度上的表现差异。
  • Qwen3.5-35B-A3B无审查版本发布,支持多模态输入和混合注意力机制,社区对其性能和量化格式表现出浓厚兴趣。