OpenAI近期宣布弃用其微调API,这一举措引发了业界对微调技术未来的广泛讨论。多年来,OpenAI在大型实验室中以支持微调著称,许多AI工程师和专家曾强调微调能以较低成本实现接近原始模型的性能,是AI开发的重要工具之一。
然而,随着行业格局的变化,Anthropic首次可能以更高估值超过OpenAI,微调技术也成为2026年AI发展中的“牺牲品”。即使没有极端的GPU资源紧张,约80%的AI工程师行业趋势也逐渐远离传统微调。
值得注意的是,微调的“终结”并非完全消失,顶尖团队如Cursor和Cognition反而增加了开放模型的强化学习微调(RLFT)应用。开放模型的微调仍可能是定制ASIC设计的重要组成部分,但长提示(如Claude的宪法提示)等新方法也显示出强大潜力。
近期AI研究和产品动态包括:
- 研究基准测试趋于复杂,数学和医学领域的评测不断升级,推动AI推理能力提升。
- 代理系统在科学和数学领域展现出突破性进展,如DeepMind的AI协同数学家和物理领域的专用代理。
- 检索和搜索基准奖励小型专用模型,显示出轻量化模型在特定任务中的优势。
- 训练优化技术持续进步,包括新型优化器和超优化器的应用,提升训练效率。
- 推理系统和运行时基础设施日益专业化,Blackwell机架成为大规模MoE模型推理的参考平台。
- 多模态模型和视频推理技术快速发展,Perceptron Mk1支持高达2帧/秒的视频原生处理,Google和Meta推动多模态交互层创新。
- 代理产品从演示向运营平台转变,OpenAI的Symphony和LangChain的Chat LangChain应用展示了大规模任务代理的潜力。
- 安全和供应链风险日益突出,Mini Shai-Hulud攻击针对AI开发工具链,促使社区快速响应并加强安全防护。
在本地推理领域,Qwen 3.6系列模型表现出色,支持长上下文推理和代码理解,用户分享了基于Intel Optane持久内存的高内存工作站构建,展示了在本地运行超大模型的可能性。
此外,极小型设备上的Transformer模型实验也引人关注,如在Game Boy Color上运行的TinyStories演示,展示了极端资源受限环境下的模型推理可行性。
总体来看,微调技术虽然面临挑战,但AI模型训练和推理的多样化路径正在形成,长提示、强化学习微调、轻量级代理模型和专用硬件协同发展,推动AI应用进入新阶段。



