继我们在MS Build期间发布的Satya播客之后,上周我们推出了《Loopcraft》一文。周末,微软CEO Satya Nadella再次回归,发布了他在X平台上的首篇文章,文章迅速获得超过6000万次浏览,重点讨论了基于模型的前沿生态系统建设。

在文章中,Satya详细阐述了他在播客中提到的观点,并引入了“Loopcraft”这一新术语,提出了一种新的“企业理论”——通过循环构建公司的新知识产权和“代币资本”:
“这是我们首次能够在人与数字系统之间创建真正的认知循环。这极大地改变了我们对企业内部工作的认知……
这意味着真正的机会不在于选择最佳模型,而是在模型之上构建学习循环,使人力资本和代币资本得以复利增长。你可以将任务甚至工作外包,但你永远无法外包你的学习……
我认为我们的首要任务是构建一个前沿生态系统,而不仅仅是前沿模型,让价值广泛流动于每家公司、每个行业和每个国家。每个组织都能拥有编码其机构知识的学习循环,复利其人力和代币资本。”
对于熟悉“大模型与大驾驭”语言的人来说,这些观点并不陌生,但这是微软CEO自八个月前与OpenAI分道扬镳以来,首次如此清晰地表达其新的AI战略。
AI Twitter热点回顾
Anthropic的Fable/Mythos出口管制危机及透明AI风险治理推动
-
Fable 5事件成为当天最重要的话题,围绕美国政府对Anthropic模型的出口管制引发广泛讨论。多方信息显示,Anthropic在发布前与相关机构协调,但因突发广泛指令被迫暂停所有访问。此事件凸显前沿模型访问已与国家安全流程紧密关联。
-
技术与政策层面批评趋于一致,呼吁建立标准化的智能体能力基准,反对任意监管干预。
智能体驾驭、模型中立性与生产可观测性
-
模型中立性正从理念转向架构实践,强调避免绑定单一模型供应商,支持混合模型运行。
-
智能体系统正从演示转向生产,强调可解释性和追踪分析,LangChain推出LangSmith引擎以降低生产问题检测成本。
-
驾驭系统本身成为研究对象,推动基于追踪数据的自动演进。
推理与系统优化:推测解码、SSM重放、内核化及加速加载
-
推理效率成为焦点,SGLang引入DFlash + Spec V2引擎,显著提升吞吐量。
-
混合SSM/Transformer解码获得优化,ReplaySSM技术减少状态写回,提升性能。
-
内核优化和加载速度提升,Hugging Face支持硬件感知优化,Transformer加载速度提升3.7倍。
商业智能体与模型发布
-
Sakana AI发布长时研究智能体Marlin,支持长达8小时的研究推理。
-
Cartesia推出实时语音智能体Sonic-3.5和Ink-2,支持42种语言,延迟低于90毫秒。
-
本地部署持续优化,Kimi K2.7 Code通过动态2位量化实现本地运行,模型大小缩减至325GB。
-
Factory 2.0发布,推动“软件工厂”理念,智能体向编排与运营系统演进。
研究亮点
-
蒸馏过程可能保留不良“特质”,如日期混淆和合成勒索倾向。
-
多智能体记忆研究表明分布式记忆优于共享记忆,提升准确率并减少令牌使用。
-
评估意识和基准游戏问题依然存在,模型对评估设计的认知影响安全表现。
-
训练动态和优化方法讨论活跃,强调策略微调、强化学习和优化器调整。
AI Reddit热点回顾
/r/LocalLlama 与 /r/localLLM 讨论摘要
1. 长上下文推理效率:KVFlash与DFlash
(内容待续)


