一切皆为指挥者——AI工具与生态的演进观察

如果你对人工智能如何改善医疗保健感兴趣，欢迎收听我们今天发布的首个相关播客，同时如果你想与该领域的顶尖工程师交流，可以申请成为演讲嘉宾。

在进化生物学中有一个玩笑说“万物皆蟹”，意指蟹的形态在地球上至少独立进化了七次。类似地，今天我们看到AI工具的形态也在不断演化和复制。

GitHub最近宣布推出了全新的GitHub App，正如Y Combinator的CEO Garry Tan所说：“如果你是以代码为先，可能会继续使用VS Code；但如果你是以智能体和GitHub为先，那你将会有全新的体验！”

这款新应用的界面设计让人联想到Conductor，这家公司率先开创了这种形态，并且得到了Garry Tan的公开支持。

那么，两个关键问题来了：

回顾去年短暂流行的看板板形式，我们可以从中获得一些启示。同时，设计师Maggie Appleton也对GitHub Ace的设计思路进行了深入解析。

编码代理工具：Codex移动端、GitHub新应用、VS Code多智能体体验及Hermes/Codex互操作

OpenAI将Codex更深入地融入日常工作流程，推出了ChatGPT移动端的Codex功能，支持远程启动任务、审查输出、批准命令并引导执行，同时Codex可在本地设备持续运行。
GitHub发布了Copilot App技术预览，打造了一个支持多任务流、代码库和PR生命周期管理的桌面环境。
VS Code推出了多智能体窗口，支持多项目工作流及浏览器/移动端访问，并优化了令牌使用效率。
开源项目Nous/Hermes Agent实现了Codex运行时集成，增强了智能体的执行能力。

智能体基础设施与自我改进循环：LangSmith引擎、SmithDB、沙箱及持续学习

LangChain发布了SmithDB数据库，专为智能体追踪数据设计，配合LangSmith引擎实现故障聚类、代码问题识别及自动修复建议，推动从被动观察向主动改进转变。
LangChain Labs启动了持续学习研究，目标是将生产环境中的追踪数据转化为训练信号和能力提升。
Weights & Biases和CoreWeave推出了用于强化学习和工具使用的隔离执行沙箱，确保安全性和稳定性。

Anthropic Claude Code限制及开发者反响

机器人与具身AI：Figure公司24小时自动分拣直播及自动化趋势

研究、基准测试与开源模型

/r/LocalLlama和/r/localLLM社区热点

Qwen 3.6模型在本地推理速度和量化方面取得进展，采用了多令牌预测（MTP）和TurboQuant技术，在MacBook Pro M5 Max上实现了显著加速。
社区对TurboQuant的实际性能存在争议，部分用户认为其在llama.cpp中并不总是最快，且可能带来质量折衷。

整体来看，AI生态正逐步向“智能体优先”的用户体验转变，工具链和基础设施不断完善，机器人和自动化技术也在稳步推进。与此同时，开发者社区对平台政策和订阅模式的稳定性保持高度关注。未来，如何平衡创新、商业化和生态健康，将是关键课题。

评论