OpenClaw的双面故事

发布时间：2026/4/18

在本周几场重要的三字母会议巧合之际，Peter Steinberger的TED演讲和AIE演讲同时发布。对大众而言，OpenClaw的励志故事在舞台上精彩呈现，回顾了其发展中的诸多高光时刻：

OpenClaw演讲现场

而对工程师群体来说，演讲则更为严肃，谈及了OpenClaw作为史上增长最快的开源项目所面临的前所未有的安全事件（报告数量是curl的60倍，至少20%的技能贡献带有恶意）以及扩展难题。

文末还包含了由我主持的AMA环节。

欢迎大家对这两种视角进行对比和讨论。

AI Twitter 本周回顾

Anthropic发布Claude Opus 4.7及Claude Design

Claude Design作为Anthropic首个设计/原型制作工具发布，支持从自然语言指令生成原型、幻灯片和单页文档，基于Claude Opus 4.7。该产品被视为Anthropic从聊天和编码工具向设计工具领域的扩展，直接挑战Figma、Lovable、Bolt等产品。市场反应迅速，Figma股价出现明显下跌。
Opus 4.7整体表现更强，第三方基准测试显示其在代码和文本领域均领先，且在智能指数和代理能力测试中排名靠前。新版本引入任务预算和自适应推理，输出令牌减少约35%。不过发布初期用户体验有波动，部分用户报告回退和上下文失败，团队迅速修复了多数问题。
成本与效率成为关注重点，部分用户指出新模型在保持性能的同时，令牌使用量减少约10倍，性价比显著提升。

计算机使用、编码代理与工具设计

OpenAI的Codex桌面使用更新引发强烈反响，被认为在实际感受上接近AGI，支持Slack、浏览器及任意桌面应用，可能成为企业遗留软件的首个真正可用平台。
领域趋势趋向于“简单的工具框架、强大的评估、模型无关的支架”，多篇高质量帖子强调稳定性提升更多依赖于工具设计而非单纯追求更大模型。
开源代理栈持续增长，Hermes Agent及其衍生项目备受关注，社区举办了25000美元的Hermes Agent创意黑客松，推动从编码生产力向创意代理工作流发展。

代理研究：自我改进、监控、网页技能与评估

多篇论文推动代理的鲁棒性和持续改进，提出了利用隐藏状态探针检测推理退化的方法，显著减少重复率。网页代理方面，WebXSkill提升了代理在WebArena和WebVoyager上的表现。
开放世界评估成为新趋势，呼吁更宽泛的长期开放环境测试，相关项目如CRUX致力于在复杂真实环境中定期评估AI代理。
文档OCR和检索评估更加聚焦代理需求，ParseBench提出基于内容忠实度的OCR测试，检索领域发现晚期交互表示可替代全文文本。

开源模型、本地推理与推理系统

Qwen3.6本地量化工作流表现亮眼，展示了llama.cpp结合树莓派的本地代理栈，Red Hat发布了NVFP4量化版本，表现优异。
消费级硬件推理持续进步，PyTorch/TorchAO支持FP8和NVFP4量化无显著延迟，苹果设备上Gemma 4实现了完全离线长上下文运行。
推理基础设施更新显著，MORI-IO KV连接器提升单节点吞吐率2.5倍，Cloudflare推动代理平台发展，推出多项创新功能和压缩技术。

科学、医疗与基础设施领域的AI应用

科学发现和个性化健康成为应用热点，模型能从相关论文预测下游核心贡献，GIANTS-4B模型表现领先。健康领域发现“深夜刷屏”与抑郁严重度相关，基因组分析代理已能提供个性化预防建议。
大规模计算资源建设仍是核心话题，美国Stargate项目预计2029年达到9+GW规模，相当于纽约市峰值需求，标志着计算驱动经济的基础设施建设。

AI Reddit 本周回顾

/r/LocalLlama 与 /r/localLLM 讨论摘要

Qwen3.6模型发布及其特性

（内容待续）

标签

#开源项目 #人工智能 #模型评测 #计算机使用 #科学应用

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

TechCrunch出行：汽车行业的AI技能竞赛即将来临

2026/05/18

TechCrunch出行：汽车行业的AI技能竞赛即将来临

欢迎回到TechCrunch出行——您获取未来交通新闻与洞察的中心平台。想要免费订阅，请访问TechCrunch出行官网。当前交通领域乃至各行各业都呈现出一个趋势：人工智能（AI）正在为部分人创造就业机会，同时也导致另一些岗位消失。以通用汽车（General Motors）为例，该公司裁减了其IT部门超过10%的员工，约600名正式员工，进行了一场有意的技能置换。虽然这并非一对一的岗位替换，意

日本TISI与AtStream Consulting发布面向系统规划构想流程的AI代理实证成果

2026/08/01

日本TISI与AtStream Consulting发布面向系统规划构想流程的AI代理实证成果

日本TISI株式会社与日本AtStream Consulting株式会社于28日宣布，基于TISI的生成式AI业务支持服务“Agentic AI Platform”，开发了一款支持系统规划构想流程输出制作的AI代理应用，并通过实际项目应用验证了其效果。 “Agentic AI Platform”是一个无需编码即可开发结合多种AI功能的业务支持应用的平台。此次，TISI与AtStream Consu

微软Copilot AI被曝一键泄露2FA验证码，助黑客窃取账户

2026/06/18

微软Copilot AI被曝一键泄露2FA验证码，助黑客窃取账户

微软的Copilot企业版聊天机器人存在严重安全漏洞，黑客仅需点击一次即可窃取用户的双因素认证代码，暴露敏感数据。