在OpenAI预计将于下周提交IPO申请之际，Greg发表了最新观点，指出模型实验室正在越来越多地转向构建智能代理作为核心产品：

模型实验室转型

这一观点与此前“Team Big Model”成员，包括OpenAI实验室前负责人，普遍持有的立场形成了巨大反转：

前立场

与此同时，AI21关闭了其模型团队，转而专注于智能代理的开发：

AI21转型

甚至资深的DeepSeek也首次组建了“Harness团队”：

DeepSeek新团队

“系统优于模型”的观点因此获得了验证，但也带来了新的复杂性：如果模型与专属的智能代理紧密联合，可能进一步限制模型的开放访问，迫使用户依赖封闭的代理系统，从而影响模型和API的合作与竞争关系。

以下是2026年5月4日至5日的AI新闻摘要，涵盖了12个Reddit子版块、544个Twitter账号及Discord社区动态。更多内容可访问AINews官网。

AI Twitter综述

智能代理产品、Harness技术与超越“单纯模型”的转变

产品层级上移：模型质量已不再是唯一护城河，成功的产品是模型+Harness+工作流程+界面+记忆+经济模型的综合体。@gdb直言“模型本身已不再是产品”，@dzhng强调顶级产品需要模型与Harness及产品的共生关系。@signulll将环境AI和智能代理视为新一代计算接口，@teortaxesTex则提醒Harness研究仍面临“复制Claude代码”的风险。
编码智能代理产品差异化显现：OpenAI发布了Codex的第六次重大更新，新增Appshots、目标管理、远程计算锁定、注释模式、插件共享及分析功能。用户反馈显示工作流程显著改善，但仍存在远程功能的稳定性问题。Claude团队扩展了自动模式至专业版，并支持Sonnet 4.6，用户对IDE支持的反馈促使快速修复。

DeepSeek定价调整引发市场震动：DeepSeek宣布将V4-Pro版本75%的折扣永久化，显著改变了成本与性能的平衡点。分析显示其运行成本远低于Gemini 3.1 Pro、GPT-5.5及Claude Opus 4.7，推动“智能成本低廉化”的趋势。
Gemini Flash表现提升但反馈不一：Gemini 3.5 Flash在GDPval测试中表现优于3.1 Pro，排名跃升16位，但部分开发者质疑其实际效用与成本效益，认为模型更偏向于最大化评测分数而非人机协作。
Qwen及中国前沿模型持续压缩竞争空间：阿里巴巴发布Qwen3.7-Max，提升了指令遵循和上下文稳定性，但仍存在冗长和高令牌使用问题。多项基准测试显示中国模型在某些环境下优于西方同类产品。

MCP协议重大简化：MCP 2026-07-28候选版本实现无状态设计，取消握手和会话ID，支持任意请求访问任意服务器实例，提升扩展性和负载均衡效率。
沙箱与托管执行成为基础设施新标准：Gemini推出托管智能代理与交互API，CoreWeave发布沙箱服务支持强化学习和模型评估，Cloudsail提供基于Cloudflare的任务级沙箱，满足安全隔离需求。
开源Harness和记忆层快速发展：NVIDIA开源AI-Q代理技能，Teknium增强Hermes的密钥管理与上下文支持，社区开发共享内存层和会话管理工具，推动智能代理生态完善。

强化学习后训练与奖励设计再思考：Vector Policy Optimization（VPO）提出向量化奖励优化，避免标量奖励崩溃，提升搜索性能。相关研究强调结构化反馈替代单一奖励数字。
智能代理编译与蒸馏经济性显现：研究表明复杂代理工作流可蒸馏为权重模型，推理成本降低约100倍，且质量接近前沿水平。
架构创新活跃：线性时间循环Transformer（LT2）、生物真实神经元模型扩展、无损负载均衡方法等新架构不断涌现，辅助评估工具ArtifactLinker提升基准测试预测能力。
数学与推理能力持续提升：GPT-5.5在多位数乘法测试中达到99.46%准确率，现代大模型已能处理百位数乘法，挑战传统“自回归模型无法算术”的观点。

谷歌I/O推动持久智能代理与世界模拟器：发布Gemini Spark全天候个人AI代理，Project Genie结合街景打造互动世界，Gemini Omni支持视频对话创作与定制头像，标志着全模态系统的成熟。
Runway及图像视频工具提升编辑能力：Aleph 2.0支持最长30秒1080p多镜头序列编辑，SeeDance 2 Stitcher实现无缝延展AI生成的电影片段。
语音与图像生成显著进步：Cartesia Sonic-3.5成为顶级TTS模型，支持42种语言，响应速度极快。腾讯Z-Image 6B实现无VAE的像素空间生成，支持高分辨率及Flux/SD模型转换。

网络安全成为智能代理应用试验场：Anthropic的Project Glasswing一个月内发现一万余个高危漏洞，强调行业需适应模型驱动的安全挑战。Perplexity开源Bumblebee扫描工具，企业部署需结合智能代理沙箱与持续安全工程。
美国移民政策引发AI界强烈反弹：拟议规则要求绿卡申请者必须在境外申请，被认为将损害AI人才流动，影响初创企业和研究竞争力，多位AI领袖公开表达担忧。

（内容待补充）