Anthropic年收入达190亿美元，Qwen团队离职，Gemini与GPT加速模型更新

本期AI新闻涵盖2026年3月2日至3月3日的行业动态。我们监测了12个Reddit子版块、544个Twitter账号和24个Discord服务器（共264个频道，12765条消息），为您节省约1137分钟的阅读时间。更多历史内容可访问AINews官网，AINews现为Latent Space的一部分，您可自由选择订阅频率。

今日最重要的消息是Anthropic确认其年经常性收入（ARR）已达到190亿美元。经过一个月的高曝光，Anthropic的收入几乎追平OpenAI最新披露的200亿美元，2026年底目标300亿美元看似触手可及。如果Anthropic能超越OpenAI，这将是自ChatGPT发布以来行业格局的重大变革。

Anthropic收入图

此外，推荐观看Gemini 3.1 Flash-Lite演示视频，其速度表现优于OpenAI最新的GPT 5.3即时消息功能。

Gemini 3.1 Flash-Lite

另一方面，Qwen团队多名研究人员因内部政治问题离职，这对开源社区是一次重大打击，可能带来长期影响。

Qwen团队离职

AI Twitter动态回顾

Gemini 3.1 Flash-Lite发布：动态思考层级与高性价比

Gemini 3.1 Flash-Lite作为Google最快且成本最低的Gemini 3系列端点，重点提升延迟和吞吐量，适合高负载工作。DeepMind称其为“规模化智能”，支持根据任务复杂度调整计算资源。API通过AI Studio和Vertex发布。Jeff Dean强调输入成本0.25美元/千次，输出1.5美元/千次，性能指标显著提升，响应速度比Gemini 2.5快2.5倍。
第三方测试显示Flash-Lite支持1百万上下文窗口，输出速度超过360个token/秒，平均响应延迟约5.1秒，智能指数优于2.5版本，但价格有所上涨。社区对其命名和快速迭代频率反应热烈。
Google员工建议使用Flash-Lite替代传统解析器，支持文本、图像、视频、音频及PDF的多模态输入，定位为生产流水线的基础模型。

OpenAI：GPT-5.3 Instant全面推送，减少说教风格，预告GPT-5.4

GPT-5.3 Instant已向所有ChatGPT用户开放，针对5.2版本“过于谨慎”做出改进，提升对话自然度，减少不必要的拒绝和防御性免责声明，搜索集成回答更准确。内部数据显示，带搜索时幻觉率降低26.8%，不带搜索时降低19.7%。
GPT-5.3-chat-latest已出现在API中，并可在Text Arena进行对比评测。
OpenAI发布“5.4版本比你想象的更快到来”的预告，引发关于版本发布顺序的讨论，也被视为转移国防部/NSA合同争议焦点的策略。

阿里巴巴Qwen团队震荡：领导层离职，开源未来存疑

Qwen技术领导和核心成员大规模离职，Justin Lin的“辞职”引发广泛关注，随后更多高层跟进离开。外界认为阿里云可能驱逐了Qwen技术负责人。
技术层面，Qwen被视为开源模型生态关键基础设施，尤其是小于10亿参数和视觉语言模型及OCR衍生品。团队动荡可能影响开源权重更新节奏和授权策略。
组织层面，阿里巴巴高层统一管理带来政治压力，影响团队影响力和外部信任构建。
尽管如此，Qwen 3.5 LoRA微调指南和低显存训练方案仍在社区快速传播，GPTQ Int4权重支持也在推广，显示发布节奏依然强劲。

长上下文与训练效率提升

Together团队提出混合并行技术，成功在单节点8×H100上训练5百万上下文窗口的8B模型，注意力内存消耗降低87%。
Databricks开源FlashOptim优化器，实现训练内存减少超过50%，显著降低AdamW训练开销。
SkyPilot建议强化学习后训练采用异构硬件分工，提升效率。
CuTeDSL与torch.compile兼容性问题导致部分内核性能下降，凸显编译与内核优化的矛盾。

智能体工程现实检验

新数据库分析指出现有智能体基准测试过度侧重数学和编码任务，忽视了实际劳动分布，Arena推出Document Arena针对PDF推理进行评测。
多智能体协调存在脆弱性，常因超时和停滞导致共识失败，理论模型辅助效果依赖基础模型能力。
MCP（多模型协作平台）虽有质疑，但实际应用扩展，Notion和Cursor均推出相关支持。
关于取消人工代码审查的争论激烈，部分专家认为大量代码生成可能导致代码库复杂度过高，反而降低效率。
Perplexity推出安全沙箱环境的“Computer”平台，支持多模型协同，简化API密钥管理。

人才、治理与信任动态

OpenAI后训练副总裁Max Schwarzer离职加盟Anthropic，带来行业震动。
报道称美国国防部威胁将Anthropic列为供应链风险，影响Palantir联邦项目使用，Anthropic寻求保障措施。
OpenAI与国防部/NSA合同引发信任危机，呼吁公开合同条款和独立法律审查。
市场份额方面，有传Claude在美国商业市场份额迅速增长，挑战ChatGPT地位。

Reddit热点回顾

/r/LocalLlama与/r/localLLM

Qwen 3.5模型发布，参数约8亿，包含视觉编码器，语言模型部分更小，代表向更小更高效模型的趋势。尽管性能提升显著，但存在事实错误，需加强事实核查。
小型MoE模型表现优异，适合本地个人助理应用，尤其适合资源有限的用户。
4亿参数量化模型在低端硬件上表现良好，使用llama.cpp实现128k上下文时速达60 tokens，显示本地高效AI的潜力。

综上，当前AI领域正经历快速迭代与人才流动，技术创新与组织变革并存，未来发展值得持续关注。

Anthropic年收入达190亿美元，Qwen团队离职，Gemini与GPT加速模型更新

AI Twitter动态回顾

Reddit热点回顾

标签

评论

相关阅读

东京大学学生生成式AI使用率达93.4%，匿名问卷应用用户突破500人

Meta新款AI芯片将于九月开始量产

TOPPAN等三家公司推动日本政府共通数据的AI准备化