#推理能力 - AI情报

2026/04/25

DeepSeek发布新AI模型，缩小与顶尖模型的差距

中国AI实验室DeepSeek近日推出了其最新大型语言模型DeepSeek V4的两个预览版本——V4 Flash和V4 Pro。这是继去年发布的V3.2版本及其备受关注的R1推理模型之后的重要升级。DeepSeek表示，这两款模型均采用了专家混合（mixture-of-experts）架构，拥有高达100万令牌的上下文窗口，能够处理大型代码库或文档输入。专家混合技术通过激活部分参数来降低推理成本

AI资讯

2026/03/23

欧洲AI巨头发布全能模型！Mistral Small4震撼登场：推理、多模态与编程一体化

Mistral AI推出了全新多功能模型Mistral Small4，集顶级推理、多模态理解和编程能力于一身，开发者无需在专业模型间取舍，一次拥有全部功能。

AI资讯2026/03/18

xAI发布Grok4.20：推理性能大幅提升，78%非虚构率创行业新高

2026年3月12日，xAI正式推出新一代大型语言模型Grok4.20Beta，该模型在保持竞争性价格的同时，实现了极高的事实可靠性，刷新了行业记录。根据Artificial Analysis的最新评测，Grok4.20在智能指数中的推理能力得分为48分，比上一版本提升了6分。虽然在综合基准测试中仍落后于Gemini3.1Pro Preview和GPT-5.4（两者均为57分），但其在AA全知测

AI资讯2026/03/28

前Qwen核心技术人员发声：大模型正向行动型智能体演进

阿里巴巴前统一本体千问技术负责人林金阳发表首篇离职后文章，指出大模型正从“推理思维”转向“智能体思维”，未来重点在于模型能否为行动而思考，并通过与现实世界的交互不断优化计划。

AI资讯

2026/03/31

理光开发具备图表识别推理能力的多模态大规模语言模型

日本理光株式会社于30日宣布，完成了具备高精度读取包含图表等多样文档推理能力的多模态大规模语言模型（以下简称推理LMM）基础模型“Qwen3-VL-Ricoh-32B-20260227”的开发。该项目是由日本经济产业省和日本国立研究开发法人新能源·产业技术综合开发机构（NEDO）推动的，旨在加强日本国内生成式AI开发能力的“GENIAC（Generative AI Accelerator Chal