#推理能力

按标签聚合查看文章内容。

DeepSeek发布新AI模型,缩小与顶尖模型的差距AI资讯

DeepSeek发布新AI模型,缩小与顶尖模型的差距

中国AI实验室DeepSeek近日推出了其最新大型语言模型DeepSeek V4的两个预览版本——V4 Flash和V4 Pro。这是继去年发布的V3.2版本及其备受关注的R1推理模型之后的重要升级。DeepSeek表示,这两款模型均采用了专家混合(mixture-of-experts)架构,拥有高达100万令牌的上下文窗口,能够处理大型代码库或文档输入。专家混合技术通过激活部分参数来降低推理成本

理光开发具备图表识别推理能力的多模态大规模语言模型AI资讯

理光开发具备图表识别推理能力的多模态大规模语言模型

日本理光株式会社于30日宣布,完成了具备高精度读取包含图表等多样文档推理能力的多模态大规模语言模型(以下简称推理LMM)基础模型“Qwen3-VL-Ricoh-32B-20260227”的开发。该项目是由日本经济产业省和日本国立研究开发法人新能源·产业技术综合开发机构(NEDO)推动的,旨在加强日本国内生成式AI开发能力的“GENIAC(Generative AI Accelerator Chal

AI资讯

xAI发布Grok4.20:推理性能大幅提升,78%非虚构率创行业新高

2026年3月12日,xAI正式推出新一代大型语言模型Grok4.20Beta,该模型在保持竞争性价格的同时,实现了极高的事实可靠性,刷新了行业记录。 根据Artificial Analysis的最新评测,Grok4.20在智能指数中的推理能力得分为48分,比上一版本提升了6分。虽然在综合基准测试中仍落后于Gemini3.1Pro Preview和GPT-5.4(两者均为57分),但其在AA全知测