xAI发布Grok4.20:推理性能大幅提升,78%非虚构率创行业新高
2026年3月12日,xAI正式推出新一代大型语言模型Grok4.20Beta,该模型在保持竞争性价格的同时,实现了极高的事实可靠性,刷新了行业记录。 根据Artificial Analysis的最新评测,Grok4.20在智能指数中的推理能力得分为48分,比上一版本提升了6分。虽然在综合基准测试中仍落后于Gemini3.1Pro Preview和GPT-5.4(两者均为57分),但其在AA全知测
按标签聚合查看文章内容。
2026年3月12日,xAI正式推出新一代大型语言模型Grok4.20Beta,该模型在保持竞争性价格的同时,实现了极高的事实可靠性,刷新了行业记录。 根据Artificial Analysis的最新评测,Grok4.20在智能指数中的推理能力得分为48分,比上一版本提升了6分。虽然在综合基准测试中仍落后于Gemini3.1Pro Preview和GPT-5.4(两者均为57分),但其在AA全知测