DeepSeek发布新AI模型，缩小与顶尖模型的差距

中国AI实验室DeepSeek近日推出了其最新大型语言模型DeepSeek V4的两个预览版本——V4 Flash和V4 Pro。这是继去年发布的V3.2版本及其备受关注的R1推理模型之后的重要升级。DeepSeek表示，这两款模型均采用了专家混合（mixture-of-experts）架构，拥有高达100万令牌的上下文窗口，能够处理大型代码库或文档输入。专家混合技术通过激活部分参数来降低推理成本。

其中，V4 Pro模型拥有1.6万亿参数（活跃参数490亿），成为目前最大的开源权重模型，超过了Moonshot AI的Kimi K 2.6（1.1万亿参数）、MiniMax的M1（4560亿参数）以及DeepSeek之前的V3.2（6710亿参数）。较小的V4 Flash版本则拥有2840亿参数（活跃参数130亿）。

DeepSeek称，由于架构上的改进，这两款模型在效率和性能上均优于V3.2，并且在推理基准测试中几乎“缩小了与当前领先模型的差距”，无论是开源还是闭源模型。

公司还声称其新推出的V4-Pro-Max模型在推理基准测试中表现优于开源同类产品，并在部分任务上超过了OpenAI的GPT-5.2和Gemini 3.0 Pro。在编程竞赛基准测试中，DeepSeek表示两款V4模型的表现“可与GPT-5.4相媲美”。

DeepSeek V4性能截图

不过，在知识测试方面，这些模型稍逊于最前沿的模型，特别是OpenAI的GPT-5.4和谷歌最新的Gemini 3.1 Pro。DeepSeek实验室指出，这表明其模型的发展轨迹大约落后于顶尖模型3到6个月。

值得注意的是，V4 Flash和V4 Pro目前仅支持文本输入输出，与许多闭源竞争对手支持音频、视频和图像的多模态能力不同。

此外，DeepSeek V4的使用成本远低于目前市场上的顶尖模型。V4 Flash每百万输入令牌收费0.14美元，输出令牌收费0.28美元，价格低于GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini和Claude Haiku 4.5。V4 Pro则分别为每百万输入令牌0.145美元和输出令牌3.48美元，同样低于Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7和GPT-5.4。

此次发布恰逢美国指控中国通过数千个代理账户大规模窃取美国AI实验室知识产权之际。此前，DeepSeek也曾被Anthropic和OpenAI指控“提炼”其AI模型，实质上是复制其技术。

DeepSeek发布新AI模型，缩小与顶尖模型的差距

标签

评论

相关阅读

72.3%的教师认为“擅长设计提示词的学生学习更深入”——日本アルサーガパートナーズ调查

Grok新增“Build Mode”，仅凭创意即可制作游戏和应用

Siri AI或将为高级用户设立付费墙