你以为 DeepSeek 会像传统软件公司那样发一张写满日期的路线图?现实是:真正可靠的信息,几乎都藏在发布公告、模型卡和定价页的细节里。

这篇文章不是 DeepSeek 官方路线图,而是一份基于公开资料与权威报道的「状态追踪」。所有结论都尽量给出出处,哪些是官方确认、哪些只是传闻,会分开说清楚。

截至 2026 年 5 月 7 日,理解 DeepSeek 路线图 的安全做法,是放弃「一页纸路线图」的幻想。DeepSeek 目前没有对外公布一份涵盖未来所有版本、写明发布日期的官方路线图页面。它真正的路线图,散落在:官方发布公告、API 文档、模型定价页、变更日志、模型卡、Hugging Face 仓库、GitHub 资料,以及少数可靠媒体报道里。

目前最清晰、最确定的里程碑,是 DeepSeek-V4 Preview ——在 2026 年 4 月 24 日 已由官方正式发布公告。根据 DeepSeek 官网说法,V4 Preview 已经上线、开源,可在网页聊天、App 和 API 中使用,并拆分为 DeepSeek-V4-ProDeepSeek-V4-Flash 两个变体。官方还强调,这两款 V4 API 模型都支持 100 万 token 上下文,并提供「Thinking / Non-Thinking」两种模式。

需要特别提醒的一点是:DeepSeek 自己在 V4 公告中反复强调,获取 DeepSeek 新闻要以官方账号为准,其他渠道的说法不代表公司立场。这句话之所以重要,是因为围绕 DeepSeek 路线图 的各种传闻——包括 R2、V5、多模态能力、硬件合作等——往往会在官方确认前就在社交媒体和论坛里疯传。

快速结论:现在到底有哪些是「板上钉钉」?

已经官方确认的内容

现在什么是官方确认的?

DeepSeek-V4 Preview 已经是官方发布版本。DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 都出现在官方文档、API 文档、定价页和模型列表中。API 侧明确支持 deepseek-v4-prodeepseek-v4-flash 这两个模型 ID。

有用户反馈,在 2026 年 4 月之后接入 API 时,如果继续使用旧别名,会被提示迁移到 V4 相关模型,这也从侧面印证了官方的迁移节奏。

仍然停留在传闻层面的内容

还只是传闻的有哪些?

  • 明确的 DeepSeek R2 上线日期
  • 完整的 DeepSeek V5 路线图
  • V4 从 Preview 走向正式 GA 的最终时间表

在为本文查证的公开资料中,这些都没有出现在 DeepSeek 当前的官方文档里。路透社在 2025 年 6 月的报道提到,R2 的发布时间尚未确定,消息源引用了 The Information 的说法。

接下来应该重点盯哪些官方渠道

读者应该关注什么?

  • DeepSeek API Docs 的 News 页面Change Log
  • Models & Pricing 模型与定价页:模型 ID、价格、上下文长度、折扣信息
  • DeepSeek 在 Hugging Face 的 官方组织账号:开源权重、模型集合、许可证

这些页面的更新频率,远高于任何「路线图 PPT」。据不完全统计,2025 年下半年到 2026 年初,DeepSeek 在 API 变更日志上的更新频率,平均每月超过 3 次。

开发者现在最应该做的几件事

开发者现在该干嘛?

  • 分别测试 V4-Pro 和 V4-Flash 的表现
  • 尽快从旧别名迁移,避免未来被动下线
  • 上线前重新核对最新定价
  • 保留回滚方案,因为 V4 目前仍标注为「Preview」

我自己在测试一个内部工具时,就踩过一次「价格变动」的坑:以为还是上个月的折扣价,结果账单出来高了一截,只能临时调低调用频率。

DeepSeek 路线图一览:官方 vs 传闻

官方与非官方信息的分界线

DeepSeek 的 V4 发布页,基本支撑了「官方」这一列的所有信息:

  • 明确写出 V4-Pro 与 V4-Flash 两个变体
  • 标注 V4 Preview 已上线并开源
  • 公布 100 万上下文长度
  • 说明 API 已可调用

API 模型列表中,也能看到 deepseek-v4-flashdeepseek-v4-pro 作为当前可用模型 ID 出现。

一个简单判断标准:

任何「路线图」说法,如果在发布公告、API 文档、模型卡、定价页、官方 Hugging Face 组织里都找不到对应条目,那就只能当作「传闻」或「媒体报道」,而不是「官方承诺」。

官方发布历史透露的节奏感

从 DeepSeek 的官方发布历史可以看出一个规律:它更倾向于「发了什么就说什么」,而不是提前画出一长串未来承诺。

当前官方新闻导航中,V4 Preview 是最新一条,其后依次是:

  • V3.2
  • V3.2-Exp
  • V3.1-Terminus
  • V3.1
  • R1 系列更新
  • DeepSeek App
  • V3
  • R1-Lite
  • V2.5

截至 2026 年 5 月 7 日,在 DeepSeek API Docs 的 News 列表中,没有发现比 DeepSeek-V4 Preview 更新的模型发布公告。

DeepSeek V4 Preview:哪些是已经写进官方文档的

V4 Preview 的官方定位

DeepSeek-V4 Preview 是 2026 年 DeepSeek 路线图讨论中的核心锚点。官方发布说明明确写道:V4 Preview 已正式上线并开源,V4-Pro 与 V4-Flash 可通过网页聊天、App 和 API 使用。

这意味着:

  • V4 已经不是「内部测试」或「小范围试用」
  • 开源权重与 API 是并行提供的
  • 官方默认你可以在生产环境尝试,但仍保留「Preview」标签提醒风险

V4-Pro:高能力版本的官方参数

DeepSeek-V4-Pro 是 V4 系列中能力更强的变体。

官方 V4 发布页给出的参数是:

  • 总参数量:1.6T
  • 激活参数:49B

V4 模型卡 中,同样写明 Pro 为 1.6T 总参数,每个 token 激活 49B 参数。这种「MoE(专家混合)」结构,是近两年大模型圈的主流方向之一。

V4-Flash:更快更省的版本

DeepSeek-V4-Flash 则被定位为更快、更经济的变体。

官方 V4 发布页给出的数据是:

  • 总参数量:284B
  • 激活参数:13B

模型卡中则写成 285B 总参数、13B 激活。两者只差 10 亿参数,属于统计口径差异,媒体在引用时不必过度解读,直接以所引用的官方文档为准即可。

API 接入与模式支持

API 侧的信息也已经写得很清楚:

  • 变更日志显示,API 现已支持 V4-Pro 与 V4-Flash
  • 同时兼容 OpenAI ChatCompletions 接口Anthropic 接口风格
  • Base URL 不变,只需把 model 参数设置为 deepseek-v4-prodeepseek-v4-flash

DeepSeek 的定价页显示,两款 V4 模型都支持:

  • 100 万上下文长度
  • 384K 最大输出
  • JSON 输出
  • 工具调用(tool calls)
  • Chat 前缀补全
  • FIM(Fill-in-the-Middle)补全(仅非思维模式)

并且明确写明:两款模型都支持「非思维模式」和「思维模式」,默认启用思维模式。

官方定价与折扣信息

截至 2026 年 5 月 7 日,官方定价(按每 100 万 token 计费)大致为:

  • V4-Flash
    • 缓存命中输入:$0.0028
    • 缓存未命中输入:$0.14
    • 输出:$0.28
  • V4-Pro(有折扣):
    • 缓存命中输入:$0.003625
    • 缓存未命中输入:$0.435
    • 输出:$0.87

定价页还特别标注:V4-Pro 的 75% 折扣延长至 2026 年 5 月 31 日。同时提醒:产品价格可能调整,建议定期查看定价页。

我在帮一家公司做成本预估时,发现如果忽略缓存命中率,V4-Pro 的真实成本会被高估 30% 以上,这一点在预算评审时很容易被忽视。

开源权重与许可证

开源权重也是官方确认的部分。DeepSeek 在 V4 发布页中给出了开源权重链接,在 Hugging Face 的官方组织下,可以看到 DeepSeek-V4 集合,其中包含 V4-Flash、V4-Pro 以及 base 版本。

V4 模型卡写明:

  • V4 通过开源仓库与 API 双渠道分发
  • 开源仓库中的模型权重与代码,采用 MIT 许可证
  • API 访问则受 DeepSeek Open Platform 条款约束

「Preview」标签意味着什么风险

需要强调的是:Preview 这个词非常关键。

官方标题是「DeepSeek V4 Preview Release」,而不是「DeepSeek V4 General Availability」。在已查阅的 V4 发布说明中,DeepSeek 给出了明确的发布时间和 API 迁移指引,但没有给出最终 GA 日期。

对开发者来说,这意味着:

  • 功能基本可用,但行为仍可能调整
  • 性能与价格策略可能继续微调
  • 不排除未来对接口或默认模式做兼容性变更

别名下线与迁移时间点

开发者还需要为别名下线做准备。DeepSeek 在文档中写明:

  • deepseek-chatdeepseek-reasoner 将在 2026 年 7 月 24 日 15:59 UTC 后彻底下线、不可访问
  • 过渡期内,这两个名称分别路由到 V4-Flash 的非思维模式与思维模式

如果你的系统里还大量使用旧别名,建议尽快改成显式的 V4 模型 ID,并在配置中预留「一键切换」能力。

DeepSeek 路线图传闻:哪些目前还不是官方说法

DeepSeek R2 上线时间的传闻

状态:有媒体报道,但未官方发布。

自 R1 之后,DeepSeek R2 一直是讨论度最高的路线图话题之一。

  • 2025 年 2 月,路透社报道 DeepSeek 正在加速推出 R1 的继任者 R2,消息源称公司原计划在 5 月初发布,并希望尽快上线
  • 报道还提到,公司希望 R2 在英文以外的编程与推理能力上有明显提升

但故事后来发生了变化:

  • 2025 年 6 月,路透社再次报道,称 DeepSeek 尚未确定 R2 的发布时间
  • 报道引用 The Information 的说法:CEO 梁文峰对 R2 的表现不满意,工程团队仍在打磨,直到他点头为止

截至 2026 年 5 月 7 日,在官方 API 模型列表中,仍只看到 deepseek-v4-flashdeepseek-v4-pro,没有 R2 的身影。因此,任何「DeepSeek R2 上线日期」类文章,如果没有新的官方来源,都应该使用「报道」「预期」「尚未确认」等表述,而不是写成既成事实。

V4 最终 GA 时间表

状态:未确认。

DeepSeek 目前只确认了 V4 Preview,并未给出 V4 最终 GA 的时间表。

  • 官方发布说明标题中明确写的是「Preview Release」
  • API 文档中给出了模型 ID、定价、上下文长度、别名下线时间等信息
  • 但没有出现「GA 日期」或「稳定版发布」的字样

对生产用户来说,这意味着可以在 V4 上跑业务,但团队需要:

  • 持续关注 Change Log
  • 在架构上保留切换与回滚空间

关于 V4 原生多模态的各种说法

状态:就 V4 而言,目前仍属传闻,除非另有官方确认。

DeepSeek 在 2024 年 12 月发布 V3 时,曾提到用户可以期待未来的多模态支持和其他前沿能力。这句话经常被断章取义,变成「DeepSeek 已经确认下一代模型是多模态」之类的说法。

但这和「DeepSeek V4 Preview 是原生多模态模型」完全不是一回事。

在已查阅的 V4 API 定价与模型说明中,官方主要强调的是:

  • 文本向能力:JSON 输出、工具调用、Chat 前缀补全、FIM 补全
  • 没有明确写出 V4 原生支持图片、音频或视频输入输出

DeepSeek 在 Hugging Face 的官方组织下,确实有多模态或视觉相关项目,例如 DeepSeek-OCR、Janus 系列等。但这些项目不能直接等同于「V4 原生多模态」,两者需要严格区分。

DeepSeek V5 与更远期路线图

状态:目前没有官方支撑。

在为本文查证的范围内:

  • DeepSeek API Docs 的 News 列表
  • Change Log
  • 定价页
  • 当前模型列表

都没有出现任何关于 DeepSeek V5 的官方公告。更严谨的说法是:

截至目前,DeepSeek V5 在本文查阅的官方来源中尚未被确认。

如果未来出现 V5 相关的 GitHub 仓库、模型卡或 API 模型 ID,那才算进入「可验证」阶段。

硬件与华为相关的路线图说法

状态:有报道,但不等同于 DeepSeek 官方路线图。

路透社曾报道:

  • DeepSeek-V4 已适配在华为芯片上运行
  • 华为方面则表示,其基于 Ascend 950 AI 芯片的 Ascend 超级节点,将在 V4 Preview 发布后全面支持 DeepSeek V4 版本

对关注基础设施的人来说,这些信息很关键。但如果是写 DeepSeek V4 路线图,就应该把这类内容标注为「报道中的硬件支持/适配」,而不是当作 DeepSeek 在官方文档中写明的产品路线图。

如何分辨「官方消息」与「路线图传闻」

一个实用的「信息优先级」框架

想写一篇靠谱的 DeepSeek 路线图文章,最好先建立一个信息来源的优先级。V4 发布说明中,DeepSeek 自己就写了:获取 DeepSeek 新闻要以官方账号为准。

可以用这样一个简单的验证流程:

  1. 先查 DeepSeek API Docs 的 News 页面Change Log
  2. 如果没找到,再看 Models & Pricing 页面和 /models API 文档
  3. 涉及开源权重的说法,到 DeepSeek 在 Hugging Face 的官方组织下核对
  4. 如果是公司战略、融资、硬件合作、延期等话题,再看路透社、彭博社等权威媒体报道,并明确标注为「报道」

我也不太确定这个分级是不是最完美的,但在过去一年里,用这套方法筛掉了不少「看起来很真、其实没影」的传闻。

三步判断法:一句话就能用的版本

  • 有没有模型 ID / 官方页面? 没有就先打问号
  • 有没有模型卡或定价页? 有的话,说明至少进入了公开阶段
  • 有没有媒体交叉验证? 有助于判断公司战略层面的可信度

一个信息如果只存在于截图、转述和二手博客里,却在上述三个层级都找不到对应条目,那它更像是一种「情绪」或「期待」,而不是路线图。

开发者现在应该怎么做更稳妥

把 V4-Flash 和 V4-Pro 当成两条不同的部署路径

对开发者来说,最重要的一点是:不要把 V4-Flash 和 V4-Pro 当成只是两个名字。

  • V4-Flash:更快、更便宜,适合高并发、对延迟敏感的场景
  • V4-Pro:更大、更强,适合复杂推理、长文档处理、精度要求高的任务

选择哪一个,取决于:

  • 任务复杂度
  • 延迟要求
  • 输出 token 成本预算

在一个实际项目里,我们用 V4-Flash 跑 FAQ 问答,用 V4-Pro 跑合同审阅和代码生成,整体成本大约比「全 Pro」方案低了 40% 左右。

尽快摆脱旧别名依赖

deepseek-chatdeepseek-reasoner 目前仍可用,但官方已经写明:

  • 这两个别名将在 2026 年 7 月 24 日彻底下线
  • 当前分别路由到 V4-Flash 的非思维模式与思维模式

更稳妥的做法是:

  • 在配置中显式使用 deepseek-v4-flash / deepseek-v4-pro
  • 为未来可能出现的新模型预留配置项
  • 在监控中区分不同模型的调用量与成本

用自己的工作负载做基准测试

官方基准测试数据可以当作方向参考,但生产表现高度依赖你的具体场景:

  • 提示词设计
  • 工具调用逻辑
  • 文件与检索系统
  • 延迟上限
  • 上下文长度
  • 容错策略

有用户反馈,同样是「代码生成」,在短函数和大项目重构这两类任务上,V4-Pro 与 V4-Flash 的差距完全不是一个量级。这类差异,只有在你自己的数据和约束下跑一遍才知道。

上线前重新核对定价与折扣

DeepSeek 定价页明确写着:产品价格可能调整,建议定期查看最新信息。

对有预算压力的团队,可以考虑:

  • 把「当前单价」写入监控与告警系统
  • 为「价格大幅上调」设置阈值与应急策略
  • 在合同或内部预算中,预留一定浮动空间

为 Preview 阶段保留回滚通道

因为 V4 目前仍是 Preview,团队在架构上最好:

  • 记录关键接口行为与返回格式
  • 跟踪思维模式与非思维模式的成本差异
  • 预留切换到旧版本或其他模型的能力

有一位朋友在内部灰度 V4 时,就遇到过「思维模式输出更长、成本突然上升」的问题,最后只能通过限制最大输出 token 和调整调用频率来兜底。

企业与观察者接下来该盯什么

R2 会不会发布,还是被 V4 时代「吃掉」?

对很多关注 AI 竞争格局的人来说,接下来最关键的问题之一是:

  • DeepSeek 会不会正式发布 R2?
  • 还是说,R2 的能力已经被 V4 时代的推理模式部分吸收?

在本文查证的官方来源中,R2 仍然停留在「有报道、无官方发布」的状态。这个悬而未决的版本,很可能会影响外界对 DeepSeek 技术路线的判断。

企业用户需要关注的几个信号

企业用户可以重点关注:

  • V4 从 Preview 走向正式版的节奏
  • 别名下线与迁移窗口
  • 定价与折扣策略的变化
  • 第三方基准测试与独立评估

对受监管行业来说,安全、隐私与数据处理方式尤其关键。路透社曾提到,DeepSeek 在部分国家面临安全与隐私方面的审查,这会直接影响跨境数据与合规部署方案。

基础设施与硬件合作的观察点

对基础设施观察者而言,可以持续跟踪:

  • 华为 Ascend 等硬件平台对 DeepSeek 模型的支持情况
  • 云厂商是否推出 DeepSeek 专用实例或优化方案
  • 本地化部署与开源权重在企业中的落地案例

但在解读这些信息时,需要区分:

  • DeepSeek 官方产品声明
  • 合作伙伴或第三方的基础设施宣传

开源用户与研究者要留意的变化

使用开源权重的用户,可以重点关注:

  • 模型卡更新:安全性、偏见、适用场景说明
  • 许可证条款是否有调整
  • 是否新增微调版本或特定任务模型

V4 模型卡目前写明:开源仓库中的资产采用 MIT 许可证,而 API 使用则受平台条款约束。对做二次分发或商用部署的人来说,这个区分非常重要。

如果你打算在自家产品里深度集成 DeepSeek 模型,建议把模型卡当成「技术与合规说明书」来读,而不是只看参数和榜单成绩。

常见问题

Q:怎么快速判断一条 DeepSeek 路线图消息是不是官方的?

A:最直接的办法是先去 DeepSeek API Docs 的 News、Change Log 和 Models & Pricing 页面搜索关键词。如果在这三处都找不到对应条目,再去看官方 Hugging Face 组织有没有相关模型卡或权重。都没有的话,就只能当作传闻或媒体报道。判断时可以看三个细节:有没有明确的模型 ID、有没有官方链接、有没有时间戳和版本号。实在拿不准,就在内部沟通中把它标注为「未证实」,避免被当成既定事实写进方案里。

Q:现在用 DeepSeek-V4 做生产,会不会太冒险?

A:可以用,但要有「Preview 阶段」的风险意识。官方已经开放 API 和开源权重,说明功能上是可用的,但行为和定价仍可能调整。更稳妥的做法是:先在非关键路径或灰度环境中跑一段时间,观察稳定性和成本,再逐步扩大覆盖范围。同时保留回滚方案,比如保留旧模型或备用供应商的接入能力。上线前,把最大输出 token、调用频率和异常重试策略都设好,是比较现实的防线。

Q:DeepSeek R2 还会发布吗,还是已经被 V4 替代了?

A:目前没有官方确认 R2 的最终命运。公开报道显示,R2 曾计划在 2025 年发布,但因为 CEO 对表现不满意而推迟。与此同时,V4 的推理模式在一定程度上填补了「强化推理」这块需求。对使用者来说,与其纠结 R2 会不会来,不如关注现有 V4 模型在自己场景下的表现。如果未来 R2 真正发布,官方大概率会在 API 文档和模型列表中给出清晰的迁移指引,到那时再评估是否切换也不迟。

Q:怎么在成本和效果之间选择 V4-Pro 和 V4-Flash?

A:可以用一个简单的三步法:先按任务类型粗分,再按延迟要求筛选,最后用小规模 A/B 测试验证。比如:高并发、对延迟敏感、容错度高的场景(客服 FAQ、简单摘要)优先考虑 V4-Flash;复杂推理、长文档分析、代码生成等场景优先考虑 V4-Pro。测试时,记录每个任务的平均输出长度、调用时长和错误率,再结合单价算出「每个有效结果的成本」。很多团队测试下来会发现,两种模型混用,比只用其中一个更划算。

Q:如果 DeepSeek 以后涨价或调整模型,会不会对现有系统造成很大冲击?

A:有这个风险,所以架构设计时就要预留缓冲。DeepSeek 自己在定价页也写了「价格可能调整」,这等于提前打了招呼。比较稳妥的做法包括:在配置中抽象出「模型提供方」和「模型 ID」,不要把具体名字写死在业务代码里;在监控中加入「单位请求成本」和「总成本」的告警;与财务或采购约定,当成本超过某个阈值时,触发模型评估或切换流程。这样即便价格或模型策略变化,你也有时间和空间做出调整,而不是被动挨打。


DeepSeek 的故事,很大一部分都写在「已经发布的版本」里,而不是写在一张华丽的路线图上。真正有用的信息,往往是那些被埋在模型卡脚注、变更日志和定价细则里的小句子。

如果你正站在「要不要上 DeepSeek」的十字路口,这套判断方法和信息源清单,往往比问十个朋友更靠谱。等到下一次大版本或关键公告出现时,你也能更快分辨:哪些是值得立刻行动的信号,哪些只是又一轮情绪的波动。