
受限于高端算力,目前DeepSeek-V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调
文|《财经》研究员 吴俊宇 周源
]article_adlist–>
时隔 145 天, DeepSeek 终于发布了新模型。
4 月 24 日, DeepSeek 宣布上线 DeepSeek-V4 的预览版本——其中包括两款模型,高性能版的 DeepSeek-V4-Pro 、轻量版的 DeepSeek-V4-Flash 。
按照 DeepSeek 官方披露的信息, DeepSeek-V4 拥有百万字超长上下文,在 Agent (智能体)能力、世界知识和推理性能上均在国内和开源领域保持领先。
DeepSeek 还披露,目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding (智能体编程)模型,评测反馈使用体验优于 Claude Sonnet 4.5 ,交付质量接近 Claude Opus 4.6 非思考模式,但仍与 Claude Opus 4.6 的思考模式存在一定差距。

和全球最强模型的差距只有两个月
目前 Anthropic 旗下最先进的基础模型是 4 月 16 日发布的 Claude Opus 4.7 ,它的综合性能几乎位居全球第一。 Claude Opus 4.6 于 2 月 25 日发布。
也就是说, DeepSeek-V4 和全球性能最先进的模型性能差距几乎只有两 个月左右。
DeepSeek 发布模型的频率在主流模型厂商中几乎是最低的,时隔近五个月,它才发布了这款新模型。
据《财经》不完全统计, 2025 年 12 月 1 日 -2026 年 4 月 24 日,美国市场( OpenAI 、 Anthropic 、谷歌 Gemini )和中国(包括阿里千问、字节跳动豆包、腾讯混元、小米 MiMo 、 DeepSeek 、月之暗面、智谱、 MiniMax )的 11 家主流模型公司,在 144 天内至少发布或迭代了 53 款模型, 几乎每 2.7 天就会有一款模型发布或迭代。

DeepSeek-V4 的技术报告披露,它使用了 32 万亿以上的 Tokens (词元)进行训练。它的训练过程经历了三个阶段——预训练( Pre-training )、后训练( Post-training )、推理能力强化( Reasoning scaling )。
其中 DeepSeek-V4-Pro 的参数规模是 1.6 万亿,激活参数是 490 亿。 DeepSeek-V4-Flash 的参数规模是 2840 亿,激活参数是 130 亿。 由于架构创新且不是全量激活, DeepSeek-V4 每次激活时的推理计算成本只相当于百亿级参数规模的模型。
DeepSeek 还公布了 DeepSeek-V4 两个版本模型的价格。其中高性能版的 DeepSeek-V4-Pro 输入价格 1 元 / 百万 Tokens ,输出价格 24 元 / 百万 Tokens 。轻量版的 DeepSeek-V4-Flash 输入价格 0.2 元 / 百万 Tokens ,输出价格 2 元 / 百万 Tokens 。

明确支持华为昇腾 950 , Token 价格将大幅下降
市场关注的另一个问题是, DeepSeek-V4 是否会提前适配华为昇腾 950 等国产 AI(人工智能) 芯片,甚至是否会基于国产 AI 芯片完成训练。
目前可以确认的是, DeepSeek-V4 一定会支持华为昇腾 950 ,并使用昇腾 950 进行推理。但它不一定是基于华为昇腾 950 训练的。
因为, DeepSeek 在披露价格的同时,还在价格栏的小字中明确提到——受限于高端算力,目前 DeepSeek-V4-Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后, Pro 的价格会大幅下调。

DeepSeek 微信公众号)
也就是说, DeepSeek-V4 系列的模型明确支持华为昇腾 950 这款国 AI 产芯片,且预计将在国产 AI 芯片上大幅降低单位 Token 价格。
昇腾 950 华为规划于 2026 年推出,面向大模型训练和推理的新一代 AI 芯片,它是昇腾 910 系列的升级版。国际市场调研机构IDC 2026年4月数据显示,华为昇腾2025年在国产AI芯片中,出货量是最大的。市场普遍预计,昇腾950系列2026年也将成为中国市场出货量最大的国产AI芯片。一位华为计算产品合作伙伴今年 3 月曾向《财经》评价,在当前国产 AI 推理卡中,华为昇腾 950 极具竞争力。因为该卡采用全新架构,是目前国内唯一已商用、并明确支持 FP4 低精度推理的 AI 加速卡。
支持 FP4 意味着能把模型“压缩得更狠”,同样一张卡,能跑得动更大、更复杂的 AI 模型,而且速度更快、成本更低。《财经》了解到,华为昇腾 950 的单卡算力是英伟达 H20 的 2.87 倍,且搭载了华为自研国产 HBM (高带宽内存)芯片。
一位算法工程师对《财经》表示, DeepSeek-V4 适配国产 AI 芯片在预期之内。因为模型推理对国产 AI 芯片来说并不是难点。几乎所有中国模型公司发布新模型后,都会 Day0 适配包括华为昇腾、阿里平头哥、百度昆仑芯、寒武纪等国产 AI 芯片。






]article_adlist–>
<!-- 非定向300*250按钮 17/09 wenjing begin -->
<!-- 非定向300*250按钮 end -->
</div>