梁文锋内部透露:DeepSeek V4将于4月下旬发布


                <!-- 相关专题top end-->
                            <!-- 期货推广begin -->

        <!-- 期货推广end -->

        <!-- 秒拍begin -->

        <!-- 秒拍end -->

        <!-- 视频播放器start -->

        <!-- 视频播放器end -->

        <!-- 行情图begin -->

        <!-- 行情图end -->

                <blockquote><p>  炒股就看<a href="https://finance.sina.com.cn/stock/reportch/jinqilin.shtml" target="_blank">金麒麟分析师研报</a>,权威,专业,及时,全面,助您挖掘潜力主题机会!</p></blockquote>      <div class="img_wrapper"><img id="0" src="https://n.sinaimg.cn/finance/crawl/443/w550h693/20260410/d29e-87dcd9adefd2b0b03504db7742c914dd.png" alt=""></div>

  作者 | 张弛

  来源 | 创智记

  在历经数次“跳票”传闻后,备受关注的DeepSeek V4即将登场。

  据《创智记》从多位知情人士处获悉,DeepSeek创始人梁文锋近日在内部沟通中透露,DeepSeek新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。

  此前有相关消息显示,DeepSeek V4不仅将带来万亿参数规模和百万级上下文窗口,更首次实现与华为昇腾等国产芯片的深度适配,标志着中国AI产业在“去CUDA化”道路上迈出关键一步。

  值得关注的是,3月29日晚,DeepSeek经历了整整13小时服务中断。当时官方仅称“服务器故障”,但多位开发者在恢复后发现,模型输出逻辑发生显著变化:编码结构更清晰,逻辑严谨度飞跃式提升,SVG图形生成能力明显增强。

  业内普遍猜测,这次“停摆”实为V4的灰度测试或全量部署。

  据悉,V4将以Apache 2.0协议开源,企业可自主部署。据最新外媒报道,为迎接V4发布,阿里巴巴、字节跳动、腾讯等国内科技巨头已预订数十万片新一代AI算力芯片,计划通过云服务提供DeepSeek新模型,并将其集成到自身AI产品中。受此影响,新AI芯片产品近期价格已上涨约 20%。

  此前,DeepSeek发布时间已多次延期。原计划于 2 月中旬春节前后推出大参数版本,后因国产算力深度适配、架构重构与稳定性打磨等原因推迟。

  从量化投资跨界AI的梁文锋,正在经历属于他的“蜕变”。

  《晚点》报道,过去一年,DeepSeek团队虽有核心骨干离职(包括R1核心作者郭达雅等),但“有人离开,更多人留下”,团队并未成建制流失。

  2025年下半年以来,梁文锋开始更多提及产品化和商业化,组建产品团队,招聘Agent方向“模型策略产品经理”,并从纯模型研发向应用层延伸。同时,他正在为公司进行估值,以明确员工期权价值,给予团队更确定的预期。

  面对豆包、千问、智谱、Kimi、MiniMax等对手的强力竞争,迟到数月的V4承载着巨大的期待压力——梁文锋能否再次打造全世界最出色的开源大模型?

  据了解,V4最大的技术亮点在于LTM(Long Term Memory,长期记忆)能力的突破。

  但多位和DeepSeek深入接触合作的AI创业者告诉《创智记》,业界不应抱太高期待,V4很难再复制去年DeepSeek-V3的影响力。

  除了DeepSeek V4,混元 3.0 大模型也将于4月正式发布。这是腾讯自 2025 年下半年完成团队架构重组、姚顺雨出任首席 AI 科学家后,推出的首个重磅大模型产品。

未经允许不得转载:紫竹林-程序员中文网 » 梁文锋内部透露:DeepSeek V4将于4月下旬发布
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的