DeepSeek-V3.2-Exp 发布,训练推理提效,API成本降50%以上


                <!-- 相关专题top end-->
                            <!-- 期货推广begin -->

        <!-- 期货推广end -->

        <!-- 秒拍begin -->

        <!-- 秒拍end -->

        <!-- 视频播放器start -->

        <!-- 视频播放器end -->

        <!-- 行情图begin -->

        <!-- 行情图end -->

<p>  新浪科技讯 9月29日晚间消息,DeepSeek发布DeepSeek-V3.2-Exp模型。据悉,这是一个实验性(Experimental)的版本,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。</p>

  目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭开源。

  在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。(文猛)



Source link

未经允许不得转载:紫竹林-程序员中文网 » DeepSeek-V3.2-Exp 发布,训练推理提效,API成本降50%以上

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的