网易有道“子曰 4”多模态模型、语音合成模型全量开源


IT之家 5 月 22 日消息,网易有道今日宣布,决定将“子曰”大模型 4.0 的核心双引擎 ——“多模态模型”与“语音合成(TTS)模型”,正式面向全球全量开源。开发者可以免费下载、部署,并基于此进行二次开发。

此次开源的“子曰 4”多模态模型(27B 参数规模)面向教育场景,支持视觉输入的数理能力,做到了行业顶尖水平(SOTA)。

此外,新模型采用了精细化思维链重构方案。通过汇聚大规模优质、精简的推理样本进行深度优化,把思维链输出长度压缩了 43.2%。这意味着:回答同样的问题,它输出的 Token 更少、推理路径更短、出答案更快

对于做实际业务的开发者和企业来说,直接效果就是:推理成本 下降

此外,网易有道团队还针对国内学生真实的作业、考试和提问场景进行了深度优化,让它能够解决真实学习中遇到的复杂痛点。

而开源的语音合成(TTS)模型支持跨语种音色情感迁移克隆,只要上传一段中文音频,就能克隆说话人的音色,并流利说出英语、韩语、越南语…… 不带“中式口音”。而且情感也能精准迁移克隆 —— 只要生气地说一句话,合成出来的外语也是生气的语气。

]article_adlist–>

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->
            <!-- 非定向300*250按钮  end -->
        </div>



Source link

未经允许不得转载:紫竹林-程序员中文网 » 网易有道“子曰 4”多模态模型、语音合成模型全量开源
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的