阿里千问成新加坡国家AI项目技术底座:预训练阶段即涵盖119语言


11 月 27 日消息,据阿里云官方公众号,新加坡国家人工智能计划近日发布了一款名为 Qwen-SEA-LION-v4 的东南亚多语言大模型。该模型的核心技术底座基于阿里巴巴的“通义千问”开源模型构建。

IT之家从官方介绍获悉,这款由中新合作打造的模型迅速在“东南亚语言模型全面评估基准”(SEA-HELM)的开源模型榜单(参数量 2000 亿以下)中登顶。

东南亚地区拥有超过 1200 种语言,日常交流中普遍存在多种语言混用等复杂情况,而全球主流的 AI 模型大多以英语为中心,难以有效服务本地市场,形成了巨大的“AI 鸿沟”。此次合作旨在解决这一长期困扰当地 AI 发展的难题。目前,Qwen-SEA-LION-v4 模型已通过 AISingapore 官网和 HuggingFace 开源社区向全球免费提供下载。

Qwen3 模型在预训练阶段就已涵盖 119 种语言,为理解东南亚小语种打下基础。通义千问团队还在后训练中增加了跨语言训练任务的比重,以更好地处理现实世界中的多语言混合输入。

【来源:IT之家

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->
            <!-- 非定向300*250按钮  end -->
        </div>



Source link

未经允许不得转载:紫竹林-程序员中文网 » 阿里千问成新加坡国家AI项目技术底座:预训练阶段即涵盖119语言

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的