阿里千问成新加坡国家AI项目技术底座：预训练阶段即涵盖119语言

11 月 27 日消息，据阿里云官方公众号，新加坡国家人工智能计划近日发布了一款名为 Qwen-SEA-LION-v4 的东南亚多语言大模型。该模型的核心技术底座基于阿里巴巴的“通义千问”开源模型构建。

IT之家从官方介绍获悉，这款由中新合作打造的模型迅速在“东南亚语言模型全面评估基准”（SEA-HELM）的开源模型榜单（参数量 2000 亿以下）中登顶。

东南亚地区拥有超过 1200 种语言，日常交流中普遍存在多种语言混用等复杂情况，而全球主流的 AI 模型大多以英语为中心，难以有效服务本地市场，形成了巨大的“AI 鸿沟”。此次合作旨在解决这一长期困扰当地 AI 发展的难题。目前，Qwen-SEA-LION-v4 模型已通过 AISingapore 官网和 HuggingFace 开源社区向全球免费提供下载。

Qwen3 模型在预训练阶段就已涵盖 119 种语言，为理解东南亚小语种打下基础。通义千问团队还在后训练中增加了跨语言训练任务的比重，以更好地处理现实世界中的多语言混合输入。

【来源：IT之家】

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->

            <!-- 非定向300*250按钮  end -->
        </div>

Source link

相关推荐

近期文章