我国在通用人工智能逻辑推理领域实现重大跨越


我国科研团队开发出全球首个同时具备自主出题(Proposing)和自动解题(Solving)双重能力的通用人工智能系统——“通矩模型”(TongGeometry)。相关成果“基于引导树搜索的奥数几何问题提出与解答系统”(Proposing and solving olympiad geometry with guided tree search)1月26日发表于《自然·机器智能》(Nature Machine Intelligence)。

奥林匹克数学竞赛被视为人工智能逻辑推理能力的“试金石”。2024年初,DeepMind开发的AlphaGeometry曾引起全球轰动,展示了AI在解题方面的巨大潜力。然而,AlphaGeometry本质上是一个“被动解题者”,其训练极度依赖于大规模的合成数据和昂贵的计算资源。与之相比,我国科研团队自主研发的TongGeometry则展现出了更高维度的智能:它不仅是一个能够满分交卷的“优等生”,更是一位能够创造优美、新颖题目的“出题名师”。

论文第一作者、北京通用人工智能研究院张驰博士介绍:“我们在研究中发现了一个深刻的对偶性:当一个几何命题的证明难度显著高于其构建复杂度时,它便具备了作为奥赛题目的‘审美价值’。通过这种对偶关系的建模,TongGeometry能够从浩如烟海的空间组合中,精准捕捉到那些具备人类数学家审美标准的高质量题目。这在国际上首次实现了从‘模仿解题’到‘自主创造’的范式转变。”

在性能表现上,TongGeometry展现了极高的国产原创技术优越性。相比AlphaGeometry需要庞大的算力集群,TongGeometry仅需单张消费级显卡(如RTX 4090)即可在最多38分钟内,解决近25年所有的奥数几何难题,其推理效率和准确率均达到世界顶尖水平。此外,该系统通过创新的“规范化表示”技术,将搜索空间压缩了几个数量级,有效解决了传统方法中的路径爆炸问题。

论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示,TongGeometry的意义不仅在于解题速度的提升,更在于它通过模拟人类数学家的直觉和审美,实现了“小数据、大任务”的范式转化。这种不依赖海量标注数据、通过内部逻辑自我演化的路径,正是通用人工智能(AGI)发展的关键。“我们的系统不仅能与国际最先进的AI系统对标,更在理解逻辑底层美学和自主发现科学规律方面走在了前列。”他说。

目前,TongGeometry的原创能力已得到专业学术界和竞赛圈的认可。系统自主生成的3道几何新题,已正式入选2024年全国中学生数学联赛(北京赛区)及美国精英奥赛(Ersatz Math Olympiad),这是AI原创题目首次进入高规格人类数学竞赛。

这一成果标志着中国科研团队在自动化推理的逻辑核心领域实现关键技术自研,并在性能与功能多样性上全面超越了以DeepMind为代表的国际顶尖水平。该科研团队由北京通用人工智能研究院(BIGAI)、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院,以及北京大学武汉人工智能研究院联合组成,未来将继续深耕“通系列”通用智能模型,推动中国人工智能技术在更多复杂逻辑与科学发现领域实现领跑。

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->
            <!-- 非定向300*250按钮  end -->
        </div>



Source link

未经允许不得转载:紫竹林-程序员中文网 » 我国在通用人工智能逻辑推理领域实现重大跨越

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的