SCALE | 2025 年 11 月《大模型 SQL 能力排行榜》发布


                                                                                                                                                <p><img alt="" height="383" src="https://oscimg.oschina.net/oscnet/up-187a65b44cb1f5a70467982225682e3a65f.webp" width="896"></p> 

一、摘要与核心看点

本期  SCALE [1]  评测聚焦于新一代专业级大语言模型在数据库 SQL 领域的表现边界。

发版核心内容为  Gemini 3 Pro [2]  和  DeepSeek-V3.2-Exp [3]  两大顶尖模型的首次《深度测评报告》,旨在为用户提供最前沿、最可靠的技术选型依据。

核心看点速览:

  1. 可靠性新标杆 Gemini 3 Pro  模型首次参评,在「 SQL 理解 」能力维度以  86.0  的高分领跑榜单,确立了其在复杂逻辑解析上的业内领先地位。

  2. 国产化潜力股 DeepSeek-V3.2-Exp  模型首次入榜,其在 「 国产数据库转换 」方面表现出强劲潜力( 92.1 ),为国产化替代场景提供了新的高性能选择。

二、评测目的与方法论

本次测评旨在系统性评估两大模型在企业级复杂数据库场景下的实用性。我们严格遵循 SCALE 框架自创立以来的三大核心维度和统一评测数据集,确保结果的公正性与可复现性。

评测维度

评估目标

核心应用场景

SQL 理解

对现有 SQL 代码的逻辑、意图和执行计划的深度分析能力。

数据分析、生产环境故障排查、代码审查。

SQL 优化

在保证逻辑等价下,将低效 SQL 改写为性能更优查询的策略应用和效果。

数据库性能调优、存量代码重构。

方言转换

在不同数据库方言之间进行语法迁移和复杂过程化逻辑重构的准确性和可靠性。

数据库迁移、跨平台数据中台构建。

三、Gemini 3 Pro 深度评测报告

Gemini 3 Pro 是谷歌于 2025 年 11 月 18 日推出的新一代大型语言模型。它具备卓越的推理、多模态理解与代码生成能力,在多项基准测试中领先。该模型在发布当日即整合至谷歌搜索、Gemini 应用等核心产品,旨在为用户和开发者提供更智能、直接的服务。

 

3.1 核心结论速览

Gemini 3 Pro  的能力分布呈现出  深度理解、高质优化、均衡转换  的显著特征。其「 SQL 理解 」能力取得榜单首位( 86.0 分 ),优化后 SQL 语法正确性达  100 分 ,是面向企业级、高可靠性要求的数据库任务的理想 AI 助手。

3.2 维度详细表现与数据洞察

SQL 理解

  • 维度总分:86

    • 执行准确性:90.0

    • 执行计划检测:64.3

    • 语法及最佳实践:87.1

  • 关键优势 执行准确性领先(90.0) ,逻辑保真度高,是处理复杂业务逻辑的首选。

  • 待改进点 执行计划检测得分相对较低(64.3) ,对写操作执行计划的理解偏差,结构化输出规范性不足。

未经允许不得转载:紫竹林-程序员中文网 » SCALE | 2025 年 11 月《大模型 SQL 能力排行榜》发布

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的