全面回击谷歌!OpenAI正式推出专业知识工作大模型GPT-5.2


当地时间12月11日,OpenAI正式发布其最新模型GPT-5.2,这是在谷歌Gemini 3强势挑战下的一次全面回击。新模型GPT-5.2聚焦专业工作场景优化,在编程、科学任务、长文档处理等核心能力上实现显著提升。OpenAI表示,GPT-5.2是迄今为止在“专业知识工作方面”表现最好的模型,速度更快、信息检索更精准,在写作与翻译方面也有显著改善。

GPT‑5.2包含Instant、Thinking、Pro三个版本,即日起将面向ChatGPT付费用户陆续推出。GPT‑5.2定价为1.75美元/百万输入tokens和14美元/百万输出tokens。

GPT-5.2的核心优势体现在专业化任务的精准优化上。根据OpenAI官方数据,新模型在多项基准测试中刷新纪录。在评估44个职业知识型任务的GDPval测试中,该模型成为首个总体表现达到或超过人类专家水平的AI模型,70.9%的任务表现与行业专家持平或胜出,且完成速度是人类专家的11倍以上,综合成本不足专家的1%。

在长文本处理与视觉理解两大关键能力上。OpenAI MRCRv2基准测试显示,GPT-5.2在25.6万token的超长上下文范围内,针对多文档信息整合任务的准确率接近100%,尤其在需要区分多个相似信息点的测试中表现优异,特别适合深度文档分析与多源信息整合。

视觉处理方面,GPT-5.2 Thinking被官方称为 “当前最强视觉模型”,图表推理与软件界面理解的错误率较前代降低约50%,能够精准解读数据仪表盘、技术图纸、可视化报告等专业视觉内容,适配金融运营、工程设计、客户服务等以视觉信息为核心的工作场景。

相较于GPT-5.1,新模型的 “幻觉率” 显著降低,在专业知识密集型场景中可信度大幅提升。即使将推理强度设置为最低档,GPT-5.2的综合表现仍显著优于GPT-5.1和GPT-4.1。

OpenAI此次推出GPT-5.2,以专业知识工作为切入点,希望吸引更多企业客户并提升营收,以支撑其未来数十年超过1万亿美元的基础设施投资计划。

今年8月,OpenAI推出备受期待的GPT-5,因图表乌龙、专业知识短板及功能优化不及预期遭质疑,11月紧急迭代的GPT-5.1虽有小幅改进,仍未扭转局面。随后谷歌在11月推出了Gemini 3大模型,凭借多模态、长文本处理等优势强势突围。

面对来自谷歌的竞争,OpenAI CEO山姆・奥特曼回应称 “Gemini 3影响低于预期”,并透露公司当前的 “红色警戒模式” 将于明年1月前结束,届时将集中资源优化核心能力,以强势姿态回归市场。

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->
            <!-- 非定向300*250按钮  end -->
        </div>



Source link

未经允许不得转载:紫竹林-程序员中文网 » 全面回击谷歌!OpenAI正式推出专业知识工作大模型GPT-5.2

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的