全面回击谷歌！OpenAI正式推出专业知识工作大模型GPT-5.2

当地时间12月11日，OpenAI正式发布其最新模型GPT-5.2，这是在谷歌Gemini 3强势挑战下的一次全面回击。新模型GPT-5.2聚焦专业工作场景优化，在编程、科学任务、长文档处理等核心能力上实现显著提升。OpenAI表示，GPT-5.2是迄今为止在“专业知识工作方面”表现最好的模型，速度更快、信息检索更精准，在写作与翻译方面也有显著改善。

GPT‑5.2包含Instant、Thinking、Pro三个版本，即日起将面向ChatGPT付费用户陆续推出。GPT‑5.2定价为1.75美元/百万输入tokens和14美元/百万输出tokens。

GPT-5.2的核心优势体现在专业化任务的精准优化上。根据OpenAI官方数据，新模型在多项基准测试中刷新纪录。在评估44个职业知识型任务的GDPval测试中，该模型成为首个总体表现达到或超过人类专家水平的AI模型，70.9%的任务表现与行业专家持平或胜出，且完成速度是人类专家的11倍以上，综合成本不足专家的1%。

在长文本处理与视觉理解两大关键能力上。OpenAI MRCRv2基准测试显示，GPT-5.2在25.6万token的超长上下文范围内，针对多文档信息整合任务的准确率接近100%，尤其在需要区分多个相似信息点的测试中表现优异，特别适合深度文档分析与多源信息整合。

视觉处理方面，GPT-5.2 Thinking被官方称为 “当前最强视觉模型”，图表推理与软件界面理解的错误率较前代降低约50%，能够精准解读数据仪表盘、技术图纸、可视化报告等专业视觉内容，适配金融运营、工程设计、客户服务等以视觉信息为核心的工作场景。

相较于GPT-5.1，新模型的 “幻觉率” 显著降低，在专业知识密集型场景中可信度大幅提升。即使将推理强度设置为最低档，GPT-5.2的综合表现仍显著优于GPT-5.1和GPT-4.1。

OpenAI此次推出GPT-5.2，以专业知识工作为切入点，希望吸引更多企业客户并提升营收，以支撑其未来数十年超过1万亿美元的基础设施投资计划。

今年8月，OpenAI推出备受期待的GPT-5，因图表乌龙、专业知识短板及功能优化不及预期遭质疑，11月紧急迭代的GPT-5.1虽有小幅改进，仍未扭转局面。随后谷歌在11月推出了Gemini 3大模型，凭借多模态、长文本处理等优势强势突围。

面对来自谷歌的竞争，OpenAI CEO山姆・奥特曼回应称 “Gemini 3影响低于预期”，并透露公司当前的 “红色警戒模式” 将于明年1月前结束，届时将集中资源优化核心能力，以强势姿态回归市场。

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->

            <!-- 非定向300*250按钮  end -->
        </div>

Source link

相关推荐

近期文章