启明星 | 智谱GLM-5开源:从代码到工程,Agentic Engineering时代最好的开源模型


今日,启明创投投资企业智谱上线并开源GLM-5。

学界与业界正逐渐形成一种共识,大模型从写代码、写前端,进化到写工程、完成大任务,即从“Vibe Coding”变革为“Agentic Engineering”。

GLM-5 正是这一变革的产物:在Coding与Agent能力上,取得开源SOTA表现,在真实编程 场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程Agent任务。

在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源第一。

01/

更大基座,更强智能

GLM-5 全新基座为从“写代码”到“写工程”的能力演进提供了坚实基础:

  • 参数规模扩展:从 355B(激活 32B)扩展至 744B(激活 40B),预训练数据从23T提升至28.5T,更大规模的预训练算力显著提升了模型的通用智能水平。

  • 异步强化学习 构建全新的“Slime”框架,支持更大模型规模及更复杂的强化学习任务,提升强化学习后训练流程效率;提出异步智能体强化学习算法,使模型能够持续从长程交互中学习,充分激发预训练模型的潜力。

  • 稀疏注意力机制 首次集成DeepSeek Sparse Attention,在维持长文本效果无损的同时,大幅降低模型部署成本,提升Token Efficiency。

02/

Coding能力:对齐Claude Opus 4.5

GLM-5在编程能力上实现了对Claude Opus 4.5的对齐,在业内公认的主流基准测试中取得开源模型SOTA分数。在SWE-bench-VerifiedTerminal Bench 2.0中分别获得77.8和 56.2的开源模型SOTA分数,性能超过Gemini 3 Pro。

2026年,大模型需要从“会写”走到“会完成”,尤其是端到端完成大型任务。GLM-5是一个“系统架构师”,它不仅为开发精美的Demo而生,更为稳定交付生产结果而生。

在内部Claude Code评估集合中,GLM-5在前端、后端、长程任务等编程开发任务上显著超越GLM-4.7(平均增幅超过 20%),能够以极少的人工干预自主完成Agentic长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近Opus 4.5。

03/

Agent能力:SOTA级长程任务执行

GLM-5在Agent能力上实现开源SOTA,在多个评测基准中取得开源第一:在BrowseComp(联网检索与信息理解)、MCP-Atlas(工具调用和多步骤任务执行)和 τ²-Bench(复杂多工具场景下的规划和执行)均取得最佳表现。

在衡量模型经营能力的 Vending Bench 2 中,GLM-5获得开源模型第一的表现。Vending Bench 2要求模型在一年期内经营一个模拟的自动售货机业务,GLM-5最终账户余额达到4432美元,经营表现接近Claude Opus 4.5,展现了出色的长期规划和资源管理能力。

这些能力是Agentic Engineering的核心:模型不仅要能写代码、完成工程,还要能在长程任务中保持目标一致性、进行资源管理、处理多步骤依赖关系, 为真正的 Agentic Ready基座模型。

04/

国产芯片支持线上推理集群

GLM系列模型受到全球开发者喜爱,在GLM Coding Plan全球爆量后,智谱不得不启动限售活动。本次GLM-5的上线依托众多国产芯片有力保障了线上服务的稳定和高效。

目前,GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配。通过底层算子优化与硬件加速,GLM-5在国产芯片集群上已经实现高吞吐、低延迟的稳定运行。

05/

Agentic Engineering典型场景

场景一:端到端应用开发

在OpenRouter匿名(Pony)上线后,许多开发者使用GLM-5完成了真正能用、能玩、能上线的应用。

开发者们用GLM-5制作出了横版解谜游戏、Agent交互世界、论文版“抖音”等应用,这些应用已开放下载,或已提交商店审核,详情可关注GLM-5案例库 showcase.z.ai 。这些案例展示了GLM-5在复杂系统工程中端到端交付可部署产品的能力。

场景二:通用 Agent 助手

GLM-5较强的Agentic工具调用能力,使其成为通用Agent助手的理想基座模型。

在OpenClaw中接入GLM-5,用户可以拥有一个智能的实习生,帮你搜索网 站、定时整理资讯、发布推文、编程等。智谱推出了AutoGLM版本的OpenClaw,支持官网一键完成OpenClaw与飞书机器人的一体化配置,帮助用户从数小时缩短到几分钟,极速部署专属7×24小时智能助手。

场景三:Z Code全流程编程

当GLM-5进化到能跑完整个闭环,编程工具也需要以此为核心重构。为此,智谱推出Z Code。用户只需把需求说清楚,模型会自动拆解任务,多智能体并发完成代码、跑命令、调试、预览和提交等开发全流程。

在Z Code上,用户甚至可以用手机远程指挥桌面端Agent,解决以往需要很久的工程任务。

值得一提的是,Z Code也是全程由GLM模型参与开发完成。

场景四:办公文档直接输出

GLM-5拥有更强大的复杂系统工程和长程智能体能力,可将文本或素材直接转换为.docx、.pdf和.xlsx文件。

在Z.ai和智谱清言上,用户可以让GLM-5直接输出产品需求文档、教案、试卷、电子表格、财务报告、流程表、菜单等文档。

06/

开源与使用方式

即日起,GLM-5在Hugging Face与ModelScope平台同步开源, 模型权重遵循MIT License。

GLM-5已经纳入Max用户套餐,Pro将尽快在5天内支持,接下来智谱将逐步扩大范围,尽力让更多用户体验并使用GLM-5。GLM Coding Plan支持Claude Code、OpenCode等主流开发工具。

GLM Coding Plan同步升级Agentic Engineering体验:

  • 官方适配OpenClaw 仅需简单几步即可完成配置,快速开启 Agent 工作流;

  • Pro / Max用户限量赠送AutoGLM-OpenClaw

    支持将云端个人AI助手接入飞书,实现办公场景的长任务执行;

  • 新增GLM in Excel权益:

    原生适配Excel环境的AI插件,支持在侧边栏以自然语言交互,深度赋能数据处理与表格工作流( Beta期仅Max用户可享套餐抵扣)

1. 官方API接入

  • BigModel开放平台: https://docs.bigmodel.cn/cn/guide/models/text/glm-5

  • Z.ai: https://docs.z.ai/guides/llm/glm-5

  • OpenClaw接入文档: https://docs.bigmodel.cn/cn/coding-plan/tool/openclaw

2.在线体验

  • Z.ai: https://chat.z.ai

  • 智谱清言APP/网页版: https://chatglm.cn

3.开源链接

  • GitHub: https://github.com/zai-org/GLM-5

  • Hugging Face:https://huggingface.co/zai-org/GLM-5

  • ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5

4.Agent

  • AutoGLM: https://autoglm.zhipuai.cn/?channel=AutoGLM_OpenClaw&redeem_modal_open=1

  • Z Code: https://zcode.z.ai/cn

5.Blog

  • https://z.ai/blog/glm-5

]article_adlist–>

(转自:启明创投)

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->
            <!-- 非定向300*250按钮  end -->
        </div>



Source link

未经允许不得转载:紫竹林-程序员中文网 » 启明星 | 智谱GLM-5开源:从代码到工程,Agentic Engineering时代最好的开源模型

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的