从 Workflow 到 Agent:构建自己的自主智能体


                                                                                                                                                <p>“自主智能体”正从论文热词变成真实生产力,相较于传统 Workflow 只能按图索骥,自主智能体把方向盘直接交给大模型,让它在动态、开放、甚至不可收敛的问题里自由驰骋。</p> 

可一旦落地,排队时间长、环境隔离难、幻觉失控、工具对接碎片化……每一道都是现实的高墙。

网易 CodeWave 技术负责人姜天意和其团队正在探索从如何让自主智能能通过各种技术达成最佳实践。

本周六,姜天意也将出席【Al Agent:从工具助手到自主行动】OSC 源创会・杭州站活动,并发表《从 Workflow 到 Agent:构建自己的自主智能体》主题演讲,从网易自研自主智能体平台 CoreAgent 出发,讲解如何通过自主 Agent,MCP 协议,运行沙箱,长短记忆管理等技术构建一个自主智能体产品。

即刻报名: https://www.oschina.net/event/8597955

问:“自主智能体”这个概念近来非常火爆,在您看来,“自主智能体”区别于传统“Workflow 自动化”最核心的、革命性的特质是什么?它带来了哪些之前难以实现的场景可能性?

答:Workflow 则是按照预设去完成标准化、重复性的任务,是很死板的,完全依赖预设的流程。自主智能体主要是交给大模型自主完成复杂,动态的目标,解决个性化,不收敛的问题。所以你像编程方面的 Code Agent,科研方面的 DeepResearch,甚至说你在日常遇到的比如旅游路线推荐,帮我分析下 Excel 做总结等,均是 WorkFlow 智能体非常难以实现的。

 

问:网易自研的 CoreAgent 平台在解决当前主流的 Agent 框架面临的哪些关键挑战上有独特的优势?它的核心设计哲学是什么?

答:其实像 Manus 这类自主智能体的创业公司,他们产品体验时最常出现的一个问题是排队、执行时间长。为什么会有这个问题呢,因为自主智能体在每个实例运行时,都需要动态去分配一个虚拟化的运行容器,还要有容器的生命周期管理的机制,心跳等等。这一类产品在容器的动态扩缩容,资源复用,启动加速等其实比较难有积累。网易这边之前做过很多云原生项目的积累,对容器、沙箱管理、资源加载等都比较擅长。同时因为我们团队长期做一些智能开发产品,对 Code Agent、数据分析 Agent等场景非常熟悉,也能够针对性地对任务调优,这也是我们的优势。还有一点由于我们做过很多 toB 项目,在 toB 里自主智能体他并不一定是一个全发散的场景也会有一定收敛,所以我们设计了一个机制叫最佳实践,用户可以每次跑自主智能体都积累这个最佳实践并针对性修正,下次跑的时候可以召回参考,同时也可以作为全局的经验供其他类似场景的自主智能体参考,这样会越跑越准确。

 

问:能否简要透露一下 MCP 协议主要解决了自主 Agent 协同中的哪些核心问题?而“运行沙箱”对于 Agent 的可靠性和安全性起到了怎样的保障作用?

答:其实原先 OpenAI 通过 Function Calling 提供了类似工具使用的能力。MCP 协议最重要的是提供了一个标准化的万物互联的协议,我们认为他是 Function Calling 的标准实现,对于工具提供商再也不需要写那么多不同种类的 SDK 给外面用了,统一暴露 MCP 服务即可,对于模型应用开发者,调用工具更简单更稳定,不需要通过像 Prompt 工程来约束 LLM 的返回,也不需要做复杂的参数解析等。这样极大地扩展了 LLM 的上限。

运行时沙箱主要提供了硬件级别的隔离,因为自主智能体他操作的能力很多,包括电脑的,代码的,环境的浏览器的,很容易影响到运行环境。因此通过沙箱可以有效的做环境的隔离。同时自主智能体经常是长尾需求,也能通过沙箱及时回收资源降低资源占用。

 

问:在构建和落地像 CoreAgent 这样的自主智能体平台过程中,您认为面临的最大技术挑战或工程挑战是什么?

答:最大的技术挑战有两个

  1. 保证智能体运行的稳定,避免幻觉。在工程上我们做了很多兜底,比如对工具使用的、返回结果的约束,运行过程中的优化等,同时我们也通过像最佳实践、知识召回的能力来约束智能体的行为,让他尽可能反思

  2. 对沙箱环境的管理和稳定性等,包括沙箱生命周期的管理、沙箱的存活时间、沙箱跟外界的通信,沙箱环境启动速度的加快和预热等

 

问:您认为“自主智能体”从技术概念走向大规模实际应用,最迫切需要跨越的门槛是什么?

答:主要还是依赖模型能力的提升和周边 MCP 能力的建设。自主智能体对模型的 Plan 能力和 MCP 支持,要求非常高,目前我们测试下来可能只有 Claude 能够达到较好的效果。同时我们发现在公司内部落地的时候,很多工具平台都缺少 MCP 服务,对接困难,所以都会有个打磨的过程。

 

问:对于想要开始在自己的项目中尝试构建或集成“自主智能体”能力的开发者/工程师,您有什么最重要的建议或关键考量?

答:自主智能体虽然以开放性任务为主,但还是要在任务过程中做好足够的干预,避免跑偏。可以在跑完后进行最佳实践的修正

同时要注意提供足够的工具来完成任务,对接该工具的 MCP 服务。比如跑的过程中要发消息之类,就需要提前先把这个消息工具准备好。

                                                                                </div>


维权提醒:如果你或身边的朋友近五年内因投顾公司虚假宣传、诱导交费导致亏损,别放弃!立即联系小羊维权(158 2783 9931,微信同号),专业团队帮你讨回公道! 📞立即免费咨询退费


Source link

未经允许不得转载:紫竹林-程序员中文网 » 从 Workflow 到 Agent:构建自己的自主智能体

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的