小模型才是 Agent 系统的「核心组件」？

随着小模型能力提升，模型在系统中的使用方式正在发生变化，从资源受限条件下的可运行选择转为按任务能力配置的执行单元。这一转向进一步推动 Agent 系统拆分工作流并重新分配模型位置，同时也促使模型选择逻辑由单一模型选择转向面向整体流程的编排。

01. 小模型如何从「先看能不能跑」转向「先看适不适合」？

小模型为什么不再只是资源受限场景里的备选项？从「能不能跑」到「适不适合」，系统判断标准发生了什么变化？…

02 . 小模型为什么更容易在 Agent 系统中「定岗」？

规划、检索、执行、校验和汇总这些链路里，哪些位置更适合交给小模型？主模型、轻量模型和本地模型的职责边界如何重新划分？…

03 . Agent 系统的模型选择逻辑在如何变化？

当任务链路被拆开之后，模型选择为什么开始从单次取舍走向整体编排？…

小模型如何从「先看能不能跑」转向「先看适不适合」？

1、2020 年至 2024 年前后，大语言模型沿着做大规模的路线持续提升能力，计算、内存和部署成本也同步上升。随着通用能力越来越集中到大语言模型上，移动设备与边缘硬件承接模型的压力随之增加，小模型也更早在端侧和边缘场景中获得持续采用。到 2024 年前后，相关综述将这一矛盾系统化，并将小模型的研究动因更明确地指向资源受限条件下的部署需求。[1-1][1-2][1-3]

① 2024 年 8 月，Meta 等机构研究者在综述中指出，端侧部署的核心矛盾在于大语言模型计算开销高，而移动设备和边缘硬件的资源约束较强。[1-4][1-5]

② 2024 年 10 月，俄勒冈大学等机构研究者在综述中指出，小模型的重要性与其能够在端侧、移动端和边缘设备上以较低资源开销完成本地推理直接相关。[1-6]

2、在资源受限背景下，小模型最初进入系统时，系统优先判断的是它能否在受限环境中稳定运行。到 2025 年以后，随着模型能力继续提升，小模型在部分通用任务上开始具备更明确的任务可用性，系统对小模型的判断标准也由部署可行性，进一步转向任务适配性和环节分工。[1-7]

① 北京邮电大学等在 ACL 2025 的论文中指出，先进小模型在部分通用任务上的结果已超过部分 7B 级模型，其中 Phi 系列在多数任务中保持较优表现，Qwen2-1.5B 在特定任务上优势更为明显。[1-7]

3、在小模型具备任务可用性的前提下，模型分配开始进入系统设计。小模型在系统中的角色从「资源约束下的可运行组件」，转向「按任务能力配置的执行单元」，模型选择也随之由是否可用转向任务分配，小模型进入系统的依据因此进一步从资源约束下的可运行性，转向任务链路中的适配性。[1-8][1-9][1-10]

① 在 GPT-5.4 使用指南和 Codex 文档中，nano 对应分类、抽取、排序等高频结构化任务，mini 对应子任务、工具使用和较轻的编程工作，更高规格模型保留给复杂推理与主线程决策，模型开始按环节进入系统。

4、判断标准变化之后，模型分配开始进入系统设计。小模型进入系统的依据由资源约束下的可运行性，进一步转向任务链路中的适配性，小模型在系统中的角色也由可运行组件转向按任务能力配置的执行单元。[1-8][1-9][1-10]

小模型为什么更容易在 Agent 系统中「定岗」？

1、小模型开始稳定承担具体任务之后，系统处理的已不再只是「能不能用小模型」，而是「哪些环节该交给小模型」。模型分配开始进入链路设计，小模型也由资源受限场景中的可运行组件，转向工作流中的执行单元。 …

关注👇🏻 「机器之心PRO会员」，前往「收件箱」查看完整解读

]article_adlist–>

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->

            <!-- 非定向300*250按钮  end -->
        </div>

Source link

相关推荐

近期文章