来源:36氪


时代的机遇,
只眷顾那些早已准备好的人。
]article_adlist–>


被数据“卡住”的具身智能,
需要一种现实解法
2026年,无疑是机器人从技术验证走向产业应用的关键一年。当下的机器人,已经走出实验室的演示阶段,开始逐步进入到工业、公共服务等真实环境中。
然而技术验证并不等于大规模商业化的到来。在不少行业人士看来,真实环境远比实验室复杂——光线变化、地面杂物、非标操作……每一个细节都可能让机器人“失灵”。
泛化能力不足,仍是横亘在具身智能规模化落地面前最难绕开的核心瓶颈。而这一困局的根源,指向行业普遍共识的数据桎梏。
问题首先出在数据匮乏和标准的不统一。百小时量级的数据仅能支撑单一动作的泛化——比如让机器人学会分拣。而要实现真正意义上的通用具身智能,所需数据量需要数量级的跃升。
更棘手的是,各家企业的机器人本体构型不同,数据格式与采集逻辑难以互通,行业内部事实上已经形成了一道道隐形的数据壁垒,各自为战、无法共享。
另一重压力来自获取的成本。大语言模型的训练,可以借助互联网上海量的公开文本完成预训练,数据获取的边际成本极低。但机器人所需的数据截然不同——它必须来自真实物理世界的交互,采集链路长、标注难度高、复现成本大。这道门槛,对中小企业而言几乎是一堵墙。
数据成本究竟有多高?国地中心数据负责人曾给出过一个直观的估算:特斯拉人形机器人Optimus若要完全准备好在工厂独立工作,至少需要数百万小时的训练数据,对应的数据采集成本可能高达5亿美元。这个数字,已经足以让绝大多数玩家望而却步。
如果说算法是具身智能的大脑,数据就是让大脑持续进化的燃料。真实世界的数据更像是一种与硬件深度绑定的工业产出——谁拥有设备、控制部署、理解场景,谁才有能力持续生产高价值数据。
“具身智能的数据,就是物理AI时代的基础设施”, 聆动通用CEO季超告诉36氪, 在基础设施还不够完善的情况下,即使技术路线产生了突破之后,依然没有办法产生产品和市场级的商业突破。
聆动通用成立于2024年12月,作为科大讯飞在具身智能领域的战略布局,是安徽省首家实现“大脑-小脑-本体”全链路自主可控的硬科技初创企业。其提出大脑-小脑-本体的分层端到端架构,正是在当前动作数据极度匮乏的现实约束下,为具身智能大规模产业落地蹚出的一条关键路径。
对于核心竞争力,季超用“生态位”而非单点能力来定义:“讯飞生态 + 聆动通用垂直整合的全栈自主可控。”
这背后是三个层次的协同——数据端海量积累的真实作业数据让模型真正贴近落地场景;模型端从预训练到后训练全链路自主可控,上述数据的优势进一步强化了模型的优势;硬件端则拥有触达芯片级的工规级研发能力,真正满足“进工厂、真干活”。在季超看来,聆动通用依托“全模态数据采集管线 + AI原生预训练-后训练模型全栈能力 + 工规级软硬一体垂直整合的独特生态位”才是行业里真正难以复制的壁垒。
借助其最新推出的具身智能通用机器人LDB与具身智能采训推机器人LDT,聆动通用实现从数据采集、模型训练、硬件部署与场景应用的完整闭环:让机器人“干活”与“变聪明”同步发生,以此打通具身智能从实验室走向真实产线的最后一公里。

大小脑结合:机器人
走向真实场景应用的更优解
为什么是大脑-小脑-本体的分层端到端架构?
在具身智能的技术分野中,“完全端到端”一度被视为最具想象力的方向:一个模型,从感知到决策再到执行,一步到位。但当机器人走出实验室,进入真实产线时,问题开始集中暴露:机器人可以理解,却无法稳定执行。
这主要是因为,工业场景对机器人实时性、稳定性与可控性的要求,远高于任何消费级应用。一方面,由于大模型的推理本身存在延迟,难以支撑高速流水线下的连续操作;另一方面,端到端模型的“黑盒”属性,在工业场景中意味着更高的不确定性。一旦出现误判,很难定位问题来源,更难进行工程层面的修正。
这也是为什么,聆动通用所采用的“大小脑”分层端到端架构,为机器人走向产业落地提供了一种更现实的工程解法,它将具身智能的能力拆解为两个协同运作的层级——大脑主感知决策,小脑主动作执行。二者背后各有一条独立的数据管线支撑,各司其职、互不拖累。
首先,是作为大脑的行业级iFlyBot_VLM具身基础模型,负责感知环境与任务决策。它基于互联网海量数据预训练而成,形成对特定任务的先验知识,赋予机器人理解指令、推理意图的能力。
其次,是作为小脑的iFlyBot_VLA技能操作模型,负责将大脑的决策指令转化为柔性、可泛化的精准动作,并通过具身智能采训推机器人在真实场景中持续采集的真机数据进行针对性微调,让机器人具备可靠的落地执行能力。
聆动通用依托全栈自研的 iFlyBot_VLM 与 iFlyBot_VLA 模型能力,并接入讯飞生态近千人规模的数据团队,已构建起覆盖互联网数据、仿真合成数据、Embodied UMI 真机数据及高精度同构遥操作数据的全链路数据体系。
这背后,是聆动通用构建的“数据-模型-硬件-应用”全链路闭环。通过机器人遥操作采集真实数据,然后反哺模型提升智能化水平,继而输出指令给硬件,实现“知行合一”,真正做到机器人既能干活,又能产生数据。
2026年4月16日,聆动通用全球首发新一代具身智能通用机器人——LDB01 。其硬件规格按照工规级标准设计,算力、感知及功能安全模块均针对工业严苛环境优化,是真正意义上满足工业场景MTBF和寿命要求的具身智能机器人。
截至目前,聆动通用已经与物流、汽车、3C电子领域的头部客户进行验证,预计可实现三周内快速上线部署。
某种意义上,分层端到端架构为具身智能产业化落地提供了一种“沿途下蛋”的商业选择。它允许在达到“完全端到端”之前,先在特定的工业场景(如物流、汽车、3C电子)实现阶段性落地,为具身智能企业创造商业现金流。
在季超看来,或许未来还有更高效的数据采集方式,但就当下而言,这是目前行业兼顾规模、成本、质量与效率的最优解决方案。

具身智能背后的万亿蓝海:
聆动通用如何驱动产业落地?
当大小脑模式在真实场景中得到有效验证,具身智能也逐渐迎来产业落地的下半场。
2026年,无疑是具身智能逼近规模化落地的临界点。市场规模的爆发式增长与资本争相涌入的热情早已相互印证,这是一个万亿蓝海赛道。据中商产业研究院分析师预测,2026年中国具身智能市场规模将达到10904亿元。
但是在市场规模爆发之外,产业落地需要的不再只是谁的模型更强、谁的硬件在展会上更酷炫,而是谁能率先建立数据标准、打通产业生态、将技术能力真正转化为可大规模复制的交付能力。
这正是聆动通用给自己设定的目标。在季超看来,聆动通用只做两件事:第一个是数据,第二个则是应用。这本身就不是一家传统机器人公司的创业思维。传统机器人公司的核心竞争力是本体制造与运动控制,而聆动通用把数据和应用并列为战略核心,依托自主可控的全模态数据采集管线、AI原生预训练-后训练模型全栈能力、工规级软硬件一体化垂直整合的独特生态位,实则是在构建具身智能时代的底层供给能力。
聆动通用从创立之初就没有把自己框定为一家传统的机器人公司,而是立志成为具身智能产业基础设施的构建者。这背后,得益于科大讯飞体系的成熟孵化以及从技术研发到产品落地的连续性。 “做大模型、自动驾驶和传统工业机器人的公司均在积极布局具身智能。”季超说,“但我们在底层源头技术的演进上,一直有非常清晰的连续性。”
对于2017年就加入科大讯飞、长期深耕机器人感知、交互与运动控制领域的他而言,具身智能从来不是一个风口,而是一件从未中断过的事业。
资本市场对这份积累给出了快速回应。成立不到一年,聆动通用已完成三轮融资。其中去年8月披露的数亿元人民币天使轮融资,由元禾璞华领投、讯飞创投加码——老股东的持续押注,新一轮融资即将敲定,是对这支团队最有力的背书。
作为具身智能产业基础设施的构建者,聆动通用也在用实际行动兑现这一价值定位。
在科技创新层面,聆动通用聚焦打造高泛化性的具身大模型和通用鲁棒的机器人本体,推出了全栈自研的“行业级iFlyBot-VLM视觉语言基座大模型和iFlyBot-VLA视觉-语言-动作操作大模型”分层端到端架构。
在成果转化上,聆动通用最新发布的LDB通用机器人历经六轮内部迭代,自研率超过90%,算力、感知与功能安全模块全部按照工规级标准设计,是真正意义上能够在工业严苛环境下持续稳定作业的生产力工具。
在产业赋能上,聆动通用的目光落得更远。作为副组长单位,深度参与工信部首个具身智能行业标准的起草制定,该标准将于今年6月1日正式试行;同时推出国内首个具身智能基准测试评测标准,成为国内首批、安徽省首个通过可信AI评测的企业之一,让具身智能告别技术混战,走向有标可依的规范化发展。
季超强调,聆动通用打造的是未来懂知识、善学习、能进化的硅基劳动力,不是一种工具,而是直接创造结果的生产伙伴,“我们致力于改变在制造业领域劳动力逐渐缺失,人类越来越不愿意从事繁重的体力劳动的现状,用具身智能 + 机器人重新赋能传统制造业智能化升级”。
作为人工智能走向现实世界的重要载体,具身智能所带来的新质生产力升级远不止于制造业。从物流、医疗到公共服务,智能正在突破认知层的边界,第一次真正进入物理世界、作用于真实生产。
这场生产力革命的起点,已经从每一条有序运转的工业产线上悄然发生。就在万亿级市场爆发的前夜,聆动通用以多年的技术积累与产业验证为基础,率先打通了从数据到应用的全链路闭环。而这条路,正在成为具身智能规模化落地最清晰的一条航线。
时代的机遇,只眷顾那些早已准备好的人。夯实数据地基,托举产业未来——正是聆动通用选择的使命,也是它认为这个时代最值得全力以赴的一件事。
