<p style="margin-left:0; margin-right:0; text-align:left"><em><span>以下文章来源于第一新声,作者第一新声</span></em></p>

十多年前,宁海元还是阿里巴巴内部负责天猫双十一数据库保障的技术负责人。零点流量洪峰之下,他和团队要确保每一笔订单、每一笔支付都能被系统准确接住——背后依赖的,是一整套可信、可流转的数据体系。
从搭建当时亚洲最大的 Oracle RAC 集群,到主导参与淘宝 “ 去 IOE” ,再到把分布式数据平台对外商业化,这段经历在很大程度上塑造了他今天对 AI 的判断:
真正决定智能应用上限的,不是模型本身,而是它脚下的数据地基。
2015 年,他离开阿里,联合创立袋鼠云,选择从“数据基础设施”切入。十年时间,袋鼠云从一家做数据中台的技术公司,演化为围绕“多模态数据智能中台”的“一体两翼”格局:
- “ 一体 ” : 多模态数据智能中台(由大数据底座平台 + 多模态数据中台 构成),负责把数据变成稳定、统一、可调用的生产要素;
- “ 两翼 ” : 数据智能引擎与空间智能引擎,一翼落在经营与决策,一翼伸向物理空间与数字孪生。
在 AI Agent 被视为新一轮产业窗口的时间点上,本期第一新声专访袋鼠云 CEO 宁海元 ,这家成立十年的大数据基础软件公司,正在给出自己的答案。
01 AI 热潮之后,回到“数据 + 智能”的长期结构
当前 ,从内容生成到行业解决方案 ,全球 AI 生态正迎来爆发式增长。据第一新声智库报告预测 , 2025 年企业级 AI Agent 应用市场规模将达到 232 亿元 , 2023-2027 年复合增长率高达 120% 。各行各业对 AI 的关注度与投入规模呈指数级攀升 ,但在 “ 热度 ” 之外,一个残酷的事实是:真正落地到业务、形成稳定产出的 AI 项目,并没有想象中那么多。
宁海元在访谈中提到,今年不少 CIO 都向他表达类似的焦虑:一方面,业务高层对 AI 抱有极高期待,希望 “ 接入一个大模型,就能盘活一批难题 ” ;另一方面,当部门把几百条 AI 场景写进 Excel 后,技术团队会很快意识到 —— 大部分场景卡的不是模型能力,而是数据基础。
在他看来,这一轮企业级 AI 应用的瓶颈,与十年前数据中台刚兴起时的情况有相似之处:
- 企业 IT 建设长期遵循 “ 按部门 / 项目上系统 ” 的逻辑, ERP 、 CRM 、 SCM 、 MES 各自为政,形成一个个 “ 数据烟囱 ” ;
- 不同系统背后,对同一个业务事实往往有不同的口径和算法,一个简单的 GMV 指标,在市场、财务等不同部门眼里有不同的理解;
- 大量文本、图片、语音、视频等非结构化数据,要么从未被采集,要么只是“堆在存储里”,没有进入经营分析和决策链路。
在传统 BI 阶段,这些问题往往还 “ 勉强可用 ”—— 顶多是报表口径对不上、沟通成本上升。但当企业希望把 AI 用在客户经营等核心决策时, 数据的分散、口径的混乱、流转的高成本,再叠加信创环境下复杂的技术栈,迅速抬高了 AI 落地门槛。
“ 很多老板会天然认为,大模型出来了,是否可以顺便把原来信息化、数字化没解决的问题一并解决掉。 ” 宁海元说, “ 但如果数据本身不规范,也不能实时反映业务现状,再强的模型也只能停留在演示层面。 ”
在他给出的框架中,企业要真正进入 “AI 应用期 ” ,至少要先回答一个问题: 自己的数据是不是已经达到了 AI Ready 的状态。
所谓 AI Ready 数据,在宁海元看来至少有两点:
1. 规范性 —— 也就是业务语义层面的统一。企业内部要有一套相对稳定的指标与数据标准体系,明确 “ 同一件事在不同系统里是什么含义 ” ;
2. 实时性 —— 数据能够尽量及时地反映业务状态,而不是始终滞后一个结算周期、一个账期甚至更久。
“ 有足够丰富的原始数据,再加上一套统一语义的业务数据,在这个基础之上去用 AI 做推理,才有可能支撑稳健的企业级应用。 ” 宁海元总结道。
02 “数据地基”只是起点:从结构化到多模态的 AI Ready
如果把 AI 看作一座 “ 塔 ” ,那数据地基只是基础层。而对许多中国企业来说,这块地基的建设还处在不同阶段。
宁海元的观察是:
- 对一些传统制造、能源矿产企业来说, 第一步仍然是完成结构化数据的 “ 上云和入库 ” —— 把散落在纸质单据、 Excel 、局部系统里的经营数据,统一采集和存储;
- 对于头部制造业、金融业、互联网等数字化程度更高的企业,结构化数据平台已经相对成熟,新的挑战更集中在: 如何把会议纪要、邮件、客服对话、设备图片、文档规范等非结构化数据纳入治理与分析体系。
“ 结构化数据这条线,中国市场其实已经教育了二十多年,从数据仓库到数据中台,技术能力和人才体系都比较成熟。难的反而是非结构化数据。 ” 宁海元说。
在 AI 视角下, “ 数据地基 ” 的内涵也在发生变化:
- 从对象上看,从 单一结构化数据 扩展到 结构化 + 半结构化 + 非结构化 的全模态数据;
- 从能力上看,从 采集 – 存储 – 计算 ,扩展到 采集 – 治理 – 语义建模 – 安全合规 – 多模态融合 ;
- 从目标上看,从 “ 为 BI 报表供数 ” ,转向 “ 为 AI 推理与 Agent 应用持续供给高质量语料 ” 。
因此,袋鼠云在对外表述中,把 “ 数据地基 ” 视为 AI Ready 的前提,而不是终点 —— 真正支撑企业未来十年智能化演进的,是建立在其上的 多模态数据智能中台 。
03 站在 Data+AI 交汇点上 ,袋鼠云是怎么做的?
袋鼠云的产品路径可以概括为: 从数据中台走向多模态数据智能中台。
2016 年,袋鼠云正式推出自研数据中台产品 “ 数栈 ” ,基于开源技术栈构建分布式存储、离线与实时计算、元数据管理等能力。与不少 “ 从平台起步 ” 的创业路径不同,袋鼠云在早期就做了两个决定:
1. 底层坚持开放生态,基于 Spark 、 Flink 等主流开源框架演进,不锁定在某个私有技术栈;
2. 把主要研发资源压在 “ 中间层 ” ,也就是数据中台本身,而非把精力过多投入到底层引擎 “ 重复造轮子 ” 。
这一选择,使得它在后续几年里,能更快适配不同行业、不同规模客户的异构环境 —— 包括国产大数据平台、金融行业的专有集群、大型互联网公司的混合架构等,在实践中逐步形成了 “ 模块化、插件化 ” 的产品形态。
进入大模型时代后,袋鼠云在原有中台之上,明确提出了 “ 多模态数据智能中台 ” 的产品方向:
- 从产品结构看,它由 多模态数据中台 + 大数据底座平台 构成,前者解决 “ 管什么、怎么管 ” ,后者解决 “ 放在哪里、怎么算 ” ;
- 从能力边界看,它不仅要承接企业所有结构化数据,还要统一接入 IoT 时序数据、日志、文本、音视频等多模态数据,并通过统一元数据体系打通;
- 从位置上看,它面向的不只是 BI 报表和传统分析,而是主动对接大模型平台、Agent 平台,成为 Data+AI 的“中枢层”。
围绕这个“中枢层”,宁海元给出了三层协同路径:
1. Data for AI :
- 通过数栈多模态数据智能中台,把企业内多源数据整合为统一、规范、带语义标签的数据资产;
- 为大模型的精调、RAG 以及企业场景推理提供可控、可追溯的数据供给。
2. AI for Data :
- 利用大模型能力辅助数据开发与治理,包括自动生成数据任务、辅助排查数据质量问题、自动梳理血缘等;
- 通过内置的“灵瞳”智能体,提供 SQL 编程助手、任务调度助手、运维助手、治理助手等,提高数据团队生产力。
3. AI for Agent / AI for Business :
- 在上层对接 AI Works 等 Agent 开发 应用 平台,把中台能力以 API、数据服务、特征服务等形式暴露给各类智能体;
- 支撑企业围绕运营分析、经营监控、流程协同等场景构建业务 Agent。
宁海元认为, 多模态数据智能中台的价值,不在于重新包装 “ 数据中台 ” 概念,而在于为 AI 时代重构数据基础设施。
从银行、证券到制造、零售,再到能源和矿业,数栈已经在上千家客户中经过验证 —— 这既是袋鼠云接下来十年战略的底气,也是一体两翼能够展开的前提。
04 “两翼”:数据智能 + 空间智能,与企业未来十年同行
如果说
“多模态数据智能中台”是一体,那么“两翼”则是袋鼠云回答“基础软件如何体现应用价值”的方式。

数据智能:从“看报表”到“对话数据”
在数据智能方向,袋鼠云主要通过 AIWorks (智能体开发应用平台) 和 AIMetrics (智能指标平台) 两条产品线展开。
- AIWorks 作为企业级 Agent 平台,提供多模型接入、知识库管理、工作流编排、监控与治理等通用能力,帮助客户在一个统一环境中构建和管理各类业务智能体;
- AIMetrics 则聚焦“数据+指标”这一经典企业场景,通过自然语言问答、自动图表与结论生成、异常波动监测与归因、权限与多端协同等能力,让管理者可以“直接向指标提问”,降低数据分析门槛。
在宁海元的设想中,数据智能引擎既是多模态数据智能中台的 “ 前台展示 ” ,也是未来企业 Data Agent 形态的实验场。它不会替代所有 BI 和分析工具,但会在越来越多的场景中承担 “ 第一交互界面 ” 的角色。
空间智能:从经营管理走向物理空间治理
相比数据智能,空间智能是袋鼠云这几年推动得更早也更 “ 前沿 ” 的方向之一。通过易知微旗下的 EasyModel 、 EasyTwin 、 EasyV 等产品,他们在城市治理、园区运营、工业现场、文旅景区等领域积累了大量数字孪生实践。
在宁海元看来, 企业要解决的从来不只是 “ 经营问题 ” ,很多时候也是 “ 物理空间的治理问题 ” 。
传统数字孪生的最大障碍在于建模成本高。过去要做一套 3D 场景,往往需要大量人工建模与数据采集投入,很难规模复制。随着 3D Gaussian ( 3D 高斯) 等新一代空间重建技术成熟,基于照片、激光点云即可自动重建 3D 场景,成本和周期大幅下降,也为空间智能带来了新的可能性。
在产品层面,袋鼠云将 3DGS 能力集成到 EasyModel 和 EasyTwin 中:
- 前者聚焦数字空间底座生产,实现多源空间数据的统一生产、管理与版本控制;
- 后者聚焦仿真与渲染,将空间数据与业务数据结合,支持运行监控、应急演练、能耗管理等场景。
当多模态数据智能中台与空间智能引擎打通后, “ 数据智能 ” 与 “ 空间智能 ” 开始形成互补 :经营数据可以映射到空间对象,空间事件又能回流为经营指标,这也是袋鼠云近两年在城市、能源、制造等行业频繁布局的方向。
05 从本土深耕到全球化布局,袋鼠云的出海“三步走”
无论是数据中台还是多模态数据智能中台,本质上都属于 “ 重投入、长周期 ” 的基础软件赛道。如何在保证产品路线足够长期的同时,找到可持续的商业路径,是所有厂商必须回答的问题。
在国内,袋鼠云经历了从与阿里云 OEM 合作,到深耕金融、能源、制造等行业,再到形成 “ 产品 + 伙伴生态 ” 的路径;在全球化上,它则选择了一条相对务实的 “ 三步走 ” :
1. 服务中国企业出海 —— 围绕数据合规、本地化部署、多云环境适配等刚需,帮助中国企业在东南亚、中东、欧洲等地搭建本地数据与 AI 基础设施;
2. 服务海外华人企业 —— 利用对中国供应链、产业链的理解,支持跨境业务中对数据流转与风控的需求;
3. 逐步拓展本地客户 —— 在关键节点市场形成交付与产品支撑能力,走向真正意义上的全球化基础软件公司。
目前,袋鼠云已经在香港设立公司,作为承接中国市场与海外市场的重要支点:既为中国企业出海提供更灵活的合规与部署选项,也为面向本地客户的服务打下基础。
06 从“做产品”到“做长期基础设施”
纵观袋鼠云这一轮战略升级,可以看到一条清晰的轨迹: 从 “ 做某一代技术产品 ” ,转向 “ 做 Data+AI 时代长期需要的基础设施 ” 。
- 多模态数据智能中台 回答的是:在未来十年里,企业如何把越来越多元的业务数据,持续沉淀为面向 AI 的、可治理的资产;
- 数据智能引擎与空间智能引擎 回答的是:企业如何在报表分析、 Agent 应用、数字孪生和空间智能等场景中,把 Data+AI 变成可感知、可复用的生产力;
- 出海三步走 则试图回答:当 AI 成为新的“通用技术”时,中国的基础软件公司如何参与构建全球产业的底层范式。
在很多人眼里, 2025 年是企业 Agent 的 “ 元年 ” ;但在宁海元的视角里, “ 元年 ” 意味着至少十年的长跑周期,而不是一波风口。 他的逻辑很朴素:
- 每一轮生产力技术要真正改变生产关系,周期都不会短;
- 今天的 Agent 更像是“新物种刚刚孵化”,要经历从单点场景、部门级试点,到组织级、集团级的漫长进化。
在这场漫长的技术与产业共振中,袋鼠云选择了一条不算 “ 短平快 ” 的路: 把自己定位为产业智能化的基础设施提供方。
至于这条路能走多远,最终会交给时间和市场去检验。但至少在围绕 Data+AI 重构基础设施这件事上,袋鼠云已经把自己的位置和路线,画得足够清晰。
</div>