<p style="margin-left:0; margin-right:0"><strong><span>背景</span></strong></p>
分层结构的背景主要源于数据仓库和大型信息系统建模的实践,特别是受到以下方法论的影响:
维度建模:由 Ralph Kimball 提出,强调从业务过程(对应主题域)出发,构建事实表和维度表(对应逻辑实体)。
范式建模:由 Bill Inmon 提出,强调集成的、面向主题的、非易失的数据集合,其EDW(企业数据仓库)的构建需要自上而下的分层设计。
企业架构框架:如TOGAF,其数据架构部分强调业务驱动,需要建立从业务到数据的映射关系。
为了应对大型企业在数据管理中的挑战——数据孤岛、口径不一、难以理解、复用性差等难题,需要一个既能被业务人员理解,又能指导技术人员实施的统一框架。资产L1~L5五层目录结构应运而生,它充当了“业务语言”与“技术语言”之间的翻译官。
资产目录L1~L5分层概念详解
业务域 -> 主题域 -> 业务对象 -> 逻辑实体 -> 属性的分层结构是非常经典和核心的数据分层建模方法。这个架构的核心目的是将复杂的业务数据有条理、有标准地组织起来,形成一套统一的数据语言,确保数据在整个企业内被一致地理解、定义和使用,从而支撑高效的数据分析和应用。
L1: 业务域 (Business Domain) – 战略视角
定义:企业最高层次的业务分类,反映了公司的核心业务领域和战略方向。它是对企业全部业务流程和业务活动的高度概括和划分。
核心特点:
1、稳定性高:一旦定义,很少随着组织架构或短期业务策略的调整而改变。
2、跨部门:一个业务域通常会横跨多个业务部门。
3、价值导向:每个域都直接对应公司的一块核心价值业务。
示例:在一个集团企业中,可能分为「零售业务域」、「金融业务域」、「物流业务域」、「人力资源业务域」等。
L2: 主题域 (Subject Area) – 业务视角
定义:在某个业务域内,对业务概念或业务流程的进一步细分。它是联系业务与数据的桥梁,是较高层次上对数据进行分类和归集的抽象集合。
核心特点:
1、面向业务过程:通常围绕核心业务过程(如生产、销售、服务)或核心业务实体(如客户、产品、员工)进行划分。
2、承上启下:上承业务域的宏观战略,下接具体的业务对象。
示例:在「零售业务域」下,可以划分出「会员主题域」、「营销主题域」、「商品主题域」、「交易主题域」、「渠道主题域」等。
L3: 业务对象 (Business Object) – 概念视角
定义:在主题域内,对具有共同特征和行为的业务概念进行的抽象和定义。它是业务人员能够理解和沟通的核心名词,代表了业务中重要的人、事、物、概念。
核心特点:
1、通常为业务名词:如“客户”、“订单”、“产品”、“合同”等。
2、具有唯一标识:每个业务对象都应该有一个在系统内唯一标识它的方式(如客户ID、订单号)。
3、包含属性:业务对象本身已经隐含了它应该具有的属性特征(如“客户”有姓名、年龄等)。
示例:在「会员主题域」下,核心的业务对象是「会员」;在「交易主题域」下,核心的业务对象是「订单」、「支付单」。
L4: 逻辑实体 (Logical Entity) – 设计视角
定义:业务对象在数据模型中的具体实现。它是对业务对象的细化和结构化,定义了其属性、主外键关系以及需要遵守的业务规则,但不依赖任何具体的数据库技术。
核心特点:
1、规范化设计:通常遵循第三范式(3NF)来减少数据冗余,保证数据一致性。
2、关系明确:清晰定义了实体与实体之间的关系(如一对多、多对多)。
3、是ER图的主要组成部分:逻辑实体及其关系构成了概念模型和逻辑模型。
示例:会员这个业务对象,在逻辑模型中被细化成多个逻辑实体,如「会员基本信息实体」、「会员等级信息实体」、「会员地址信息实体」。它们通过「会员ID」关联,并且各自包含规范化的字段。
L5: 属性 (Attribute) – 实现视角
定义:逻辑实体的最小组成单位,也称为“字段”或“数据项”。它描述了实体的某一个特征,具有明确的数据类型、长度和取值范围约束。
核心特点:
1、原子性:应是不可再分的数据单元。
2、标准化:全公司对同一属性应有统一的定义和标准(例如,“性别”这个属性,在整个公司都统一用代码‘M’/‘F’表示,而不是有的用‘男/女’,有的用‘1/2’)。
示例:「会员基本信息实体」包含的属性有:「会员ID」、「会员姓名」、「性别」、「生日」、「手机号」、「注册时间」等。
如何平台化实现分层架构管理?
通过袋鼠云「数据资产管理平台」,企业可以完成数据资产目录的规范管理,通过数据目录分层设计、目录属性自定义、目录发布审批、关联设置等功能,实现数据目录的分层架构管理,从源头上进行数据的标准分类、保障数据合规。
【层级属性管理】
通过平台可定义每层目录的属性信息,实现目录信息的自定义管理。企业可根据自身业务要求设置不同层级目录需要维护的业务属性,例如业务域所属部门、业务域维护责任人等,支持设置每个属性的维护方式、是否必填,灵活控制目录属性。

【分层架构管理】
实现对业务域、主题域、业务对象、逻辑实体、属性五个层级的分层架构管理,企业用户可根据自身业务要求定义层级之间的级联关系,维护每个层级对应的业务属性信息。同时考虑某个业务域下的实体表数量庞大,平台提供整库发布、批量发布功能,便于用户初始化配置资产目录结构,快速完善企业数据资产架构。

资产目录维护

实体表维护

属性字段维护
【分层查询与审计】
平台还提供目录查询、目录发布、下线设置功能,并记录目录的发布、下线审计日志,便于查询目录的变更情况,全方位管理资产数据的目录结构。
总结
数据资产五层架构是一个从宏观到微观、从战略到实现、从业务到技术的逐级细化的过程。它完美地诠释了如何将模糊的业务需求,最终落地为精确、可落地的数据结构。它的核心价值在于统一语言、降低复杂度、保证数据一致性、支撑数据资产化,让业务人员和技术人员概念上达成一致,减少沟通成本;通过分层,将庞大的数据系统分解为易于管理和理解的部分;从源头统一定义,避免了同名不同义、同义不同名等数据混乱问题。只有被良好定义、标准化的数据,才能成为可复用、可信任、可运营的数据资产。
</div>