一文读懂可信数据空间,隐语社区的初步实践


打开链接点亮社区Star,照亮技术的前进之路。每一个点赞,都是社区技术大佬前进的动力

Github 地址: https://github.com/secretflow

一、可信数据空间介绍

可信数据空间,是指基于共识规则,联接多方主体,实现数据资源共享共用的一种数据流通利用基础设施。

是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体。可信数据空间须具备数据可信管控、资源交互、价值共创三类核心能力。

二、隐语社区“可信数据空间”初步实践

(一) 总体介绍

根据国家发展改革委、国家数据局、工业和信息化部联合印发的《国家数据基础设施建设指引》和全国数据标准化技术委员会发布的《可信数据空间 技术架构》等标准和规范要求,隐语社区研发实现可信数据空间平台,为推动数据资源共享共用、促进数据要素流通利用提供通用型的平台功能。

隐语社区研发的可信数据空间提供:

  • 可信数据空间服务平台,包括空间服务门户和管理中心。空间服务门户是面向数据空间的各参与方提供业务应用入口,包括空间门户、机构中心、运营中心、开发中心、审计中心等。管理中心实现了身份管理、连接器管理、目录管理、数字合约管理、数据空间管理等功能。并支持按照“三统一”要求,保持身份、标识、目录与区域/行业功能节点的互联互通。
  • 密态计算枢纽,提供基于TEE技术路线的密态计算平台,包括密态计算底座、可信应用体系、密态计算引擎、密态胶囊、密态数据开发服务平台在内的全栈功能。密态计算枢纽可以作为可信数据空间的密态数据托管环境和开发利用环境,支持数据供需双方基于密态进行数据交付,研发。
  • 隐私计算平台,集成了隐语原有的MPC、PSI、PIR等多种隐私计算关键核心技术,以及联合数据分析(SCQL)能力。
  • 接入连接器,按照可信数据空间技术架构,隐语社区提供了符合《技术架构》要求的标准功能连接器,以及扩展隐私计算、密态计算、密态托管等功能的扩展型连接器。

(二) 功能介绍

  1. 可信数据空间服务平台 通过可信数据空间服务平台,支持数据空间相关参与方,完成以下业务功能:
  • 制定数据流通控制策略,支持智能合约自动执行,确保数据访问、使用符合预期。
  • 管理数据资源目录与产品目录,提供检索、订阅、交易等服务,促进数据产品流通复用。
  • 对接入应用、连接器进行审核与监控,保障系统安全合规运行。
  • 运用区块链等技术实现操作存证与核验,提供全流程审计日志管理。

从功能上,可信数据空间服务平台分为面向各类参与主体的空间服务门户,以及涵盖《可信数据空间 技术架构》相关功能的管理中心。

空间服务门户

空间服务门户是数据供需双方的交互平台,聚焦数据产品交易、生态主体入驻及市场运营。

核心目标是搭建数据交易生态,降低数据供需匹配成本,促进数据要素市场化流通。主要功能包括:

  • 提供主体入驻建档服务,审核资质并建立唯一档案,确保参与方身份可信。
  • 展示数据产品、应用场景及行业资讯,支持多维度检索与智能匹配,提升数据发现效率。
  • 支持数据产品检索筛选与需求申请,实现资源收藏管理及在线合约协商。
  • 分析市场供需动态,提供热门数据推荐、交易统计等可视化视图,辅助决策优化。

管理中心

管理中心对应《可信数据空间 技术架构》中的数据空间服务平台的基础功能,实现了身份管理、连接器管理、目录管理、数字合约管理、数据空间管理等功能是密态可信数据空间的核心资源管理中枢,负责平台内用户、连接器、资源目录、数据产品、合约及日志的统一管理。

核心目标是保障数据空间高效运行,优化资源配置,提升生态活跃度与合规性。

主要功能:

  • **空间互通网关:**提供请求鉴权,请求路由转发的能力,支撑连接器与空间服务平台的接口互通。
  • **互联互通代理:**对接功能节点的身份管理、连接器管理、目录管理等模块,基于互通互联三统一(统一身份、统一标识、统一目录)的标准进行建设,主要代理的功能包括 1)主体身份、业务节点的身份管理 2)连接器管理 3)数据资源、数据产品的目录管理。
  • **可信空间管理:**提供可信空间的全生命周期管理,包括创建、配置变更、成员管理、删除、功能审计等能力。
  • **数字合约管理:**基于策略模板、合约备案等等功能管理数据交易合约,支撑合约起草、签署与履约全过程。
  • **存证审计:**建设可信审计模块, 覆盖空间服务平台内的用户行为、数据访问\流转等关键操作的审计。

  1. 密态计算枢纽 密态计算枢纽是可信数据空间中提供规模化密态计算能力的计算节点,也是解决数据可信流通的关键所在。

其他连接器可以用密态数据胶囊方式封装数据后托管到密态计算枢纽内进行融合加工后产出数据产品在可信数据空间内进一步流通。密态计算枢纽的整体架构如下:

密态底座层是密态能力的基本单元,以现有的可信执行环境(TEE)技术为基础,提供最核心的“可用不可见”能力,重点改进可信根自主可控、跨平台统一机密计算能力等问题。

密态服务框架将独立的密态基本单元链接成密态服务集群,实现密态服务的规模化,重点要解决密态单元之间相互验证问题,以及提供公共的基础服务。

密态数据互通层提供数据的全生命周期流通能力,包括数据的封装、授权、鉴权等,重点保障数据在流通过程中不被窃取和滥用。

密态数据计算层主要是与现有的计算软件融合,继承现有计算软件的强大能力,并兼容已有的海量业务层代码,重点是改造现有计算软件的账户和权限体系。

密态数据服务层主要是以上述功能为基础,实现用户视角的数据流通服务。

一、密态数据胶囊

数据互通层是密态计算枢纽作为可信数据空间组件之一的基础:

  • 按照“三统一”要求通过参与方身份和数据目录模块支持身份、标识、目录与上游功能节点的互通。
  • 密态胶囊和数据管控模块则通过对数据的封装和可信鉴权实现数据的全链路密态保障,保障数据不泄露、不滥用。

密态胶囊是一种全新的数据封装技术。与传统数据封装技术只关注数据在存储与传输阶段的保密不同,密态胶囊将密封后的数据与使用策略(数字合约)进行强绑定,确保数据在多源融合、计算等所有环节,都严格遵守使用策略。通过这种方式实现了数据提供者对数据的严格管控。

密态胶囊的实现底层依托可信应用。在进行数据封装时,数据提供者可以使用可信应用的公钥加密数据,从而确保只有目标的可信应用可以使用数据,任何第三方都不能使用数据或窃取数据。

数据提供者将使用策略(如有效期、操作次数、算法限制)编码为数字合约,一同封装在密态胶囊中,并使用自己的身份私钥对其进行签名。要指出的,数字签名只能代表数据提供者的意愿,对使用策略是否会被遵守不起作用。

数据提供者需要检查目标可信应用(能够使用数据的可信应用)是否包含检查使用策略的代码,以及检查的逻辑是否完备。使用策略的遵守,实际上来自于可信应用对使用策略的检查,而不是合约签署本身。

  1. 隐私计算平台

在中心部署的隐私计算平台,100%包含隐语隐私计算能力,并可与数据空间服务平台实现无缝对接。

提供包括联合数据分析(SCQL)、隐私求交(PSI)、隐匿查询(PIR)、联合建模(MPC/FL)等多种查询分析能力。

  1. 接入连接器

接入连接器是数据提供方、使用方及第三方服务方接入密态可信数据空间的核心入口,负责数据资源的接入管理、身份验证及基础功能支撑。

核心目标是实现多类型数据资源的标准化接入,保障接入主体身份可信,为数据流通提供基础环境。

标准接入连接器主要功能包括:

  • 支持数据提供方接入本地数据资源(如库表、文件、接口、流式数据等),进行分类管理与元数据登记。
  • 提供身份验证方式配置(如生物识别、数字证书等),实现接入主体身份的真实性校验与权限管理。
  • 支持数据产品封装、上架及交付,结合数据合约与使用控制技术,保障数据安全可控流转。
  • 记录操作日志、审计信息及异常事件,提供日志查询与安全追溯能力。

隐语社区在接入连接器技术架构基础上进行了扩展,提供隐私计算、密态计算、密态托管等多种扩展功能模块。

三、可信数据空间的使用方式

(一) 基于标准型连接器

  • 数据提供方、数据使用方均通过标准连接器接入数据空间。
  • 提供方通过连接器,将本地数据资源封装为数据产品(文件、API、隐私计算),发布到数据空间。
  • 使用方通过连接器,或者直接通过数据空间服务平台查询产品目录,申请后通过数字合约约定的控制策略,使用数据产品。

(二) 基于密态计算枢纽

数据提供方、加工服务方、产品运营方、数据使用方等多方,通过密态可信数据空间完成数据托管、数据加工、产品上架、数据申请流程。

四、产业案例

(一) 金融可信数据空间案例

小农户贷款一直是金融领域的难题。受制于地域分散、数据缺失等原因,金融机构难以对农户的信贷风险进行科学有效的评估。

农业农村部大数据发展中心、网商银行及蚂蚁密算三方首次将时空大数据和密态计算技术相结合,安全融合多源数据并联合建模,形成农业信贷实时评估指标,累计已为1300万农户提供了获得金融服务的渠道,他们来自全国2600多个区县,其中80%农户的种植面积在10亩以下。

(二) 医疗可信数据空间案例

针对医疗保险行业存在的数据合规使用需求和理赔补充材料率高的问题,依托蚂蚁密算提供的密态可信数据空间,蚂蚁保险科技团队与保险公司合作构建了“理赔大脑”智能理赔系统,覆盖了全国10+省份的医疗数据,为医疗数据的使用提供合规路径,保司调查案均成本降低40%,门诊医疗理赔80%实现秒级审核,住院医疗理赔86%实现2日内结案。

不仅显著提升用户报案体验,也节省了立案审核的运营成本,更有利于扩大普惠医疗的服务范围、提升普惠医疗的服务效率。

                                                                                </div>



Source link

未经允许不得转载:紫竹林-程序员中文网 » 一文读懂可信数据空间,隐语社区的初步实践

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的