隐私计算起源
姚氏百万富翁问题
两个百万富翁街头邂逅,他们想比一比谁更富有,但是出于隐私,都不想让对方或者任何第三方知道自己拥有多少财富。如何能够在保护双方隐私的前提下,计算出谁更富有呢?
以上是图灵奖得主姚期智院士在1982年提出的“百万富翁”问题。这个问题可以抽象成一个密码学问题,就是在不泄露双方数据的前提下,比较出双方数据的大小。这个问题可以进一步延申,即可表述为“一组互不信任的参与方在需要保护隐私信息以及没有可信第三方的前提下进行协同计算的问题”。基于这一问题,发展出了现代密码学非常重要的领域——“安全多方计算”(MPC或SMC,Secure Multiparty Computation)。
隐私计算相关技术
针对“百万富翁”问题,姚期智院士提出了混淆电路(Garbled Circuit)解决方案并引出“多方安全计算”概念。随着安全多方计算问题的提出,投入到安全多方计算研究的学者越来越多。除了混淆电路之外,不经意传输、秘密共享、同态加密等技术也开始被用来解决安全多方计算问题,隐私计算技术也逐步发展了起来。
隐私计算是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算,以有效提取数据要素价值为目标的一类信息技术,保障数据在使用过程中“可用不可见”。
经过学界和产业界多年的研究积累,隐私计算技术发展成一个包含多种技术路线,每种技术路线又有多种技术实现的综合技术体系。
目前,隐私计算的技术路线分为以下三种。
1
安全多方计算
基于密码学的安全多方计算技术,是指在无可信第三方的情况下,多个参与方协同计算一个约定函数,除计算结果以外,各参与方无法通过计算过程中的交互数据推断出其他参与方的原始数据。安全多方计算技术本身可以细分为混淆电路、不经意传输、秘密分享和同态加密等不同技术。
2
联邦学习
联邦学习是一种分布式机器学习技术,其核心思想是通过在多个拥有本地数据的数据源之间进行分布式模型训练,在不需要交换本地个体或样本数据的前提下,仅通过交换模型参数或中间结果的方式,构建基于虚拟融合数据下的全局模型,从而实现数据隐私保护和数据共享计算的平衡,即“数据可用不可见”、“数据不动模型动”的应用新范式。
3
可信执行环境
可信执行环境是一种基于硬件和操作系统的安全架构,通过时分复用CPU或者划分部分内存地址作为安全空间,构建出与外部隔离的安全计算环境,用于部署计算逻辑,处理敏感数据。
隐私计算政策背景和需求驱动
在安全多方计算概念提出的初期,隐私计算还只是作为一种待验证的技术理论。随着计算机技术的不断提高,各种新兴技术如移动互联网、云计算和大数据等得到了快速发展,新的应用场景和模式大量催生,在为社会生活带来便利的同时,大量用户隐私信息被采集和存储。对这些信息的收集、共享、发布、分析与利用等一方面可以更大地发挥数据的价值,另一方面也直接或间接地泄露了用户隐私,给用户带来极大的威胁和困扰。
隐私保护关乎个人、企业乃至国家的利益,近几年,国家相继出台了多项法律法规及政策,用于规范和保护公民的个人信息。
法律法规方面
1
2017年
6月1日,《中华人民共和国网络安全法》正式施行
10月1日,《中华人民共和国民法总则》正式施行
2
2018年
6月27日,公安部发布《网络安全等级保护条例(征求意见稿)》
3
2020年
1月1日,《中华人民共和国密码法》正式施行
4
2021年
1月1日,《中华人民共和国民法典》正式施行
9月1日,《中华人民共和国数据安全法》正式施行
11月1日,《中华人民共和国个人信息保护法》正式施行
5
2023年
7月1日,新版《商用密码管理条例》正式施行
政策方面
1
2020年
2020年4月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,将数据作为与土地、劳动力、资本、技术并列的生产要素,要求“加快培育数据要素市场”。
2
2022年
2022年1月,国务院办公厅《要素市场化配置综合改革试点方案》(二十)建立健全数据流通交易规则:探索“原始数据不出域、数据可用不可见”的交易范式;实现数据使用“可控可计量”。
2022年1月,《“十四五”数字经济发展规划》:初步建立数据要素市场体系,在保护数据安全和用户隐私前提下,参与数据价值开发。
2022年6月,中央深化改革委员会《关于构建数据基础制度更好发挥数据要素作用的意见》:建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制,健全数据要素权益保护制度。
从法律法规层面,更加侧重对个人信息的隐私保护,但是从政策和市场层面,则更加侧重通过“数据流通”来发挥数据的价值。当前大多数的数据保护策略都是从标准和法律出发,这就造成了数据的孤立性,大量的数据形成一个个的“数据孤岛”,而实际需求则是让数据流通起来,充分利用数据产生更大的价值。
为解决以上矛盾,隐私计算应运而生。隐私计算技术是在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一系列信息技术,可保障数据在流通与融合过程中的“可用不可见”。为“打破数据孤岛,实现数据流通”提供了解决思路。
隐私计算应用场景
目前市场上隐私计算应用最广的领域主要有金融、政务和医疗,但是蕴含更大经济价值的潜力领域有待更大规模的实际落地应用。
2021年末,金融领域隐私计算应用开始大量落地,整体来看,应用最成熟的是银行业、保险业,隐私计算在资管行业发展相对较慢。政务领域在2022年开始大量投入使用,短期内主要用于部门协同,数字化项目和大数据平台建设将逐步跟进,经济利益更大的政企合作面临进一步探索。医疗领域的应用相对有些落后,目前已经有明确的场景和产品,但实际落地的应用较少。
1
金融领域
隐私计算在金融领域的应用场景主要包含风控、营销、监管三类场景,金融机构联合业内机构、通信、互联网等其他行业数据资源提升自身风控、营销水平。
解决方案以联合统计、联合查询为主,联合建模及预测等方案均涉及。
2
政务领域
隐私计算在政务领域的应用场景主要分为数据内部共享、数据对外开放、数据运营三类场景,政务场景往往涉及区域内数据集,因此应用效果影响范围大,应用前景广阔。
解决方案以联合查询、监督模型为主,联合统计方案也均有涉及。
3
医疗领域
医疗场景主要包含两个方面:一是通过医疗机构间数据融合,补充患者样本数量,主要涉及临床辅助决策系统、医学研究场景;二是通过对外提供数据服务,提高其风控或营销效果。
解决方案以联合建模及预测为主,联合统计方案也均有涉及。
网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。
加入交流群
请使用微信扫一扫!