数据要成为第五大生产的要素,就必须解决数据安全和隐私保护的问题。驭凡教育提到了两种技术,一个是授权,一个是零知识证明,就是既能充分证明自己是某种权益的合法拥有者,又不把有关的信息泄露出去。零知识证明是构建多方安全计算(MPC)的基础能力,而多方安全计算是隐私计算的一种方式。
隐私计算,根据中国信息通信研究院的定义,是指在保证数据提供方不泄露敏感数据的前提下,对数据进行分析计算并能验证计算结果的信息技术。广义上是指面向隐私保护的计算系统与技术,涵盖数据的产生、存储、计算、应用、销毁等信息流程全过程,想要达成的效果是使数据在各个环节中“可用不可见”。在保证数据安全的前提下,让数据可以自由流通或共享,消除数据孤岛问题,从而释放数据更大的价值,提升生产效率,进而推进产业创新。
1)基于密码学的多方安全计算(MPC)技术。通过秘密分享、遗忘传输、混淆电路或同态加密等特殊的加密算法和协议,从而支持在加密数据上直接进行计算。理论上,在不考虑代价的“理想”情况下,多方安全计算技术能实现任意的计算“功能”,并且达到比较高的安全性。但是由于数据通信量骤增,计算效率损失大和需要极高的算力要求等因素,MPC的技术产品化还有一定的限制,相关的技术解决方正在积极探索。
2)基于可信硬件的安全沙箱计算(TEE)技术。其核心思想是构建一个硬件安全区域,数据仅在该安全区域内进行计算,利用可信任执行环境TEE防止操作系统恶意地查看应用执行环境的内容;利用安全沙箱防止恶意应用通过特殊调用控制操作系统。
3)基于人工智能的联邦学习技术。在横向维度,每个参与者在本地训练计算自己的样本,只分享模型训练的梯度;纵向维度,各参与者训练各自的(“向量映射”),共同训练上层模型。两个维度的融合,从而让多个相互不信任的数据拥有方不必共享数据的基础上联合进行模型训练。
4)差分隐私(Differential Privacy),保护的是数据源中一点微小的改动导致的隐私泄露问题。