当下,互联网、移动互联网技术的发展,每天都产生大量的数据,但这些数据并没有让信息变得更透明化,同时,这些数据造成的个人隐私泄露的情况却不断增多,又给信息共享体系的造成障碍。信息的共享是社会继续向前发展升级的基础,也是未来的必然趋势。如何平衡好隐私保护和信息披露?区块链与零知识证明的结合,将为解决这个问题提供一个很好的思路。
2月16日,中国计算机学会区块链专委委员会、数字资产研究院学术与技术委员、安比实验室创始人郭宇做客零壹直播间,针对“信息透明,隐私保护与零知识证明”进行分享。郭宇指出,目前,区块链与零知识证明的结合是全球范围内的技术前沿,在不久的将来,零知识证明将能与区块链技术密切 “配合”,很好地帮助平衡信息透明与隐私保护。
以下为郭宇分享的核心内容
01
信息披露关涉决策效率
信息披露对现代社会非常重要,特别是每当公共性事件或者灾难性事件发生时,大家更是感同身受。我们会发现这个社会机体的每一环都是紧密相扣,任何一个环节出现问题都会带来想象不到的后果。
生活在现代社会,我们很难下结论,信息化让我们的社会变得更健壮了,还是更脆弱了。现状是,整个社会运转过度依赖了一些关键节点,同时我们会发现这些关键节点对我们而言是黑盒,我们想知道他们是否运转良好?安不安全?我们希望有充分且可靠的信息让我们对未来作出判断。
比如这次疫情,最简单的,我们希望知道到底有多少人生病?口罩还有多少库存?产能如何?供应链如何?很多信息的缺失影响了我们的判断。如果在事情发生之前有足够多的信息量支撑我们进行分析,相信没必要付出这么惨痛的代价。
我们拥有海量数据,但是似乎我们又一无所知。问题的症结在哪里?1、数据的分析链条特别长。从一线收集到最终被统计出来,环节非常多,导致这个过程非常繁琐,很慢;2、数据在加工过程中会逐步失真,因为每个环节都有办法进行被错误加工或者粉饰;3、数据分析维度单一。就拿疾控数据来说,比如每天新增多少确诊病例,这样的数据只能用于画一张简单的图,这是远远不够的,因为单纯的人数只能反映单纯的问题。很多有价值的维度在分析过程中丢失,这会影响决策。4、数据孤岛现象严重。比如医院的诊疗数据,疾控数据、人员流动数据,分布在医院、运营商、公安等不同单位或部门,没有顶层的强力推动,大家很难把数据共享出来,但这样效率很低。
整体来看,我国现在的信息化程度非常高,但各个行业、部门、企业之间的信息并没能实现畅通共享,以至于我们虽然产业环环相扣,但没有继续发展壮大的基础,同时一旦发生意外情况,没有足够的数据支撑你对下一步行动作出决策。
02
信息透明和隐私保护平衡待解
首先,信息透明化非常重要。我们想知道信息,我们想要依据信息来做决策,但另外一方面,这些数据不是谁都能知道。比如这次有武汉务工返乡人员的信息被泄露出来,被人打电话骚扰,苦不堪言;另外有一些被疑似或确诊的案例,公安会调出他们很多很详细的数据,他很多轨迹都被很多人知道了,一旦确诊,信息全部被曝光,这也是会出现一些人宁愿在家耗着也不愿让人发现自己得病。就是说在现在这个社会,我们的隐私权其实受到非常大的潜在威胁。
其次,关于隐私这个问题,是大家一直忽视的一个因素。隐私是信任的一个必要元素,信任有两种,一是公开的信任,一是隐私的信任。公开的信任就是你长期以来都没有做坏事,所有信息都是透明的,都可以公开;另一种就是保守秘密的信任,这也很重要。国外有学者说过,隐私是人类协作的润滑剂,就是说我们要协作的话,一定要保持一定的距离,能保住各自的隐私,这才是协作的前提。也就是说,人类之所以能很好地协作,是因为他们在公开和隐私保护方面能够达到一个很好的平衡。之前大家对这点的没有很好地认识,但这次事件之后,相信对隐私的重要性会有改变。
第三个问题,我们的信息被很好地保护了吗?我们现在很多信息在网上,比如手机里装了很多APP,每个APP都有我的信息,那这些信息被很好保护了吗?关于信息保护,我们有没有可能建立一个很大的数据中心,把数据交给一个值得信任的人来保管,然后需要数据就去那里查询?
建立数据中心是人们第一个会想到的方式,但是建数据中心非常困难,因为数据中心的体量非常大,我们每天都产生非常多的数据,保存哪些,不保存哪些,这在事先是没法知道,这从而导致数据中心成本极高,高到无法用。像征信数据这些量比较小的还行,如果不断积累而且维度非常多的话,久而久之会引发非常多的问题。数据集中会让数据中心成为黑客的目标,因为一旦攻破,会获得巨大的收益和权力。
我认为数据不应该中心化存放,而应该是分布式。数据的价值应该是以共享、流通的价值为指引,没有价值的数据删掉就好,有价值的数据自然会沉淀下来,越有价值的数据越不容易丢失,越有价值的数据越容易被挖掘,这是一个动态的有生命力的大系统。如果我们提供的合法数据能够通过合法合规的渠道让其他人来分析加工,最后用一个经济市场化方式,在监管之下用去中心化的方式来实现共享,是一个切实可行的方法。
03
区块链+零知识证明将打破数据孤岛
如何将各个数据孤岛连接起来?这也是今天要重点讨论的问题。数据孤岛现在问题很严重,大家有数据,但数据没有被很好地保存下来,因为数据要合法合规地变现是非常困难的,相关的技术也正在发展还没完全形成,市场也是在逐步浮现。所以说,企业愿意花多少成本来保护你的数据?事实上,并没有花很多,这也就是为什么存在大量数据泄露的事情。让数据更畅通地流通起来才是更好地保护数据的方法。
那么这些是如何通过区块链技术做到的?区块链技术能帮助实现数据的去中心化存储,能实现数据的保密,并能保证数据不被篡改。
我们关心数据哪些性质呢?1、真实性,即这个数据是否真实的?2、时间性,就是数据产生的时间点,关系到数据是否有用;3、完整性,是完整而非片面的数据;4、可验证性,数据的前三个性质必须可验证的,即可以通过简单并且公开的方式验证数据的真实性、时间性与完整性。其实这些都与区块链技术有关联,但区块链技术缺少了非常关键的一环,即零知识证明。如果我们把区块链技术和零知识证明很好地绑在一起,就可以很好地解决这些问题。
什么是零知识证明?
零知识证明与区块链有非常相似的地方,区块链技术有一个非常了不起的贡献,就是用一种简单有效的办法解决了“拜占庭容错”问题。所谓拜占庭容错,是指一部分计算的参与者可能是坏人,他会捣乱。比如有十台服务器,这十台服务器中有些机器没电或者被炸了,但是系统仍然可以运转良好,那么这就是简单容错。如果这是十台服务器其中一台被黑客控制住,他可以伪装成一个好人过来捣乱,如果这时候系统仍然可以正常运行,无论黑客做什么都影响不了整个系统,那么这就是达到了“拜占庭容错”。需要说一句,实现拜占庭容错非常困难。
现在有人脸识别技术,人脸识别是拜占庭容错吗?目前不是。人脸识别之所以有用是因为它假设每一个使用者都不是黑客,黑客可以通过各种手段骗过或者绕过人脸的认证。那么,银行是拜占庭容错吗?也不一定,因为银行内部一旦有内鬼,也不好讲,银行也可以倒闭可以跑路。我们社会是拜占庭容错吗?是的,我们社会允许有捣乱分子存在,我们可以用各种机制去防范他。我们身体也是。区块链也能做到拜占庭容错,但,零知识证明也可以。它能保证数据即使是黑客也不能篡改,也不能构造假证明。
零知识证明能够证明一个事实而不披露任何信息。那如何做到?比如我想统计十个人里面有多少男女?找一个人来帮忙统计,但他不想让我看到具体的原始数据,就去找一个小黑屋在里面统计,但我又要知道他统计的数据可不可信,那我就在房间里装个摄像头,要监督他每一步都没有算错,不管有意还是无意。比喻一下,零知识证明就像一个全能的摄像头,可以监督任何时间地点发生的任何一个计算过程是真实可靠确实发生的,并生成一段极小的证据,来证明这个计算过程的真实性,同时还不泄露任何细节。
零知识证明+区块链如何解决上述几个问题?1、数据真实性,关键就是用户造假数据问题。比如疫情中,每个门诊都老老实实把原始数据的承诺(或者哈希值)上链,这些数据的维度非常多,如果数据的加工链条长度非常长,那么如果想通过改动一个原始数据来改变最终的统计结果,难度非常大;2、数据的时间性。我们如何证明数据是早于某一天,很简单,我们把数据哈希上链就行,因为在哈希上链这一刻必须有这个数据,所以数据产生的时间不可能早于上链的时间。还有就是如何证明数据不早于这个时间?其实这是中本聪的一个把戏,中本聪在创世区块中写下一段话,是来自泰晤士报的一句话,以此证明,区块链诞生时间不早于这句话产生的时间点。所以只要把区块链区块哈希混入数据,然后再上链,就可以证明数据的产生时刻。3、数据完整性,密码学中有很多对应手段,有加密,承诺,哈希等。数据处理过程中的可信就是用零知识证明。我们对数据进行清洗、排序、统计、复杂分析等操作,因为这个过程是用程序做的,所以理论上可以用零知识证明把每个环节拍下来,过程中没有产生任何的知识泄露,非常可靠。
那么,现在技术到哪一步了?零知识证明理论发展至今三十多年,直到五、六年前,零知识证明还是只有一小众人在研究。区块链出现之后,才出现化学反应,大家才发现可以用零知识证明与区块链结合解决很多问题。零知识证明在2019年井喷式发展。但现在我们主要关注如何可信地进行数据处理和数据披露、存储。零知识证明非常完美地契合数据安全、数据信息和数据隐私保护、可信披露这一系列要求。
零知识证明现在已经慢慢地接近实用,但离实用还有一点距离,因为还有一些理论性问题有待解决。如何将区块链与零知识证明更好地结合在一起,是现在非常前沿的,也是备受瞩目的方向。
04
新技术必然伴随风险,法规考量是关键
最后一个想说的问题是,技术带来新的风险和法律法规问题。一个新的技术的出现,能很快加速某个方面的发展,在飞速发展的同时,安全问题也很关键。包括现在的人脸识别,会带来大量数据隐私泄露风险。技术方面,大量密码学技术对系统安全性要求非常高。如果零知识证明系统有漏洞的话,黑客进来也可以悄无声息地破坏。因为是零知识,黑客捣乱也会零知识。这是一种很难驾驭的超级武器,所以零知识证明必须进行非常严格的数学证明才能落地使用。
另外一个就是法规的考量,这也是冲击会比较大的一个方面。零知识证明会造成一个第三方的缺失。在实操中不需要有第三方,有一个摄像头就行,但如果摄像头有问题怎么办?这在法律上完全是真空的。如果密码学算法出问题,该怎么做?如果没有责任方的话,敢不敢用这个密码学算法,还有数据授权、数据分发等问题。所以前途是光明的,但也非常具有挑战性。
最后,送给大家周雪光教授的一句话:我希望这场危机能成为一个转折点,让中国社会认识到,信息的有效共享,对中国社会安全的重要性。