本讲座选自中科院博士生导师白硕于2018年3月29日在清华大数据
“应用·创新”系列讲座
上所做的题为
《区块链技术与数据隐私》
的演讲。
以下为讲座现场视频,建议使用wifi观看:
演讲全文:
白硕:
非常荣幸回到母校,跟大家分享区块链这样一个非常热的话题。区块链在前面,隐私在后面,但是大家都知道中国人总是喜欢把修饰语放在前面,把中心语放在后面。信息发达到一定程度,中国人才把隐私的概念提到日程上。
但是这些年中国高速发展,很快就进入了要讲隐私的时候。恰好我们遇到了互联网,互联网很快地形成了一个数据寡头垄断数据的格局。没几年,这些大的互联网公司就非常有名,他们掌握的数据资源也非常雄厚。
美国对这件事有一个很有意思的评论:“互联网的pain,区块链的luck。”可翻译成
“中国互联网之痛,区块链之幸。”
1、区域链能做什么?
区块链和密码学的结合,能给我们提供解决隐私问题数据寡头问题的希望。
2、什么是区块链?
区块链是一块一块的数据,一个一个的数据块。将具体的数据打包在一个区块里。
哈希函数的两个特点:
正是因为有这样的特性,区块和区块之间逻辑上就连成了链。
数据之间通过这样一种方式,逻辑上连成了链,这样的链叫做区块链。
3、区块链的本质
区块链的本质,有人说是去中间化,有人说是“躲开了央行,自己选择发行货币”。这些都不对,因为无法从技术层面上理解。
对于数据的诉求,实际上是技术方面的诉求。我们希望记下来的东西是
不可篡改(撤销),不可仿冒,不可抵赖,不可乱序的。
这四个是跟价值没有关系的,而且基础的非对称加密都似曾相似,如RSA、ECC等。但加入了
不可透支和不可双花
,就进入了价值转移、价值传输的领域。而价值是不同于信息的,
价值有守恒性,信息可以不守恒。在价值传递、价值转移的领域里面,诉求可以归结为两点:
另外,还有业务诉求,
一个是隐私保护,一个是可运营性。
一部分人认为不当得利应该不算,但是我们这里有不可撤销,不可篡改的东西都已经存在,他们
解决这个问题只有一个办法——就是分杈,即找到一个大家有共识的历史帐本,然后篡改剔除这笔,继续往前走。
另外一些人有一个口号叫做
代码即法,写出来的法,你知我知,你认我认,你信我信。
如果这样的话,代码写错了也得将错就错,甚至说我不承认写错了,黑客得就是应该他得。理念的不同导致整个帐本分裂了还不止,社区也跟着分裂了。
4、数据共享的痛点
普通老百姓的隐私被侵犯的情况很多,一些机构也有很多的数据。在进行合作的时候,顾虑最大的就是数据。
特别强调:
在数据主权边界的附近会出现竞合两种关系,所谓的合就是大家有共享的需求,所谓的竞就是大家都要防范对方去偷自己的,不当使用或者滥用自己的数据。这是一个很大的痛点,这个痛点如果不好好的解决,信息化社会的弊就会大于利。
5、数据主权
-
抗衡数据寡头的联盟制。
加盟的机构,甚至个人,他们彼此之间一样有防范。区块链本身的深化应用也在呼唤隐私和数据主权保护的落地。
-
既要见证又不看穿。
只要我们技术再执着一点,即刻思维再执着一点,就会发现这个诉求不是不可能达到的。
-
点对点、背靠背的数据合作。
更多的是用在征信、评级等领域。我的数据是什么东西,我不告诉你;你想要什么,你不告诉我。我要的那个东西你看不懂,我给你的东西我也看不懂,但是那两个可以自动的匹配,如果匹配了,我没看见你的数据,你也没看见我的真实需求,这种叫点对点、背靠背的数据合作。
-
跟人工智能的结合。
这一波之所以火,主要归功于深度学习。深度学习做的事情是要数据喂它,它才能产生智能。喂它的数据可能来自四面八方,可能来自不同的机构,汇聚到一处,经过学习训练产生智能。
6、加密数字货币场景
现在有加密数字货币,如素数币、比特币、莱特币。人们想让数字货币既能够记帐,又不透露帐本的真实内容。首先民间有这个需求,有些账户到底转给谁了,留下来的记录就是查不出来。比如央行想推出法定的数字货币,张三给李四转账了,转账了多少钱,不能让旁边的王五看见,也不能做成像比特币那个样子,它的帐目不能是公开的,要保证隐私。欧盟体系,包括英国也有同样的看法。有这个看法的话,一定要引入隐私保护机制。
7、从错误印象谈起
有两种观点:
-
区块链是公开透明的,但只是对账目而言。
-
区块链是匿名的,但只是对地址而言。
所以,不能把隐私问题的希望寄托在现在的区块链技术体系上,需要有新东西。
8、账户问题
-
一个地址的身份同一性无法掩盖。
-
不同地址之间的关联交易无法掩盖。
-
不同地址之间的趋同交易无法掩盖。
9、账目问题
10、有效支付见证
11、交易后业务处理场景(假设)
按照目前的法律,中国结算的是最终的数据,是有法律效力的。交易所、证券公司也在记这些数据,但是如果遇到不一致的话,以中国结算的为准。如果这三方能够把账记在区块链上,在区块链上直接达成共识,到最后就是一笔账,非常清楚。但是,存在两点问题。
12、供应链溯源场景
很多供应链都涉及到溯源的问题,比如农产品、食品、药品。最初的源头沿着供应链,经过签字,一步步走下来,但是公开透明的话,有可能出现一种诉求,即上下游合作方不希望被透露。
13、穿透式采购供应链融资场景
穿透式的采购供应链融资场景,是一个龙头企业,拥有大量的采购。比如一个汽车公司,它可能有零配件、一级供应商、二级供应商。如果割断这些连接,光看这样一个小公司,它的财力不足,贷款就欠缺依据。但是如果通过穿透来看,它是来自龙头企业、有稳定的现金流的公司,就可以给它增信,使得它的信誉一下子得到它的背书。
在有区块链之前,通常增信只能做到一级,而不能多级穿透。有了区块链就可以多级穿透。在你资金不到位的时候,你可以拿着白条给你生产,但是白条最终会兑换出来资金。有了龙头企业的增信,银行就可以接受去做这个事情。上下游合作方同样有个诉求——白条分拆明细不希望被透露。
14、倒金字塔迷局
倒金字塔之谜,即少数公司能够得到散户的投资,而多数公司连专业公司都不会投资。没加入龙头企业的小公司,偿还能力比较稳定,但是有了龙头企业就可以把它们拎起来,利用金融领域里边熟知的一些方式来做。
15、数据交易
“裸”数据交易的痛点:
-
扩散。
卖出去的数据就像泼出去的水,收不回来。
-
泄密。
不是什么数据都可以卖,数据是有些区别的。
-
权属。
有些数据是谁的说不清。
-
孤岛。
数据窝在手里增值有限。
16、换个思路卖服务
目前大数据交易普遍存在的思路,就是
我们不卖数据,而卖依托数据产生的服务。
即把数据X、Y分装在私欲里面,卖的是函数,就是所谓的使用数据的服务。
17、数据API使用权交易
数据使用权是可以交易的,使用了一笔就卖一笔。但数据使用权自身存在问题,比如无法算清服务被使用了多少次。
加上区块链就可以变得更好。首先保持不卖数据卖服务的思路,然后计算服务被使用了多少次。明算帐,忠实记录,在线支付。
加上大数据交易,我们不交易数据本身,交易数据使用权。
18、数据融合
数据在封闭空间里面是原始数据,在开放空间里是经过了变形的,是函数处理过的数据。那么,在增值空间里,这两个函数就产生了所谓的数据融合的威力。
19、背靠背求交集场景
-
竞争的基础条件:
不能给对方看到全集
-
双赢的基础前提:
要能同对方共享交集
20、做法
一,不靠谱的做法:
引入第三方。
二,没面子的做法:
砸硬盘。
三,高明的办法:
互相加扰。