专栏名称: 待字闺中
深度分析大数据、深度学习、人工智能等技术,切中实际应用场景,为大家授业解惑。间或,也会介绍国内外相关领域有趣的面试题。
目录
相关文章推荐
OSC开源社区  ·  OWL:Manus通用智能体的完全开源复刻、 ... ·  2 天前  
程序员的那些事  ·  程序员准点下班,主管批评没完成任务就跑了,还 ... ·  2 天前  
OSC开源社区  ·  Linux内核往事 ·  3 天前  
程序猿  ·  雷军提出建议!他本人也曾是“受害者” ·  6 天前  
51好读  ›  专栏  ›  待字闺中

理解数据可用性采样

待字闺中  · 公众号  · 程序员  · 2022-09-07 15:59

正文

数据可用性采样是我最近正在学习的技术,也是目前区块链方向最重要的技术,这个理论和实践都比较难,我将翻译一些资料,同时把自己的心得和大家分享。

本文翻译整理自:

@nickwh8te

https://twitter.com/nickwh8te/status/1560426053830574080


数据可用性采样是区块链扩展的一项重大突破,但许多人难以理解它。
别担心,实际上非常简单,我们可以把它想象成抛硬币。
想想一下,我有两个硬币,A硬币两面都是字,B硬币一面是字,一面是图案。
问题:我给了你两枚硬币中的一枚,你如何知道我给了你哪一枚呢?
简单,你只需要多次的投掷硬币。
如果硬币是A,它总是字朝上。
如果硬币是B,每次抛的时候,只有50%的概率字朝上。
因此,每次你抛硬币的时候,如果字朝上,你就会多出50%的信心认为它是A。
重复这个过程20次,你将有99.9999%的概率相信是A
具体的计算如下:
1-0.5^20=0.9999990463
如果次数更多,概率将会更大。
这就是数据可用性采样的工作原理。或许你有疑问:拿到硬币看一下不就可以了?在实际场景中,看到整个硬币和拿到整个区块的数据是等同的。BTC等区块链也就是这样验证的。也正是这个原因,BTC等的处理能力受到影响。
所以,抽样是为了只获取小部分的数据就可以进行整体的验证。从而提升性能。
继续。
有两种类型的区块:数据可用的区块和数据不可用的区块(只有区块头,或者是有正反面的硬币B)
区块生产者给你一个区块,为了安全,我们需要知道它到底是什么!
如何做呢?通过多次对这个区块进行采样,就类似抛硬币。
对于每一个成功的样本,你对这个区块是可用的信心就增加50%。
重复这个采样的操作,直到我们拥有99.99%的信心认定这个区块是可用的。

为什么这是区块链可扩展性的重大突破?
更大的区块意味着更高的吞吐量,但这也意味着更多的数据需要下载。
如果没有数据可用性采样:






请到「今天看啥」查看全文